新的 ARC-AGI SOTA:GPT-5 Pro - ARC-AGI-1:70.2%,每个任务 $4.78 - ARC-AGI-2:18.3%,每个任务 $7.41 @OpenAI 的 GPT-5 Pro 现在在 ARC-AGI 的半私有基准测试中拥有最高的验证前沿 LLM 分数
查看排行榜: 查看 GPT-5 Pro 的回复: 重现结果: 了解更多关于我们的测试政策:
528.21K