新的 ARC-AGI SOTA: GPT-5 Pro - ARC-AGI-1: 70.2%, 每個任務 $4.78 - ARC-AGI-2: 18.3%, 每個任務 $7.41 @OpenAI 的 GPT-5 Pro 現在在 ARC-AGI 的半私有基準上擁有最高的驗證前沿 LLM 分數
查看排行榜: 查看 GPT-5 Pro 的回應: 重現結果: 了解更多有關我們的測試政策:
528.21K