熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
新的 ARC-AGI SOTA: GPT-5 Pro
- ARC-AGI-1: 70.2%, 每個任務 $4.78
- ARC-AGI-2: 18.3%, 每個任務 $7.41
@OpenAI 的 GPT-5 Pro 現在在 ARC-AGI 的半私有基準上擁有最高的驗證前沿 LLM 分數


查看排行榜:
查看 GPT-5 Pro 的回應:
重現結果:
了解更多有關我們的測試政策:
528.21K
熱門
排行
收藏