ARC-AGIは、暗記やスケールではなく、推論、一般化、適応力に焦点を当てて、AGIへの進捗を測る方法を再定義しています。 NeurIPS 2025で、YCの@sdianahuは社長@GregKamradt@arcprize氏にインタビューし、なぜ多くのAIベンチマークが失敗するのか、ARC-AGIが今日のモデルの限界をどのように明らかにするのか、そして知能の測定がなぜそれを構築するよりも難しいのかを探りました。 00:11 — ARC賞とは何か、そしてなぜ存在するのか 00:38 — フランソワ・ショレによるAGIの定義 01:48 — ARC-AGIが実際にテストするもの 02:25 — 大型言語モデルがARCベンチマークに失敗した時 03:38 — ARC-AGIが標準となる 04:49 — AIの進展における誤検知 06:06 — ARC-AGIの進化 08:55 — 単なる正確さを超えた知能の測定 10:25 — モデルがARC-AGIを解いたらどうなるのか?