ARC-AGI redefinuje, jak měřit pokrok na cestě k AGI – zaměřuje se na uvažování, generalizaci a přizpůsobivost místo memorování nebo škálování. Na NeurIPS 2025 si @sdianahu YC sedl s prezidentem @arcprize @GregKamradt, aby zjistil, proč většina AI benchmarků selhává, jak ARC-AGI odhaluje limity dnešních modelů a proč může být měření inteligence obtížnější než její budování. 00:11 — Co je ARC Prize a proč existuje 00:38 — Definice AGI podle Françoise Cholleta 01:48 — Co ARC-AGI skutečně testuje 02:25 — Když LLM neuspěly v ARC benchmarku 03:38 — ARC-AGI se stává standardem 04:49 — Falešně pozitivní výsledky v pokroku AI 06:06 — Vývoj ARC-AGI 08:55 — Měření inteligence přesahující jen přesnost 10:25 — Co se stane, když model vyřeší ARC-AGI?