ARC-AGI redefiniuje sposób mierzenia postępów na drodze do AGI - koncentrując się na rozumowaniu, generalizacji i adaptacyjności zamiast na zapamiętywaniu czy skali. Na NeurIPS 2025, @sdianahu z YC usiadł z prezydentem @arcprize @GregKamradt, aby dowiedzieć się, dlaczego większość benchmarków AI zawodzi, jak ARC-AGI ujawnia ograniczenia dzisiejszych modeli i dlaczego mierzenie inteligencji może być trudniejsze niż jej budowanie. 00:11 — Czym jest ARC Prize i dlaczego istnieje 00:38 — Definicja AGI według François Cholleta 01:48 — Co właściwie testuje ARC-AGI 02:25 — Kiedy LLM-y zawiodły w benchmarku ARC 03:38 — ARC-AGI staje się standardem 04:49 — Fałszywe pozytywy w postępie AI 06:06 — Ewolucja ARC-AGI 08:55 — Mierzenie inteligencji poza samą dokładnością 10:25 — Co się stanie, jeśli model rozwiąże ARC-AGI?