ARC-AGI definiert neu, wie Fortschritt auf dem Weg zu AGI gemessen wird - mit Fokus auf Denken, Verallgemeinerung und Anpassungsfähigkeit anstelle von Memorierung oder Skalierung. Auf der NeurIPS 2025 setzte sich YCs @sdianahu mit @arcprize Präsident @GregKamradt zusammen, um herauszufinden, warum die meisten KI-Benchmarks scheitern, wie ARC-AGI die Grenzen der heutigen Modelle aufzeigt und warum es schwieriger sein könnte, Intelligenz zu messen, als sie zu entwickeln. 00:11 — Was der ARC Prize ist und warum er existiert 00:38 — François Chollets Definition von AGI 01:48 — Was ARC-AGI tatsächlich testet 02:25 — Wann LLMs den ARC-Benchmark nicht bestanden haben 03:38 — ARC-AGI wird zum Standard 04:49 — Falsch-positive Ergebnisse im KI-Fortschritt 06:06 — Die Evolution von ARC-AGI 08:55 — Intelligenz über nur Genauigkeit hinaus messen 10:25 — Was passiert, wenn ein Modell ARC-AGI löst?