ARC-AGI mendefinisikan ulang bagaimana mengukur kemajuan di jalur menuju AGI - dengan fokus pada penalaran, generalisasi, dan kemampuan beradaptasi alih-alih menghafal atau skala. Di NeurIPS 2025, @sdianahu YC duduk bersama @arcprize Presiden @GregKamradt untuk mencari tahu mengapa sebagian besar tolok ukur AI gagal, bagaimana ARC-AGI mengungkapkan batasan model saat ini, dan mengapa mengukur kecerdasan mungkin lebih sulit daripada membangunnya. 00:11 — Apa itu Hadiah ARC dan mengapa itu ada 00:38 — Definisi AGI François Chollet 01:48 — Apa yang Sebenarnya Diuji ARC-AGI 02:25 — Ketika LLM Gagal Tolok Ukur ARC 03:38 — ARC-AGI Menjadi Standar 04:49 — Positif Palsu dalam Kemajuan AI 06:06 — Evolusi ARC-AGI 08:55 — Mengukur Kecerdasan di luar sekadar akurasi 10:25 — Apa yang terjadi jika model memecahkan ARC-AGI?