O ARC-AGI está a redefinir a forma como medir o progresso no caminho para a AGI - focando no raciocínio, generalização e adaptabilidade em vez de memorização ou escala. Na NeurIPS 2025, a @sdianahu da YC sentou-se com o Presidente da @arcprize, @GregKamradt, para descobrir por que a maioria dos benchmarks de IA falha, como o ARC-AGI revela os limites dos modelos atuais e por que medir a inteligência pode ser mais difícil do que construí-la. 00:11 — O que é o Prémio ARC e por que existe 00:38 — A definição de AGI de François Chollet 01:48 — O que o ARC-AGI realmente testa 02:25 — Quando os LLMs falharam no benchmark ARC 03:38 — O ARC-AGI torna-se o padrão 04:49 — Falsos positivos no progresso da IA 06:06 — A evolução do ARC-AGI 08:55 — Medindo a inteligência para além da precisão 10:25 — O que acontece se um modelo resolver o ARC-AGI?