O ARC-AGI está redefinindo como medir o progresso no caminho para a AGI – focando em raciocínio, generalização e adaptabilidade em vez de memorização ou escala. No NeurIPS 2025, o @sdianahu da YC conversou com @arcprize presidente @GregKamradt para descobrir por que a maioria dos benchmarks de IA falha, como o ARC-AGI revela os limites dos modelos atuais e por que medir inteligência pode ser mais difícil do que construí-la. 00:11 — O que é o Prêmio ARC e por que ele existe 00:38 — Definição de AGI de François Chollet 01:48 — O que o ARC-AGI realmente testa 02:25 — Quando os LLMs falharam no Benchmark ARC 03:38 — ARC-AGI se torna o padrão 04:49 — Falsos Positivos no Progresso da IA 06:06 — A Evolução do ARC-AGI 08:55 — Medindo a Inteligência além da precisão 10:25 — O que acontece se um modelo resolver o ARC-AGI?