ARC-AGI está redefiniendo cómo medir el progreso en el camino hacia la AGI, centrándose en el razonamiento, la generalización y la adaptabilidad en lugar de la memorización o la escala. En NeurIPS 2025, el @sdianahu de YC se sentó con @arcprize presidente @GregKamradt para descubrir por qué la mayoría de los benchmarks de IA fallan, cómo ARC-AGI revela los límites de los modelos actuales y por qué medir la inteligencia puede ser más difícil que construirla. 00:11 — Qué es el Premio ARC y por qué existe 00:38 — Definición de AGI según François Chollet 01:48 — Qué prueba realmente ARC-AGI 02:25 — Cuando los LLMs fallaron en el benchmark ARC 03:38 — ARC-AGI se convierte en el estándar 04:49 — Falsos positivos en el progreso de la IA 06:06 — La evolución de ARC-AGI 08:55 — Midiendo la inteligencia más allá de la precisión 10:25 — ¿Qué ocurre si un modelo resuelve ARC-AGI?