ARC-AGI está redefiniendo cómo medir el progreso en el camino hacia la AGI, centrándose en el razonamiento, la generalización y la adaptabilidad en lugar de la memorización o la escala. En NeurIPS 2025, @sdianahu de YC se sentó con el presidente de @arcprize, @GregKamradt, para descubrir por qué la mayoría de los benchmarks de IA fallan, cómo ARC-AGI revela los límites de los modelos actuales y por qué medir la inteligencia puede ser más difícil que construirla. 00:11 — Qué es el ARC Prize y por qué existe 00:38 — La definición de AGI de François Chollet 01:48 — Qué prueba realmente ARC-AGI 02:25 — Cuándo los LLMs fallaron en el benchmark de ARC 03:38 — ARC-AGI se convierte en el estándar 04:49 — Falsos positivos en el progreso de la IA 06:06 — La evolución de ARC-AGI 08:55 — Medir la inteligencia más allá de la precisión 10:25 — Qué sucede si un modelo resuelve ARC-AGI?