Investigación de New Anthropic Fellows: ¿Cómo escala la desalineación con la inteligencia del modelo y la complejidad de las tareas? Cuando la IA avanzada fracasa, ¿lo hará persiguiendo objetivos equivocados? ¿O fracasará de forma impredecible e incoherente—como un "desastre total"? Leer más: