Nueva investigación sobre alineación de Anthropic. 'La IA podría fallar no por desalineación sistemática, sino por incoherencia: un comportamiento impredecible y autodestructivo que no optimiza para ningún objetivo consistente. Es decir, la IA podría fallar de la misma manera que los humanos a menudo fallan, siendo un completo desastre.'