Pesquisa do New Anthropic Fellows: Como o desalinhamento escala com a inteligência do modelo e a complexidade das tarefas? Quando a IA avançada falhar, ela fará isso perseguindo os objetivos errados? Ou vai falhar de forma imprevisível e incoerente — como uma "bagunça total?" Leia mais: