Новое исследование стипендиатов Anthropic: Как несоответствие масштабируется с интеллектом модели и сложностью задачи? Когда продвинутый ИИ терпит неудачу, будет ли это связано с тем, что он преследует неправильные цели? Или он потерпит неудачу непредсказуемо и бессвязно — как "горячая каша"? Читать далее: