Дослідження New Anthropic Fellows: Як невідповідність масштабується разом із інтелектом моделі та складністю завдань? Коли просунутий ШІ зазнає невдачі, чи зробить він це, переслідуючи неправильні цілі? Чи це зазнає невдачі непередбачувано і незрозуміло — як «гарячий безлад»? Читати далі: