新的Anthropic研究:錯位如何隨著模型智能和任務複雜性而擴大? 當先進的AI失敗時,它會因追求錯誤的目標而失敗嗎?還是會以不可預測和不連貫的方式失敗——就像一場「熱亂」? 閱讀更多: