🚨 排行榜更新: Claude Opus 4.1 爬升至 Arena 總排名第 #2,現在成為最佳非思考模型,與 GPT-5 在關鍵類別中並列第 #1: - 編碼 - 指令跟隨 - 難題 - 較長查詢 恭喜 @AnthropicAI 達成這一令人印象深刻的里程碑!
Anthropic
Anthropic8月6日 00:27
今天我們推出了 Claude Opus 4.1,這是對 Claude Opus 4 在代理任務、現實世界編碼和推理方面的升級。
Claude Opus 4.1 的思考版本目前正在 Arena 測試中。結果即將公布。 在以下網址測試 Claude Opus 4.1 及所有其他最佳 AI 模型:
287.87K