疯狂的部分是,Opus 4.1 的非思考模式几乎和 GPT-5 高级版一样好,有时在某些方面甚至更好,只是它开始回答时是瞬间反应,而不是思考整整一分钟。我不明白 Anthropic 是怎么让非推理版本变得如此聪明的。
lmarena.ai
lmarena.ai8月12日 00:57
🚨 排行榜更新: Claude Opus 4.1 在竞技场中攀升至第2名,现已成为最佳非思考模型,在关键类别中与第1名的GPT-5并驾齐驱: - 编码 - 指令跟随 - 难题 - 较长查询 恭喜 @AnthropicAI 达成这一令人印象深刻的里程碑!
138.14K