phần điên rồ là Opus 4.1 không suy nghĩ gần như tốt như GPT-5-cao, đôi khi còn tốt hơn ở một số khía cạnh, ngoại trừ việc nó bắt đầu trả lời ngay lập tức thay vì suy nghĩ trong một phút. Tôi không hiểu Anthropic đã làm thế nào để tạo ra phiên bản không lý luận thông minh như vậy.
lmarena.ai
lmarena.ai00:57 12 thg 8
🚨 Leaderboard Update: Claude Opus 4.1 climbs to #2 overall on the Arena and now becomes the best non-thinking model, matching GPT-5 at #1 across key categories: - Coding - Instruction Following - Hard Prompts - Longer Queries Congrats to @AnthropicAI on this impressive milestone!
138,38K