la partie folle, c'est qu'Opus 4.1 sans réflexion est presque aussi bon que GPT-5-high, parfois meilleur sur certains aspects, sauf qu'il commence à répondre instantanément plutôt que de réfléchir pendant une minute entière. Je ne comprends pas comment Anthropic a réussi à rendre la version sans raisonnement si intelligente.
lmarena.ai
lmarena.ai12 août, 00:57
🚨 Leaderboard Update: Claude Opus 4.1 climbs to #2 overall on the Arena and now becomes the best non-thinking model, matching GPT-5 at #1 across key categories: - Coding - Instruction Following - Hard Prompts - Longer Queries Congrats to @AnthropicAI on this impressive milestone!
138,37K