szalona część polega na tym, że Opus 4.1 bez myślenia jest prawie tak dobry jak GPT-5-high, czasami lepszy w niektórych aspektach, z wyjątkiem tego, że zaczyna odpowiadać natychmiast, zamiast myśleć przez pełną minutę. Nie rozumiem, jak Anthropic udało się uczynić wersję bez rozumowania tak inteligentną.
lmarena.ai
lmarena.ai12 sie, 00:57
🚨 Leaderboard Update: Claude Opus 4.1 climbs to #2 overall on the Arena and now becomes the best non-thinking model, matching GPT-5 at #1 across key categories: - Coding - Instruction Following - Hard Prompts - Longer Queries Congrats to @AnthropicAI on this impressive milestone!
138,37K