šílené na tom je, že Opus 4.1 non-thinking je téměř stejně dobrý jako GPT-5-high, někdy v některých aspektech lepší, až na to, že začne odpovídat okamžitě, místo aby přemýšlel celou minutu. Nechápu, jak se Anthropicu podařilo udělat nerozumnou verzi tak chytrou
lmarena.ai
lmarena.ai12. 8. 00:57
🚨 Aktualizace žebříčku: Claude Opus 4.1 se v Aréně vyšplhá na celkové #2 a nyní se stává nejlepším nemyslícím modelem, který se vyrovná GPT-5 na #1 napříč klíčovými kategoriemi: -Kódování - Následování pokynů - Tvrdé výzvy - Delší dotazy Gratulujeme k @AnthropicAI k tomuto působivému milníku!
138,32K