la parte folle è che Opus 4.1 non pensante è quasi buono quanto GPT-5-alto, a volte migliore in alcuni aspetti, tranne che inizia a rispondere istantaneamente piuttosto che pensare per un minuto intero. Non capisco come Anthropic sia riuscita a rendere la versione non ragionante così intelligente.
lmarena.ai
lmarena.ai12 ago, 00:57
🚨 Aggiornamento della Classifica: Claude Opus 4.1 sale al #2 complessivo nell'Arena e ora diventa il miglior modello non pensante, eguagliando GPT-5 al #1 in categorie chiave: - Codifica - Seguire le Istruzioni - Prompts Difficili - Query Lunghe Congratulazioni a @AnthropicAI per questo traguardo impressionante!
138,32K