تم الإعلان عن GPT-5 على أنه يقلل من الهلوسة ويبدو أنه يقدم. 99.5 -> 99.9 هو أخطاء أقل بنسبة 80٪. لا أعرف لماذا لا يصنع الناس صفقة أكبر من هذا. الهلوسة هي واحدة من أكبر مشاكل LLMs واعتقد البعض أنها غير قابلة للحل.
OpenRouter
OpenRouter‏15 أغسطس، 00:29
After one week, GPT-5 has topped our proprietary model charts for tool calling accuracy🥇 In second is Claude 4.1 Opus, at 99.5% Details 👇
‏‎135.5‏K