GPT-5 被宣傳為減少幻覺,而且它似乎做到了。99.5 -> 99.9 的錯誤減少了 80%。 我不知道為什麼人們不把這件事做得更大。幻覺是法學碩士最大的問題之一,有些人認為它們無法解決。
OpenRouter
OpenRouter8月15日 00:29
經過一週,GPT-5 在我們專有模型的工具調用準確率排行榜上名列第一🥇 第二名是 Claude 4.1 Opus,準確率為 99.5% 詳情 👇
135.5K