AI 懐疑論者の最も賢いデバイスは、スコア上限ベンチマークです パフォーマンスは、0〜100%のスコアのテストで常に対数的に感じられます しかし、天井のないベンチマークを見ると、まったく異なる曲線が見られます...
そういえば、私はAidanbenchを実行する必要があります
1.99K