🚀 @openaiの新しいgpt-realtimeを早い段階でテストしました。 全体として、命令に従うという点で大きな飛躍が見られ、これまでの Open AI リアルタイム モデルの最大の問題点です。 他に私たちにとって際立っていること: --> 関数呼び出し精度の向上 --> 非言語的合図検出による理解力の向上 --> 会話中のシームレスな言語切り替え: IMO 最大の勝利 – 多くの音声アーキテクチャが TTS 側のレイテンシーが大きいことに苦労しています – ここでは 500 ミリ秒未満のエンドツーエンドのレイテンシーが印象的です。 ●> AND:SIP(テレフォニー)対応! そして、それをベンチマークに追加しました!ベンチマーク。コバル。人工知能 ベンチマークに続く指示は近日公開予定です! ヒント: Open AI リアルタイムは、TTS、STT、またはターンテイクに使用でき、他のモデルとペアリングできます。 これが本番環境の音声エージェントをどのように変革するかを見るのが待ちきれません。
14.39K