🚀 Nous avons testé en avant-première le nouveau gpt-realtime d'@openai – voici nos premières impressions : Dans l'ensemble, un grand pas en avant en termes de suivi des instructions - le plus gros point de douleur des modèles Open AI en temps réel jusqu'à présent. Ce qui nous frappe également : --> Meilleure précision dans l'appel de fonctions --> Compréhension améliorée avec détection des indices non verbaux --> Changement de langue sans couture en pleine conversation : à mon avis, c'est la plus grande victoire – beaucoup d'architectures vocales ont du mal avec cela à cause d'une plus grande latence du côté TTS – la latence de bout en bout inférieure à 500 ms est impressionnante ici. --> ET : support SIP (téléphonie) ! ET nous l'avons ajouté à nos benchmarks ! 𝗯𝗲𝗻𝗰𝗵𝗺𝗮𝗿𝗸𝘀 . 𝗰𝗼𝘃𝗮𝗹 . 𝗮𝗶 Des benchmarks de suivi des instructions arrivent bientôt ! Astuce : Open AI realtime peut être utilisé pour TTS, STT ou prise de parole, et vous pouvez l'associer à d'autres modèles. J'ai hâte de voir comment cela transformera les agents vocaux dans les environnements de production !
14,39K