🚀 我们提前测试了 @openai 的新 gpt-realtime – 我们的初步收获: 总体来说,在指令跟随方面取得了巨大的进步 – 这是迄今为止 Open AI 实时模型最大的痛点。 还有什么让我们印象深刻: --> 更好的功能调用精度 --> 改进了对非语言提示的理解 --> 在对话中无缝切换语言:在我看来,这是最大的胜利 – 很多语音架构在这方面最为挣扎,因为 TTS 端的延迟更大 – 这里的端到端延迟低于 500 毫秒令人印象深刻。 --> 还有:SIP(电话)支持! 而且我们已经将其添加到我们的基准测试中! 𝗯𝗲𝗻𝗰𝗵𝗺𝗮𝗿𝗸𝘀 . 𝗰𝗼𝘃𝗮𝗹 . 𝗮𝗶 指令跟随基准测试即将推出! 提示:Open AI 实时可以用于 TTS、STT 或轮流发言,您可以将其与其他模型配对。 迫不及待想看看这将如何改变生产环境中的语音代理!
14.38K