谁能掌握实时语音,谁就能赢得AI的接口层。 不是屏幕。不是聊天气泡。 在这个领域做得很好的初创公司之一是@Cartesia(披露:我是一名该公司的独立投资者)。 他们的Sonic-3低延迟模型已经能够实时地笑、表情和切换语言。
我指的是 @cartesia_ai。对此我感到抱歉。 #idea: X/twitter 应该足够智能,提醒我 "我认为你可能想要 X(而不是 Y)。"
50.57K