Bytedance vient de laisser tomber la traduction vocale en temps réel 3 fois plus vite qu’auparavant, avec seulement un décalage de ~3s ! Seed LiveInterp 2 est un modèle de synthèse vocale en duplex intégral avec une précision de >70 %. Lorsqu’il s’agit d’appels vidéo, cela ouvrira des connexions auparavant impossibles.
Source: Post:
122,5K