Bytedance ha appena rilasciato la traduzione vocale in tempo reale 3 volte più velocemente di prima, con solo un ritardo di ~3 secondi! Seed LiveInterp 2 è un modello di sintesi vocale full duplex con una correttezza del >70%. Quando si tratta di videochiamate, si apriranno connessioni precedentemente impossibili.
Fonte: Post:
122,5K