Microsoft baru saja merilis VibeVoice - 1.5B SoTA Text to Speech model - Berlisensi 🔥 MIT > Dapat menghasilkan audio hingga 90 menit > Mendukung pembuatan speaker > 4 secara simultan > Streaming dan model 7B yang lebih besar akan datang > Mampu melakukan sintesis lintas bahasa dan nyanyian Suka ekspresi dan kontrol emosi pada model! Pujian untuk Microsoft 🤗
123,27K