Microsoft hat gerade VibeVoice veröffentlicht - 1,5 Milliarden SoTA Text-to-Speech-Modell - MIT-Lizenz 🔥 > Es kann bis zu 90 Minuten Audio generieren > Unterstützt die gleichzeitige Generierung von mehr als 4 Sprechern > Streaming und größeres 7B-Modell in Arbeit > Fähig zur sprachübergreifenden und Gesangssynthese Ich liebe die Ausdruckskraft und die emotionale Kontrolle des Modells! Kudos an Microsoft 🤗
123,27K