Microsoft vient de lancer VibeVoice - modèle de synthèse vocale SoTA 1,5B - sous licence MIT 🔥 > Il peut générer jusqu'à 90 minutes d'audio > Prend en charge la génération simultanée de plus de 4 locuteurs > Modèle de streaming et plus grand modèle de 7B à venir > Capable de synthèse croisée et de chant J'adore l'expressivité et le contrôle des émotions sur le modèle ! Bravo à Microsoft 🤗
123,27K