Microsoft właśnie wydał VibeVoice - model Text to Speech SoTA 1.5B - licencjonowany na MIT 🔥 > Może generować do 90 minut audio > Obsługuje jednoczesną generację > 4 mówców > Wkrótce dostępny streaming i większy model 7B > Zdolny do syntezy międzyjęzykowej i śpiewu Uwielbiam ekspresyjność i kontrolę emocji w tym modelu! Brawo dla Microsoftu 🤗
123,28K