Microsoft heeft zojuist VibeVoice uitgebracht - 1,5B SoTA tekst-naar-spraakmodel - MIT-licentie 🔥 > Het kan tot 90 minuten audio genereren > Ondersteunt gelijktijdige generatie van > 4 sprekers > Streaming en groter 7B-model in aantocht > In staat tot cross-linguale en zangsynthetisatie Hou van de expressiviteit en de emotiecontrole van het model! Petje af voor Microsoft 🤗
124,77K