Microsoft только что выпустила VibeVoice - 1.5B SoTA модель текст в речь - лицензия MIT 🔥 > Она может генерировать до 90 минут аудио > Поддерживает одновременную генерацию более 4-х голосов > В ближайшее время будет доступна потоковая передача и большая модель 7B > Способна на кросс-языковую и певческую синтезу Мне нравится выразительность и контроль эмоций в модели! Молодцы, Microsoft 🤗
124,77K