Microsoft vừa phát hành VibeVoice - mô hình Text to Speech SoTA 1.5B - Giấy phép MIT 🔥 > Nó có thể tạo ra tới 90 phút âm thanh > Hỗ trợ tạo đồng thời > 4 người nói > Mô hình 7B lớn hơn và phát trực tuyến sắp ra mắt > Có khả năng tổng hợp đa ngôn ngữ và hát Yêu thích sự biểu cảm và khả năng kiểm soát cảm xúc trên mô hình! Kudos cho Microsoft 🤗
124,76K