كما أصدرت مختبر تونغي من مجموعة علي بابا نموذجين مفتوحي المصدر بالإضافة إلى دردشة صوتية ممتعة من عائلة نماذج الصوت Tongyi Fun لاستكمال حزمة الذكاء الاصطناعي الصوتي: Fun-ASR (0.8B) - تعرف على الكلام متعدد اللغات قوي للضوضاء Fun-CosyVoice 3 (0.5B TTS) - تحويل النص إلى كلام عبر النص مع استنساخ صوتي بدون طلقة تتعامل Fun-ASR مع البيئات الصاخبة في العالم الحقيقي مع تقديم نسخ دقيق في الوقت الحقيقي عبر عدة لغات. دعونا نحللها👇 #TongyiFun 1/5
2/5 - تفاصيل Fun-ASR: تم بناء نسخة مفتوحة المصدر 0.8B من Fun-ASR لتناسب ظروف العالم الحقيقي مع تعامل قوي مع الضوضاء ودعم متعدد اللغات. *(ملاحظة: تتوفر أيضا نسخ مغلقة المصدر أكبر كنشر رئيسي)* الميزات الرئيسية: - يتعامل مع البيئات الصاخبة (المقاهي، الشوارع، المكاتب) - دعم اللغات المتعددة - النسخ في الوقت الحقيقي - دقة عالية في الأنماط المتنوعة حالات الاستخدام: - نص الاجتماعات - مراكز اتصال متعددة اللغات - ترجمة في الوقت الحقيقي - أنظمة الأوامر الصوتية
3/5 - صوت مرح-دافئ 3: يوفر نموذج TTS مفتوح المصدر 0.5B توليد نص إلى كلام أسرع وأكثر تعبيرا. (ملاحظة: تتوفر أيضا نسخ مغلقة المصدر أكبر كعملية نشر رئيسية) الميزات الرئيسية: - استنساخ صوتي بدون طلقة من عينات صوتية قصيرة - توليد الصوت عبر اللغات - أنماط وعواطف متعددة في الكلام - النبرة الطبيعية والنغمة حالات الاستخدام: - سرد صوتي - توليد التعليق الصوتي - توطين المحتوى - توليف أصوات الشخصية
‏‎65‏