Tongyi Lab Alibaba Group juga merilis dua model sumber terbuka bersama dengan Fun-Audio-Chat dari keluarga model suara Tongyi Fun untuk melengkapi tumpukan AI suara: Fun-ASR (0.8B) - Pengenalan ucapan multibahasa yang kuat dan kuat Fun-CosyVoice 3 (0.5B TTS) - Text-to-speech ekspresif dengan kloning suara zero-shot Fun-ASR menangani lingkungan bising di dunia nyata sambil menghadirkan transkripsi real-time yang akurat di berbagai bahasa. Mari kita uraikan👇 mereka #TongyiFun 1/5
2/5 - Detail Fun-ASR: Versi sumber terbuka 0,8B dari Fun-ASR dibuat untuk kondisi dunia nyata dengan penanganan kebisingan yang kuat dan dukungan multibahasa. *(Catatan: Versi sumber tertutup yang lebih besar juga tersedia sebagai penerapan arus utama)* Fitur utama: - Menangani lingkungan yang bising (kafe, jalan, kantor) - Dukungan berbagai bahasa - Transkripsi waktu nyata - Akurasi tinggi pada beragam aksen Kasus penggunaan: - Transkripsi rapat - Pusat panggilan multibahasa - Subtitle waktu nyata - Sistem perintah suara
3/5 - Suara Menyenangkan-Nyaman 3: Model TTS sumber terbuka 0,5B menghadirkan pembuatan text-to-speech yang lebih cepat dan lebih ekspresif. (Catatan: Versi sumber tertutup yang lebih besar juga tersedia sebagai penyebaran arus utama) Fitur utama: - Kloning suara tanpa tembakan dari sampel audio pendek - Pembuatan suara lintas bahasa - Berbagai gaya berbicara dan emosi - Prosodi dan intonasi alami Kasus penggunaan: - Narasi buku audio - Pembuatan sulih suara - Pelokalan konten - Sintesis suara karakter
63