Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Tongyi Lab Alibaba Group juga merilis dua model sumber terbuka bersama dengan Fun-Audio-Chat dari keluarga model suara Tongyi Fun untuk melengkapi tumpukan AI suara:
Fun-ASR (0.8B) - Pengenalan ucapan multibahasa yang kuat dan kuat
Fun-CosyVoice 3 (0.5B TTS) - Text-to-speech ekspresif dengan kloning suara zero-shot
Fun-ASR menangani lingkungan bising di dunia nyata sambil menghadirkan transkripsi real-time yang akurat di berbagai bahasa.
Mari kita uraikan👇 mereka
#TongyiFun
1/5
2/5 - Detail Fun-ASR:
Versi sumber terbuka 0,8B dari Fun-ASR dibuat untuk kondisi dunia nyata dengan penanganan kebisingan yang kuat dan dukungan multibahasa.
*(Catatan: Versi sumber tertutup yang lebih besar juga tersedia sebagai penerapan arus utama)*
Fitur utama:
- Menangani lingkungan yang bising (kafe, jalan, kantor)
- Dukungan berbagai bahasa
- Transkripsi waktu nyata
- Akurasi tinggi pada beragam aksen
Kasus penggunaan:
- Transkripsi rapat
- Pusat panggilan multibahasa
- Subtitle waktu nyata
- Sistem perintah suara
3/5 - Suara Menyenangkan-Nyaman 3:
Model TTS sumber terbuka 0,5B menghadirkan pembuatan text-to-speech yang lebih cepat dan lebih ekspresif.
(Catatan: Versi sumber tertutup yang lebih besar juga tersedia sebagai penyebaran arus utama)
Fitur utama:
- Kloning suara tanpa tembakan dari sampel audio pendek
- Pembuatan suara lintas bahasa
- Berbagai gaya berbicara dan emosi
- Prosodi dan intonasi alami
Kasus penggunaan:
- Narasi buku audio
- Pembuatan sulih suara
- Pelokalan konten
- Sintesis suara karakter
63
Teratas
Peringkat
Favorit
