Vă prezentăm Voxtral Transcribe 2, modele de next-gen speech-to-text de la @MistralAI. Transcriere de ultimă generație, diarizare pentru difuzoare, latență sub 200ms în timp real. Detalii în 🧵
Voxtral Realtime este construit pentru agenți vocali și aplicații live. Arhitectura sa de streaming nativ oferă o latență configurabilă sub 200ms. Iar la 480ms, rămâne în limită de 1-2% WER față de modelul nostru offline. Lansăm modelul ca greutăți deschise sub Apache 2.0.
Începe să experimentezi cu Voxtral Mini Transcribe 2 în noul canal audio de pe Mistral Studio. Încărcați fișiere, comutați diarizarea, adăugați bias de context și obțineți transcrieri instantanee.
Disponibil acum. Mini Transcrie 2 prin API la prețul de 0,003$/min. Timp real prin API la 0,006$/min, plus greutăți deschise. Începe →
40