Vi introducerar Voxtral Transcribe 2, nästa generations tal-till-text-modeller av @MistralAI. Toppmodern transkription, högtalardiarisering, under 200 ms realtidsfördröjning. Detaljer i 🧵
Voxtral Realtime är byggd för röstagenter och liveapplikationer. Dess inbyggda streamingarkitektur levererar latens som kan konfigureras till under 200 ms. Och vid 480 ms håller den sig inom 1–2 % WER från vår offline-modell. Vi släpper modellen som öppna vikter under Apache 2.0.
Börja experimentera med Voxtral Mini Transcribe 2 i den nya ljudlekplatsen på Mistral Studio. Ladda upp filer, slå på diarisering, lägg till kontextbias och få omedelbara transkriptioner.
Tillgänglig nu. Mini Transcribe 2 via API till 0,003 dollar/min. Realtime via API till 0,006 dollar/min, plus öppna vikter. Kom igång →
66