Представляємо Voxtral Transcribe 2 — моделі нового покоління мовлення в текст від @MistralAI. Сучасна транскрипція, діаризація динаміка, затримка в реальному часі менше 200 мс. Деталі в 🧵
Voxtral Realtime створений для голосових агентів і живих додатків. Її нативна стрімінгова архітектура забезпечує затримку, налаштовувану до менше 200 мс. І при 480мс він залишається в межах 1-2% WER від нашої офлайн-моделі. Ми випускаємо модель як відкриті ваги в Apache 2.0.
Почніть експериментувати з Voxtral Mini Transcribe 2 у новому аудіомайданчику Mistral Studio. Завантажуйте файли, перемикайте діаризацію, додайте контекстну упередженість і отримуйте миттєві транскрипції.
Доступно вже зараз. Mini Transcribe 2 через API за $0.003/хв. Реальний час через API за $0.006/хв, плюс відкриті ваги. Починайте →
67