Представляем Voxtral Transcribe 2, модели распознавания речи следующего поколения от @MistralAI. Современная транскрипция, диаризация спикеров, задержка менее 200 мс в реальном времени. Подробности в 🧵
Voxtral Realtime создан для голосовых агентов и живых приложений. Его нативная потоковая архитектура обеспечивает задержку, настраиваемую до менее 200 мс. А при 480 мс она остается в пределах 1-2% WER от нашей оффлайн модели. Мы выпускаем модель в виде открытых весов под лицензией Apache 2.0.
Начните экспериментировать с Voxtral Mini Transcribe 2 в новой аудио-площадке на Mistral Studio. Загружайте файлы, переключайте диаризацию, добавляйте контекстный уклон и получайте мгновенные транскрипции.
Доступно сейчас. Mini Transcribe 2 через API по $0.003/мин. В реальном времени через API по $0.006/мин, плюс открытые веса. Начать →
32