介紹 Voxtral Transcribe 2,@MistralAI 的下一代語音轉文字模型。 最先進的轉錄、說話者區分、低於 200 毫秒的實時延遲。 詳情請見 🧵
Voxtral Realtime 是為語音代理和即時應用程式而建的。其原生串流架構提供可配置至低於 200 毫秒的延遲。在 480 毫秒時,它的錯誤率(WER)保持在我們離線模型的 1-2% 之內。我們將該模型作為開放權重在 Apache 2.0 下發布。
開始在 Mistral Studio 的新音頻遊樂場中實驗 Voxtral Mini Transcribe 2。上傳文件,切換說話者識別,添加上下文偏見,並獲得即時轉錄。
現在可用。Mini Transcribe 2 通過 API 價格為 $0.003/分鐘。實時通過 API 價格為 $0.006/分鐘,另加開放權重。 開始使用 →
31