Çoğu kamu ses veri seti İngilizce, stüdyo sesi ve parlamış kayıt koşulları üzerine aşırı indeks yapar. Bu önyargı aşağıda da kendini gösteriyor: STT ve TTS sistemleri, gerçek dünya ortamlarında küresel kullanıcılar için düşük performans gösteriyor. Bu, model probleminden çok veri sorunu.