Useimmat julkiset ääniaineistot yliindeksoivat englannin, studioäänen ja hiotut tallennusolosuhteet. Tämä harha näkyy myöhemmin: STT- ja TTS-järjestelmät heikentyvät globaaleilla käyttäjillä todellisissa ympäristöissä. Tämä on enemmän dataongelma kuin malliongelma.