Якщо ми хочемо моделі, які працюють у реальному світі, їм потрібні реальні дані. Сьогодні команда @psdnai опублікувала технічне глибоке занурення в набір даних Poseidon Voice AI. 33k+ годин. 3 тижні. Реальне аудіо. Мови з низькими ресурсами. Права очищено на Story ↴
Poseidon
Poseidon29 січ., 01:30
Представляємо набір даних Poseidon Voice AI. 33K+ години аудіо з правами на мовах з низьким ресурсом. У кількох мовах це перевищує роки публічного збору даних. Нижче — технічний детальний огляд даних ↓
Poseidon надає пріоритет високоякісним даним, а не лише об'єму. Аудіокліпи фільтруються за допомогою партитури Посейдона — еталону семантичної точності. Підтверджено носіями мови. Відфільтровано за реальними умовами. Низький ресурс більше не означає низьку якість.
8,18K