إذا أردنا نماذج تعمل في العالم الحقيقي، نحتاج إلى بيانات واقعية. اليوم، نشر فريق @psdnai تحليلا تقنيا عميقا حول مجموعة بيانات Poseidon Voice الذكاء الاصطناعي. 33 ألف + ساعة. 3 أسابيع. صوت من العالم الحقيقي. لغات منخفضة الموارد. تم الموافقة على الحقوق على Story ↴
Poseidon
Poseidon‏29 يناير، 01:30
نقدم مجموعة بيانات بوسيدون الذكاء الاصطناعي الصوتي. 33 كيلوبايت+ ساعة صوتية معتمدة على الحقوق عبر لغات منخفضة الموارد. في عدة لغات، يتجاوز هذا سنوات جمع البيانات العامة. فيما يلي، نظرة تقنية متعمقة على البيانات ↓
تعطي بوسيدون الأولوية للبيانات عالية الجودة، وليس فقط الحجم. يتم تصفية مقاطع الصوت باستخدام مؤشر بوسيدون كورت، وهو معيار للدقة الدلالية. تم التحقق منه من قبل المتحدثين الأصليين. مصفى لظروف العالم الحقيقي. لم يعد مصطلح منخفض المصادر يعني جودة منخفضة.
‏‎7.6‏K