Nếu chúng ta muốn các mô hình hoạt động trong thế giới thực, chúng cần dữ liệu từ thế giới thực. Hôm nay, đội ngũ @psdnai đã công bố một bài phân tích kỹ thuật sâu về tập dữ liệu Poseidon Voice AI. Hơn 33k giờ. 3 tuần. Âm thanh từ thế giới thực. Ngôn ngữ ít tài nguyên. Đã được cấp quyền trên Story ↴
Poseidon
Poseidon01:30 29 thg 1
Giới thiệu Bộ Dữ liệu AI Giọng nói Poseidon. Hơn 33K giờ âm thanh đã được cấp quyền trong các ngôn ngữ ít tài nguyên. Trong một số ngôn ngữ, điều này vượt qua nhiều năm thu thập dữ liệu công khai. Dưới đây là một cái nhìn sâu về mặt kỹ thuật về dữ liệu ↓
Poseidon ưu tiên dữ liệu chất lượng cao, không chỉ là khối lượng. Các đoạn âm thanh được lọc bằng Điểm Poseidon, một tiêu chuẩn cho độ chính xác ngữ nghĩa. Được xác thực bởi người bản ngữ. Được lọc cho các điều kiện thực tế. Tài nguyên thấp không còn có nghĩa là chất lượng thấp.
6,84K