Bytedance vừa bỏ dịch giọng nói thời gian thực nhanh hơn 3 lần so với trước đây, chỉ với độ trễ ~ 3 giây! Seed LiveInterp 2 là một mô hình chuyển giọng nói thành giọng nói song công hoàn toàn với độ chính xác >70%. Khi điều này được thực hiện trong các cuộc gọi video, nó sẽ mở ra các kết nối trước đây không thể.
Nguồn: Bài đăng:
122,51K