Chúng tôi có một mô hình video mã nguồn mở mới. Những đoạn clip này đều được tạo ra bằng LTX-2 trên máy tính cục bộ của người sáng tạo 🤯 Nó có thể tạo ra các đoạn clip dài tới 20 giây với độ phân giải 4K. Và nó có thể nói! (được tạo bởi u/yanokusnir)
Tôi đã thử nghiệm nó trên @fal. Nó không hoàn hảo, nhưng có một số điểm mạnh rõ ràng. Ví dụ - nó khá tốt trong việc thực hiện nhiều việc cùng một lúc (lời nhắc ở đây là "capybara nhìn vào người xem và nói 'Có chuyện gì vậy?' trong khi camera zoom vào anh ta).
248