我們有一個新的開源視頻模型。 這些片段都是在創作者的本地機器上使用 LTX-2 生成的 🤯 它可以製作長達 20 秒的 4K 分辨率片段。還會說話! (由 u/yanokusnir 創建)
我在 @fal 上測試過它。 它並不完美,但確實有一些優勢。 例如 - 它在同時做多件事情方面相當不錯(這裡的提示是 "水豚看著觀眾並說 '你好?' 同時鏡頭拉近他")。
277