我们有一个新的开源视频模型。 这些片段都是在创作者的本地机器上使用 LTX-2 生成的 🤯 它可以制作最长 20 秒的 4K 分辨率片段。并且它会说话! (由 u/yanokusnir 创建)
我一直在@fal上测试它。 它并不完美,但确实有一些优点。 例如——它在同时处理多件事情方面相当不错(这里的提示是“水豚看着观众说‘怎么了?’同时镜头拉近他)。
277