✨Ми раді відкритому коду Tencent HY-Motion 1.0 — моделі текст-руху з мільярдними параметрами, побудованої на архітектурі Diffusion Transformer (DiT) та узгодженні потоків. Tencent HY-Motion 1.0 надає можливості як розробникам, так і окремим творцям, перетворюючи природну мову на високоякісну, плавну та різноманітну 3D-анімацію персонажів, забезпечуючи виняткові можливості виконання інструкцій у широкому спектрі категорій. Згенеровані 3D-анімаційні ресурси можна безшовно інтегрувати у типові 3D-анімаційні конвеєри. 🎮🎥 Основні моменти: 🔹Billion-Scale DiT: Успішно масштабував узгодження потоку DiT до параметрів 1B+, що встановило нову межу для можливості виконання інструкцій та якості генерації руху. 🔹Стратегія повного етапу навчання: Перша в галузі модель генерації руху, що включає повний цикл попереднього навчання → SFT → RL для оптимізації фізичної правдоподібності та семантичної точності. 🔹Комплексне охоплення категорій: включає 200+ категорій руху у 6 основних категоріях — найповніші в галузі, відібрані через ретельний конвеєр даних. 🌐Сторінка проєкту: 🔗Github: 🤗Обіймаючи обличчя: 📄Технічний звіт: