我一直在想,我們是否能讓一個類人機器人做 𝘄𝗮𝗹𝗹𝗳𝗹𝗶𝗽 - 而我們剛剛通過利用 𝗢𝗺𝗻𝗶𝗥𝗲𝘁𝗮𝗿𝗴𝗲𝘁 與 BeyondMimic 追蹤實現了這一點! 這是在我們最初的 OmniRetarget 實驗之後,僅對 RL 訓練進行了小幅調整:放寬終止閾值並移除一個獎勵項。 該策略在我們的現實世界實驗中達到了 𝟱/𝟱 的成功率,顯示出高品質、保持互動的運動重定向與 BeyondMimic 的最小 RL 追蹤相結合的強大效果。 這是更新的 arXiv: (在第 V.A 節)