我一直在想,我们能否让一个类人机器人做一个𝘄𝗮𝗹𝗹𝗳𝗹𝗶𝗽——我们刚刚通过利用𝗢𝗺𝗻𝗶𝗥𝗲𝘁𝗮𝗿𝗴𝗲𝘁与BeyondMimic跟踪实现了这一点! 这是在我们最初的OmniRetarget实验之后,仅对RL训练进行了小幅调整:放宽终止阈值并移除一个奖励项。 该策略在我们的现实世界实验中达到了𝟱/𝟱的成功率,显示出高质量、保持交互的运动重定向与BeyondMimic的最小RL跟踪相结合的强大效果。 这是更新后的arXiv:(在第V.A节)