Durante mucho tiempo me he preguntado si podemos hacer que un robot humanoide haga un wallflip, ¡y lo hicimos realidad aprovechando OmniRetarget con el seguimiento de BeyondMimic! Esto se produjo después de nuestros experimentos originales de OmniRetarget, con solo pequeños ajustes en el entrenamiento de RL: relajar un umbral de terminación y eliminar un término de recompensa. La política logró una tasa de éxito de 5/5 en nuestros experimentos del mundo real, lo que muestra la fuerza de la reorientación de movimiento de alta calidad que preserva la interacción combinada con el seguimiento mínimo de RL de BeyondMimic. Aquí está el arXiv actualizado: (En la Sec. V. A)