Finalmente encontré un buen caso de uso para los subagentes. Haciendo que los modelos de políticas sean más inteligentes al construir automáticamente entornos de RL a partir de datos de tareas del mundo real. Santo cielo, ¡realmente funciona!