El colapso del modo en RL puede provenir de un entrenamiento centralizado que limita la exploración Mientras que la diversidad real tiende a emerger de forma natural en la IA distribuida y de código abierto, donde los modelos evolucionan de forma semiindependiente y ocasionalmente se sincronizan Un saludo a @samsja19 por compartir esta pieza