O colapso do modo na RL pode vir do treinamento centralizado que limita a exploração Embora a diversidade real tenda a emergir naturalmente na IA distribuída e de código aberto, onde os modelos evoluem de forma semi-independente e ocasionalmente sincronizam Um salve para @samsja19 por compartilhar esta peça