коллапс режима в RL может возникать из-за централизованного обучения, ограничивающего исследование в то время как настоящая разнообразие, как правило, возникает естественным образом в распределенном и открытом AI, где модели эволюционируют полузависимо и время от времени синхронизируются привет @samsja19 за то, что поделился этой статьей