sự sụp đổ chế độ trong rl có thể đến từ việc đào tạo tập trung hạn chế sự khám phá trong khi sự đa dạng thực sự thường xuất hiện một cách tự nhiên trong ai phân tán và mã nguồn mở, nơi các mô hình tiến hóa bán độc lập và thỉnh thoảng đồng bộ cảm ơn @samsja19 đã chia sẻ bài viết này