la collapse de mode dans l'apprentissage par renforcement peut provenir d'un entraînement centralisé limitant l'exploration tandis que la véritable diversité tend à émerger naturellement dans l'IA distribuée et open source où les modèles évoluent semi-indépendamment et se synchronisent occasionnellement un grand merci à @samsja19 pour avoir partagé cet article