Suivi des tests de sécurité de @openclaw / Clawdbot. La dernière fois, j'ai exécuté ZeroLeaks contre lui en utilisant Gemini 3 Pro, il a obtenu un score de 2/100. Complète catastrophe. Kimi K2.5 a également fait horrible, 5/100. Cette fois, j'ai testé deux autres modèles sur le même agent : GPT-5.2 et Claude Opus 4.5. Résultats d'injection (la partie qui compte pour la sécurité de l'agent) : Gemini 3 Pro : 8,7 % de résistance (91 % des attaques ont fonctionné) GPT-5.2 : 34,8 % de résistance (65 % des attaques ont fonctionné) Opus 4.5 : 73,9 % de résistance (26 % des attaques ont fonctionné) Le modèle que vous choisissez change complètement la posture de sécurité de votre agent : même invite système, mêmes outils, même cadre, mais des résultats très différents. Aucun d'eux n'est sûr. Ils se cassent juste différemment. Et rappelez-vous : c'est un agent avec accès aux fichiers, commandes shell, contrôle du navigateur et messagerie. Les injections ici ne sont pas cosmétiques. Heureux de travailler avec @steipete sur le renforcement de cela. Les données sont toutes là. Rapports complets : → Gemini 3 Pro : → GPT-5.2 : → Opus 4.5 :