Subiecte populare
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Lucas Valbuena
Urmărire a testelor de securitate @openclaw / Clawdbot.
Ultima dată când am rulat ZeroLeaks împotriva lui folosind Gemini 3 Pro, a obținut un scor de 2/100. Un dezastru total. Și Kimi K2.5 a avut rezultate groaznice, 5/100.
De data aceasta am testat încă două modele pe același agent: GPT-5.2 și Claude Opus 4.5.
Rezultatele injecției (partea care contează pentru securitatea agenților):
Gemini 3 Pro: 8,7% rezistență (91% din atacuri au funcționat)
GPT-5.2: 34,8% rezistență (65% dintre atacuri au funcționat)
Opus 4.5: 73,9% rezistență (26% din atacuri au funcționat)
Modelul pe care îl alegi schimbă complet postura de securitate a agentului tău: același prompt de sistem, aceleași unelte, același cadru, dar rezultate complet diferite.
Niciunul dintre ei nu este în siguranță. Doar că se strică diferit. Și amintește-ți: acesta este un agent cu acces la fișiere, comenzi shell, control al browserului și mesagerie. Injecțiile aici nu sunt cosmetice.
Sunt bucuros să lucrez cu @steipete pentru a întări acest lucru. Toate datele sunt acolo.
Rapoarte complete:
→ Gemini 3 Pro:
→ GPT-5.2:
→ Opus 4.5:



2
Am rulat din nou @OpenClaw (fost Clawdbot) prin ZeroLeaks, de data aceasta cu Kimi K2.5 ca model de bază.
A avut performanțe la fel de slabe ca Gemini 3 Pro și Codex 5.1 Max: 5/100. Rată de extracție de 100%. 70% dintre injecții au reușit. Promptul complet al sistemului a apărut în primul tur.
Același agent, aceeași configurație, model diferit. Securitatea agentului tău depinde atât de model, cât și de prompt/abilitățile sistemului tău. Un model slab se va plia oricum, dar chiar și un model puternic are nevoie de o întărire promptă corespunzătoare. Cei doi lucrează împreună. Fără ambele, configurațiile uneltelor, fișierele de memorie, instrucțiunile interne, totul este extras și modificat în câteva secunde.
Modelele se livrează rapid. Navele de securitate niciodată.
Raport complet:

42
Tocmai am rulat @OpenClaw (fostul Clawdbot) prin ZeroLeaks.
A obținut 2/100. Rată de extragere de 84%. 91% dintre atacurile cu injecție au reușit. Promptul sistemului a fost scurs în tura 1.
Asta înseamnă că, dacă folosești Clawdbot, oricine interacționează cu agentul tău poate accesa și manipula întregul prompt de sistem, configurațiile interne ale uneltelor, fișierele de memorie... Tot ce pui în abilitățile tale, totul este accesibil și riscă o injecție rapidă.
Pentru agenții care gestionează fluxuri de lucru sensibile sau date private, aceasta este o problemă reală.
CC @steipete
Analiză completă:

59
Limită superioară
Clasament
Favorite
