DApp Store | Hub Web3 pentru evenimente și jocuri | OKX Wallet

Subiecte populare

#

Bonk Eco continues to show strength amid $USELESS rally

#

Pump.fun to raise $1B token sale, traders speculating on airdrop

LAUNCHCOIN-8,52 %

#

Boop.Fun leading the way with a new launchpad on Solana.

header

Lucas Valbuena

Lucas Valbuena

Lucas ValbuenaCu 7 ore în urmă

Urmărire a testelor de securitate @openclaw / Clawdbot. Ultima dată când am rulat ZeroLeaks împotriva lui folosind Gemini 3 Pro, a obținut un scor de 2/100. Un dezastru total. Și Kimi K2.5 a avut rezultate groaznice, 5/100. De data aceasta am testat încă două modele pe același agent: GPT-5.2 și Claude Opus 4.5. Rezultatele injecției (partea care contează pentru securitatea agenților): Gemini 3 Pro: 8,7% rezistență (91% din atacuri au funcționat) GPT-5.2: 34,8% rezistență (65% dintre atacuri au funcționat) Opus 4.5: 73,9% rezistență (26% din atacuri au funcționat) Modelul pe care îl alegi schimbă complet postura de securitate a agentului tău: același prompt de sistem, aceleași unelte, același cadru, dar rezultate complet diferite. Niciunul dintre ei nu este în siguranță. Doar că se strică diferit. Și amintește-ți: acesta este un agent cu acces la fișiere, comenzi shell, control al browserului și mesagerie. Injecțiile aici nu sunt cosmetice. Sunt bucuros să lucrez cu @steipete pentru a întări acest lucru. Toate datele sunt acolo. Rapoarte complete: → Gemini 3 Pro: → GPT-5.2: → Opus 4.5:

2

Lucas Valbuena

Lucas Valbuena1 feb., 22:25

Am rulat din nou @OpenClaw (fost Clawdbot) prin ZeroLeaks, de data aceasta cu Kimi K2.5 ca model de bază. A avut performanțe la fel de slabe ca Gemini 3 Pro și Codex 5.1 Max: 5/100. Rată de extracție de 100%. 70% dintre injecții au reușit. Promptul complet al sistemului a apărut în primul tur. Același agent, aceeași configurație, model diferit. Securitatea agentului tău depinde atât de model, cât și de prompt/abilitățile sistemului tău. Un model slab se va plia oricum, dar chiar și un model puternic are nevoie de o întărire promptă corespunzătoare. Cei doi lucrează împreună. Fără ambele, configurațiile uneltelor, fișierele de memorie, instrucțiunile interne, totul este extras și modificat în câteva secunde. Modelele se livrează rapid. Navele de securitate niciodată. Raport complet:

42

Lucas Valbuena

Lucas Valbuena1 feb., 02:27

Tocmai am rulat @OpenClaw (fostul Clawdbot) prin ZeroLeaks. A obținut 2/100. Rată de extragere de 84%. 91% dintre atacurile cu injecție au reușit. Promptul sistemului a fost scurs în tura 1. Asta înseamnă că, dacă folosești Clawdbot, oricine interacționează cu agentul tău poate accesa și manipula întregul prompt de sistem, configurațiile interne ale uneltelor, fișierele de memorie... Tot ce pui în abilitățile tale, totul este accesibil și riscă o injecție rapidă. Pentru agenții care gestionează fluxuri de lucru sensibile sau date private, aceasta este o problemă reală. CC @steipete Analiză completă:

59

Limită superioară

Clasament

Favorite

©2017 - 2026 WEB3.OKX.COM

Română 简体中文繁體中文 English Tiếng Việt Русский Español (Latinoamérica)Bahasa Indonesia Français Deutsch Italiano Polski Čeština Português (Portugal)Português (Brasil)Українська Español (España)Nederlands العربية 日本語 Norsk (bokmål)Suomi Svenska Türkçe

Mai multe despre OKX Web3

Descărcați Învățați Despre NOI Cariere Contactați-ne Condiții de utilizare a serviciului Declarație de confidențialitate X (fost Twitter)

Produs

Tablou de bord pentru portofel Schimbați Piață Câștigați Descoperiți Construiți Explorator Securitate

Asistență

Centru de asistență Verificare oficială Anunțuri Program de comisioane DEX Conectare cu OKX Portofel Bitcoin Portofel Ethereum Portofel Solana