DApp Store | Web3 Hub tapahtumille ja peleille

Trendaavat aiheet

Seuranta @openclaw / Clawdbotin tietoturvatesteistä. Viimeksi kun ajoin ZeroLeaksia Gemini 3 Prolla, se sai 2/100. Täysi katastrofi. Kimi K2.5 suoriutui myös surkeasti, 5/100. Tällä kertaa testasin kahta muuta mallia samalla aineella: GPT-5.2 ja Claude Opus 4.5. Injektiotulokset (osa, jolla on merkitystä agentin turvallisuuden kannalta): Gemini 3 Pro: 8,7 % vastustuskyky (91 % hyökkäyksistä onnistui) GPT-5.2: 34,8 % vastustuskyky (65 % hyökkäyksistä toimi) Opus 4.5: 73,9 % vastustuskyky (26 % hyökkäyksistä onnistui) Valitsemasi malli muuttaa täysin agentin turvallisuustilanteen: sama järjestelmäkehote, samat työkalut, sama kehys, mutta tulokset ovat täysin erilaiset. Yksikään niistä ei ole turvallinen. Ne vain hajoavat eri tavalla. Ja muista: tämä on agentti, jolla on tiedostokäyttö, shell-komentoja, selaimen ohjausta ja viestintää. Pistokset täällä eivät ole kosmeettisia. Olen iloinen voidessani tehdä yhteistyötä @steipete kanssa tämän kovettamiseksi. Kaikki tiedot ovat siellä. Täydelliset raportit: → Gemini 3 Pro: → GPT-5.2: → Opus 4.5:

Johtavat

Rankkaus

Suosikit