Trendaavat aiheet
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Seuranta @openclaw / Clawdbotin tietoturvatesteistä.
Viimeksi kun ajoin ZeroLeaksia Gemini 3 Prolla, se sai 2/100. Täysi katastrofi. Kimi K2.5 suoriutui myös surkeasti, 5/100.
Tällä kertaa testasin kahta muuta mallia samalla aineella: GPT-5.2 ja Claude Opus 4.5.
Injektiotulokset (osa, jolla on merkitystä agentin turvallisuuden kannalta):
Gemini 3 Pro: 8,7 % vastustuskyky (91 % hyökkäyksistä onnistui)
GPT-5.2: 34,8 % vastustuskyky (65 % hyökkäyksistä toimi)
Opus 4.5: 73,9 % vastustuskyky (26 % hyökkäyksistä onnistui)
Valitsemasi malli muuttaa täysin agentin turvallisuustilanteen: sama järjestelmäkehote, samat työkalut, sama kehys, mutta tulokset ovat täysin erilaiset.
Yksikään niistä ei ole turvallinen. Ne vain hajoavat eri tavalla. Ja muista: tämä on agentti, jolla on tiedostokäyttö, shell-komentoja, selaimen ohjausta ja viestintää. Pistokset täällä eivät ole kosmeettisia.
Olen iloinen voidessani tehdä yhteistyötä @steipete kanssa tämän kovettamiseksi. Kaikki tiedot ovat siellä.
Täydelliset raportit:
→ Gemini 3 Pro:
→ GPT-5.2:
→ Opus 4.5:



Johtavat
Rankkaus
Suosikit
