Populární témata
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Sledujte bezpečnostní testy @openclaw / Clawdbot.
Když jsem naposledy spouštěl ZeroLeaks s Gemini 3 Pro, dostal jsem skóre 2/100. Úplná katastrofa. Kimi K2.5 byla také hrozná, 5/100.
Tentokrát jsem na stejném agentu otestoval ještě dva modely: GPT-5.2 a Claude Opus 4.5.
Výsledky injekce (ta část, která je důležitá pro bezpečnost agenta):
Gemini 3 Pro: 8,7 % odolnosti (91 % útoků fungovalo)
GPT-5.2: 34,8 % odolnosti (65 % útoků fungovalo)
Opus 4.5: 73,9 % odolnosti (26 % útoků fungovalo)
Model, který zvolíte, zcela změní bezpečnostní postoj vašeho agenta: stejný systémový prompt, stejné nástroje, stejný framework, ale naprosto odlišné výsledky.
Žádná z nich není v bezpečí. Prostě se lámou jinak. A pamatujte: je to agent s přístupem k souborům, shell příkazy, ovládáním prohlížeče a zasíláním zpráv. Injekce zde nejsou kosmetické záležitosti.
Rád s @steipete spolupracuji na zpevnění toho. Data jsou tam všude.
Plné zprávy:
→ Gemini 3 Pro:
→ GPT-5.2:
→ Opus 4.5:



Top
Hodnocení
Oblíbené
