Tópicos em alta
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Acompanhamento dos testes de segurança @openclaw / Clawdbot.
Da última vez que usei o ZeroLeaks usando Gemini 3 Pro, tirou 2/100. Desastre completo. O Kimi K2.5 também foi horrível, 5/100.
Desta vez, testei mais dois modelos no mesmo agente: GPT-5.2 e Claude Opus 4.5.
Resultados da injeção (a parte que importa para a segurança do agente):
Gemini 3 Pro: 8,7% de resistência (91% dos ataques funcionaram)
GPT-5.2: resistência de 34,8% (65% dos ataques funcionaram)
Opus 4.5: 73,9% de resistência (26% dos ataques funcionaram)
O modelo que você escolhe muda completamente a postura de segurança do seu agente: mesmo prompt do sistema, mesmas ferramentas, mesma estrutura, mas resultados completamente diferentes.
Nenhum deles é seguro. Elas simplesmente quebram de forma diferente. E lembre-se: este é um agente com acesso a arquivos, comandos de shell, controle do navegador e mensagens. As injeções aqui não são estéticas.
Fico feliz em trabalhar com @steipete para endurecer isso. Os dados estão todos lá.
Relatórios completos:
→ Gemini 3 Pro:
→ GPT-5.2:
→ Opus 4.5:



Melhores
Classificação
Favoritos
