DApp Store | Hub da Web3 para eventos e jogos

Tópicos em alta

Acompanhamento dos testes de segurança @openclaw / Clawdbot. Da última vez que usei o ZeroLeaks usando Gemini 3 Pro, tirou 2/100. Desastre completo. O Kimi K2.5 também foi horrível, 5/100. Desta vez, testei mais dois modelos no mesmo agente: GPT-5.2 e Claude Opus 4.5. Resultados da injeção (a parte que importa para a segurança do agente): Gemini 3 Pro: 8,7% de resistência (91% dos ataques funcionaram) GPT-5.2: resistência de 34,8% (65% dos ataques funcionaram) Opus 4.5: 73,9% de resistência (26% dos ataques funcionaram) O modelo que você escolhe muda completamente a postura de segurança do seu agente: mesmo prompt do sistema, mesmas ferramentas, mesma estrutura, mas resultados completamente diferentes. Nenhum deles é seguro. Elas simplesmente quebram de forma diferente. E lembre-se: este é um agente com acesso a arquivos, comandos de shell, controle do navegador e mensagens. As injeções aqui não são estéticas. Fico feliz em trabalhar com @steipete para endurecer isso. Os dados estão todos lá. Relatórios completos: → Gemini 3 Pro: → GPT-5.2: → Opus 4.5:

Melhores

Classificação

Favoritos