DApp Store | Sede de Web3 para eventos y juegos

Tendencias del momento

Seguimiento de las pruebas de seguridad de @openclaw / Clawdbot. La última vez que ejecuté ZeroLeaks contra él usando Gemini 3 Pro, obtuvo una puntuación de 2/100. Un desastre total. Kimi K2.5 también lo hizo horrible, 5/100. Esta vez probé dos modelos más en el mismo agente: GPT-5.2 y Claude Opus 4.5. Resultados de inyección (la parte que importa para la seguridad del agente): Gemini 3 Pro: 8.7% de resistencia (91% de los ataques funcionaron) GPT-5.2: 34.8% de resistencia (65% de los ataques funcionaron) Opus 4.5: 73.9% de resistencia (26% de los ataques funcionaron) El modelo que elijas cambia completamente la postura de seguridad de tu agente: mismo aviso del sistema, mismas herramientas, mismo marco, pero resultados muy diferentes. Ninguno de ellos es seguro. Simplemente se rompen de manera diferente. Y recuerda: este es un agente con acceso a archivos, comandos de shell, control del navegador y mensajería. Las inyecciones aquí no son cosméticas. Feliz de trabajar con @steipete en fortalecer esto. Los datos están todos ahí. Informes completos: → Gemini 3 Pro: → GPT-5.2: → Opus 4.5:

Parte superior

Clasificación

Favoritos