Tienda de dapps | Hub de Web3 para eventos y juegos

Temas en tendencia

Seguimiento de las pruebas de seguridad @openclaw / Clawdbot. La última vez que usé ZeroLeaks con Gemini 3 Pro sacó 2/100. Un desastre total. El Kimi K2.5 también lo hizo fatal, 5/100. Esta vez probé dos modelos más en el mismo agente: GPT-5.2 y Claude Opus 4.5. Resultados de la inyección (la parte que importa para la seguridad del agente): Gemini 3 Pro: 8,7% de resistencia (91% de los ataques funcionaron) GPT-5.2: 34,8% de resistencia (65% de los ataques funcionaron) Opus 4.5: 73,9% de resistencia (26% de los ataques funcionaron) El modelo que elijas cambia completamente la postura de seguridad de tu agente: mismo prompt del sistema, mismas herramientas, mismo marco, pero resultados muy diferentes. Ninguno de ellos es seguro. Simplemente se rompen de forma diferente. Y recuerda: este es un agente con acceso a archivos, comandos de shell, control del navegador y mensajería. Las inyecciones aquí no son cosméticas. Encantado de trabajar con @steipete para endurecerlo. Todos los datos están ahí. Informes completos: → Gemini 3 Pro: → GPT-5.2: → Opus 4.5:

Populares

Ranking

Favoritas