Temas en tendencia
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Seguimiento de las pruebas de seguridad @openclaw / Clawdbot.
La última vez que usé ZeroLeaks con Gemini 3 Pro sacó 2/100. Un desastre total. El Kimi K2.5 también lo hizo fatal, 5/100.
Esta vez probé dos modelos más en el mismo agente: GPT-5.2 y Claude Opus 4.5.
Resultados de la inyección (la parte que importa para la seguridad del agente):
Gemini 3 Pro: 8,7% de resistencia (91% de los ataques funcionaron)
GPT-5.2: 34,8% de resistencia (65% de los ataques funcionaron)
Opus 4.5: 73,9% de resistencia (26% de los ataques funcionaron)
El modelo que elijas cambia completamente la postura de seguridad de tu agente: mismo prompt del sistema, mismas herramientas, mismo marco, pero resultados muy diferentes.
Ninguno de ellos es seguro. Simplemente se rompen de forma diferente. Y recuerda: este es un agente con acceso a archivos, comandos de shell, control del navegador y mensajería. Las inyecciones aquí no son cosméticas.
Encantado de trabajar con @steipete para endurecerlo. Todos los datos están ahí.
Informes completos:
→ Gemini 3 Pro:
→ GPT-5.2:
→ Opus 4.5:



Populares
Ranking
Favoritas
