Tendencias del momento
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Seguimiento de las pruebas de seguridad de @openclaw / Clawdbot.
La última vez que ejecuté ZeroLeaks contra él usando Gemini 3 Pro, obtuvo una puntuación de 2/100. Un desastre total. Kimi K2.5 también lo hizo horrible, 5/100.
Esta vez probé dos modelos más en el mismo agente: GPT-5.2 y Claude Opus 4.5.
Resultados de inyección (la parte que importa para la seguridad del agente):
Gemini 3 Pro: 8.7% de resistencia (91% de los ataques funcionaron)
GPT-5.2: 34.8% de resistencia (65% de los ataques funcionaron)
Opus 4.5: 73.9% de resistencia (26% de los ataques funcionaron)
El modelo que elijas cambia completamente la postura de seguridad de tu agente: mismo aviso del sistema, mismas herramientas, mismo marco, pero resultados muy diferentes.
Ninguno de ellos es seguro. Simplemente se rompen de manera diferente. Y recuerda: este es un agente con acceso a archivos, comandos de shell, control del navegador y mensajería. Las inyecciones aquí no son cosméticas.
Feliz de trabajar con @steipete en fortalecer esto. Los datos están todos ahí.
Informes completos:
→ Gemini 3 Pro:
→ GPT-5.2:
→ Opus 4.5:



Parte superior
Clasificación
Favoritos
