热门话题
#
Bonk 生态迷因币展现强韧势头
#
有消息称 Pump.fun 计划 40 亿估值发币,引发市场猜测
#
Solana 新代币发射平台 Boop.Fun 风头正劲
关于 @openclaw / Clawdbot 安全测试的后续跟进。
上次我使用 Gemini 3 Pro 对其进行 ZeroLeaks 测试时得分为 2/100。完全的灾难。Kimi K2.5 的表现也很糟糕,得分为 5/100。
这次我在同一代理上测试了另外两个模型:GPT-5.2 和 Claude Opus 4.5。
注入结果(对代理安全性至关重要的部分):
Gemini 3 Pro:8.7% 的抵抗力(91% 的攻击成功)
GPT-5.2:34.8% 的抵抗力(65% 的攻击成功)
Opus 4.5:73.9% 的抵抗力(26% 的攻击成功)
你选择的模型完全改变了代理的安全态势:相同的系统提示,相同的工具,相同的框架,但结果却截然不同。
它们都不安全。它们只是以不同的方式崩溃。请记住:这是一个具有文件访问、shell 命令、浏览器控制和消息传递的代理。这里的注入不是表面上的。
很高兴能与 @steipete 一起加强这一点。所有数据都在这里。
完整报告:
→ Gemini 3 Pro:
→ GPT-5.2:
→ Opus 4.5:



热门
排行
收藏
