关于 @openclaw / Clawdbot 安全测试的后续跟进。 上次我使用 Gemini 3 Pro 对其进行 ZeroLeaks 测试时得分为 2/100。完全的灾难。Kimi K2.5 的表现也很糟糕,得分为 5/100。 这次我在同一代理上测试了另外两个模型:GPT-5.2 和 Claude Opus 4.5。 注入结果(对代理安全性至关重要的部分): Gemini 3 Pro:8.7% 的抵抗力(91% 的攻击成功) GPT-5.2:34.8% 的抵抗力(65% 的攻击成功) Opus 4.5:73.9% 的抵抗力(26% 的攻击成功) 你选择的模型完全改变了代理的安全态势:相同的系统提示,相同的工具,相同的框架,但结果却截然不同。 它们都不安全。它们只是以不同的方式崩溃。请记住:这是一个具有文件访问、shell 命令、浏览器控制和消息传递的代理。这里的注入不是表面上的。 很高兴能与 @steipete 一起加强这一点。所有数据都在这里。 完整报告: → Gemini 3 Pro: → GPT-5.2: → Opus 4.5: