一站式 Web3 探索中心 | 去中心化应用商店 & Web3 线下活动

热门话题

关于 @openclaw / Clawdbot 安全测试的后续跟进。上次我使用 Gemini 3 Pro 对其进行 ZeroLeaks 测试时得分为 2/100。完全的灾难。Kimi K2.5 的表现也很糟糕，得分为 5/100。这次我在同一代理上测试了另外两个模型：GPT-5.2 和 Claude Opus 4.5。注入结果（对代理安全性至关重要的部分）： Gemini 3 Pro：8.7% 的抵抗力（91% 的攻击成功） GPT-5.2：34.8% 的抵抗力（65% 的攻击成功） Opus 4.5：73.9% 的抵抗力（26% 的攻击成功）你选择的模型完全改变了代理的安全态势：相同的系统提示，相同的工具，相同的框架，但结果却截然不同。它们都不安全。它们只是以不同的方式崩溃。请记住：这是一个具有文件访问、shell 命令、浏览器控制和消息传递的代理。这里的注入不是表面上的。很高兴能与 @steipete 一起加强这一点。所有数据都在这里。完整报告： → Gemini 3 Pro： → GPT-5.2： → Opus 4.5：