Topik trending
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Lucas Valbuena
Menindaklanjuti tes keamanan @openclaw / Clawdbot.
Terakhir kali saya menjalankan ZeroLeaks melawannya menggunakan Gemini 3 Pro, skor itu 2/100. Bencana total. Kimi K2.5 juga mengerikan, 5/100.
Kali ini saya menguji dua model lagi pada agen yang sama: GPT-5.2 dan Claude Opus 4.5.
Hasil injeksi (bagian yang penting untuk keamanan agen):
Gemini 3 Pro: 8,7% resistensi (91% serangan berhasil)
GPT-5.2: resistensi 34,8% (65% serangan berhasil)
Opus 4.5: 73,9% resistensi (26% serangan berhasil)
Model yang Anda pilih benar-benar mengubah postur keamanan agen Anda: prompt sistem yang sama, alat yang sama, kerangka kerja yang sama, tetapi hasil yang sangat berbeda.
Tak satu pun dari mereka yang aman. Mereka hanya merusak secara berbeda. Dan ingat: ini adalah agen dengan akses file, perintah shell, kontrol browser, dan perpesanan. Suntikan di sini tidak kosmetik.
Senang bekerja sama dengan @steipete untuk mengeraskan ini. Semua data ada di sana.
Laporan lengkap:
→ Gemini 3 Pro:
→ GPT-5.2:
→ Opus 4.5:



15
Saya menjalankan @OpenClaw (sebelumnya Clawdbot) melalui ZeroLeaks lagi, kali ini dengan Kimi K2.5 sebagai model yang mendasarinya.
Kinerjanya seburuk Gemini 3 Pro dan Codex 5.1 Max: 5/100. Tingkat ekstraksi 100%. 70% suntikan berhasil. Prompt sistem lengkap bocor di tikungan 1.
Agen yang sama, konfigurasi yang sama, model yang berbeda. Keamanan agen Anda bergantung pada model DAN prompt/keterampilan sistem Anda. Model yang lemah akan terlipat apa pun yang terjadi, tetapi bahkan model yang kuat membutuhkan pengerasan cepat yang tepat. Keduanya bekerja sama. Tanpa keduanya, konfigurasi alat, file memori, instruksi internal, semuanya akan diekstraksi dan dimodifikasi dalam hitungan detik.
Model dikirim dengan cepat. Kapal keamanan tidak pernah.
Laporan lengkap:

54
Saya baru saja menjalankan @OpenClaw (sebelumnya Clawdbot) melalui ZeroLeaks.
Itu mendapat skor 2/100. Tingkat ekstraksi 84%. 91% serangan injeksi berhasil. Prompt sistem bocor di tikungan 1.
Ini berarti jika Anda menggunakan Clawdbot, siapa pun yang berinteraksi dengan agen Anda dapat mengakses dan memanipulasi perintah sistem lengkap Anda, konfigurasi alat internal, file memori... Semua yang Anda masukkan ke dalam keterampilan Anda, semuanya dapat diakses dan berisiko disuntikkan dengan cepat.
Untuk agen yang menangani alur kerja sensitif atau data pribadi, ini adalah masalah nyata.
cc @steipete
Analisis lengkap:

71
Teratas
Peringkat
Favorit
