Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
@openclaw / Clawdbot güvenlik testlerinin takibini incele.
Son Gemini 3 Pro ile ZeroLeaks'i kullandığımda 2/100 puan aldı. Tam bir felaket. Kimi K2.5 de berbat yaptı, 5/100.
Bu sefer aynı ajanda iki model daha test ettim: GPT-5.2 ve Claude Opus 4.5.
Enjeksiyon sonuçları (ajan güvenliği için önemli olan kısım):
Gemini 3 Pro: %8.7 direnç (saldırıların %91'i işe yaradı)
GPT-5.2: %34,8 direnç (saldırıların %65'i işe yaradı)
Opus 4.5: %73,9 direnç (saldırıların %26'sı işe yaradı)
Seçtiğiniz model, ajanınızın güvenlik duruşunu tamamen değiştirir: aynı sistem uyarısı, aynı araçlar, aynı çerçeve, ama sonuçlar çok farklı.
Hiçbiri güvende değil. Sadece farklı şekilde kırılırlar. Ve unutmayın: bu dosya erişimi, kabuk komutları, tarayıcı kontrolü ve mesajlaşma özelliklerine sahip bir ajan. Buradaki enjeksiyonlar kozmetik değildir.
Bu sertleştirme konusunda @steipete ile çalışmaktan mutluyum. Veriler tamamen orada.
Tam raporlar:
→ Gemini 3 Pro:
→ GPT-5.2:
→ Opus 4.5:



En İyiler
Sıralama
Takip Listesi
