1/ 🔥 Agenci AI osiągają przełomowy moment w cyberbezpieczeństwie. W naszej najnowszej pracy: 🔓 CyberGym: Agenci AI odkryli 15 luk zero-day w głównych projektach open-source 💰 BountyBench: Agenci AI rozwiązali rzeczywiste zadania związane z nagrodami za błędy warte dziesiątki tysięcy dolarów 🤖 Autonomicznie. Trwa kluczowa zmiana — agenci AI mogą teraz autonomicznie robić to, co wcześniej potrafili tylko elitarni hakerzy.
2/📡 Aby śledzić tę przyspieszającą granicę, uruchomiliśmy Obserwatorium Cyberbezpieczeństwa AI Frontier — otwartą platformę do monitorowania możliwości AI w zakresie zadań ofensywnych i defensywnych w bezpieczeństwie. Zapraszamy społeczności AI i bezpieczeństwa do współpracy i wkładu. Bo to, co jest mierzone, jest zabezpieczane.
3/ 🏋️‍♀️ CyberGym to rozbudowane ramy oceny, które testują AI na ponad 1500 rzeczywistych lukach w 188 głównych projektach Open Source Software. Wyzwanie dla agentów polega na: – Nawigowaniu po dużych, rzeczywistych bazach kodu – Reprodukcji PoC dla rzeczywistych CVE – Odkrywaniu nowych, nieznanych luk
4/ Kluczowe spostrzeżenia z CyberGym: ⚙️ Agenci SOTA i LLM-y skutecznie wygenerowali PoC dla około ~18% historycznych CVE 🚨 Co bardziej uderzające: odkryli 15 zero-dayów w dzikiej przyrodzie
5/ 🐞 BountyBench ocenia agentów AI w 25 rzeczywistych, złożonych systemach oraz 40 programach bug bounty (o wartości do 30 000 $+), obejmujących 9 kategorii OWASP Top 10.
6/ 💡 Kluczowe spostrzeżenia z BountyBench: – Agenci AI rozwiązali zadania związane z bug bounty o wartości dziesiątek tysięcy dolarów – Codex CLI i Claude Code wyróżnili się w łatach (90% / 87,5%), w porównaniu do eksploatacji (32,5% / 57,5%) – Agenci niestandardowi radzili sobie bardziej równomiernie w obu kategoriach: Eksploatacja (40–67,5%), Łata (45–60%)
7/ Automatyzacja cyberataków już się rozpoczęła. Musimy przeprowadzić przejrzystą, rygorystyczną ocenę tych zdolności — zanim przewyższą naszą zdolność do reakcji. To dopiero początek. Strony internetowe: Dokument: #AI #CyberBezpieczeństwo #BugBounty #LLM #BountyBench #CyberGym
8/ 📋 Zbieramy spostrzeżenia od badaczy i praktyków zajmujących się sztuczną inteligencją i cyberbezpieczeństwem na temat tego, w jaki sposób pionierska sztuczna inteligencja zmieni krajobraz cyberbezpieczeństwa. Twoja perspektywa pomoże w informowaniu o badaniach i polityce. Dołącz do rozmowy 👉
9/ 🙏Ogromne podziękowania dla współpracowników: Cybergym: @zhun_amg, @tiannengshi, @jingxuan_he, @Nightxade_, @benzhang04 Bountybench: @andystruct Daniel Ho @danboneh @percyliang oraz wielu studentów, w tym @JoeyJi0927, @cel_menders, @DulepetRiya, @ThomasQin52342, @ronyifengwang, @laurawjr, @kyleenliao, @jAlinaHu, @enscry, @NishkaK253710, @_Eth007, @laurenmclane_, @oliviabruvik, @SeKim1112, @RyanLi0802, @SparklySid, @vikramsiva29. Frontier AI Cybersecurity Observatory oraz współautorzy „Wpływ Frontier AI na krajobraz cyberbezpieczeństwa”: @yujink_ @WenboGuo4 @tiannengshi @zhun_amg @andystruct Szczerze dziękujemy również wszystkim, którzy udzielili nam informacji zwrotnej na temat naszej pracy.
50,12K