Popularne tematy
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1/ 🔥 Agenci AI osiągają przełomowy moment w cyberbezpieczeństwie.
W naszej najnowszej pracy:
🔓 CyberGym: Agenci AI odkryli 15 luk zero-day w głównych projektach open-source
💰 BountyBench: Agenci AI rozwiązali rzeczywiste zadania związane z nagrodami za błędy warte dziesiątki tysięcy dolarów
🤖 Autonomicznie.
Trwa kluczowa zmiana — agenci AI mogą teraz autonomicznie robić to, co wcześniej potrafili tylko elitarni hakerzy.

2/📡 Aby śledzić tę przyspieszającą granicę, uruchomiliśmy Obserwatorium Cyberbezpieczeństwa AI Frontier — otwartą platformę do monitorowania możliwości AI w zakresie zadań ofensywnych i defensywnych w bezpieczeństwie.
Zapraszamy społeczności AI i bezpieczeństwa do współpracy i wkładu.
Bo to, co jest mierzone, jest zabezpieczane.

3/ 🏋️♀️ CyberGym to rozbudowane ramy oceny, które testują AI na ponad 1500 rzeczywistych lukach w 188 głównych projektach Open Source Software.
Wyzwanie dla agentów polega na:
– Nawigowaniu po dużych, rzeczywistych bazach kodu
– Reprodukcji PoC dla rzeczywistych CVE
– Odkrywaniu nowych, nieznanych luk

4/ Kluczowe spostrzeżenia z CyberGym:
⚙️ Agenci SOTA i LLM-y skutecznie wygenerowali PoC dla około ~18% historycznych CVE
🚨 Co bardziej uderzające: odkryli 15 zero-dayów w dzikiej przyrodzie

5/ 🐞 BountyBench ocenia agentów AI w 25 rzeczywistych, złożonych systemach oraz 40 programach bug bounty (o wartości do 30 000 $+), obejmujących 9 kategorii OWASP Top 10.

6/ 💡 Kluczowe spostrzeżenia z BountyBench:
– Agenci AI rozwiązali zadania związane z bug bounty o wartości dziesiątek tysięcy dolarów
– Codex CLI i Claude Code wyróżnili się w łatach (90% / 87,5%), w porównaniu do eksploatacji (32,5% / 57,5%)
– Agenci niestandardowi radzili sobie bardziej równomiernie w obu kategoriach: Eksploatacja (40–67,5%), Łata (45–60%)

7/ Automatyzacja cyberataków już się rozpoczęła.
Musimy przeprowadzić przejrzystą, rygorystyczną ocenę tych zdolności — zanim przewyższą naszą zdolność do reakcji.
To dopiero początek.
Strony internetowe:
Dokument:
#AI #CyberBezpieczeństwo #BugBounty #LLM #BountyBench #CyberGym
8/ 📋 Zbieramy spostrzeżenia od badaczy i praktyków zajmujących się sztuczną inteligencją i cyberbezpieczeństwem na temat tego, w jaki sposób pionierska sztuczna inteligencja zmieni krajobraz cyberbezpieczeństwa.
Twoja perspektywa pomoże w informowaniu o badaniach i polityce.
Dołącz do rozmowy 👉
9/ 🙏Ogromne podziękowania dla współpracowników:
Cybergym: @zhun_amg, @tiannengshi, @jingxuan_he, @Nightxade_, @benzhang04
Bountybench: @andystruct Daniel Ho @danboneh @percyliang oraz wielu studentów, w tym
@JoeyJi0927, @cel_menders, @DulepetRiya, @ThomasQin52342, @ronyifengwang, @laurawjr, @kyleenliao, @jAlinaHu, @enscry, @NishkaK253710, @_Eth007, @laurenmclane_, @oliviabruvik, @SeKim1112, @RyanLi0802, @SparklySid, @vikramsiva29.
Frontier AI Cybersecurity Observatory oraz współautorzy „Wpływ Frontier AI na krajobraz cyberbezpieczeństwa”: @yujink_ @WenboGuo4 @tiannengshi @zhun_amg @andystruct
Szczerze dziękujemy również wszystkim, którzy udzielili nam informacji zwrotnej na temat naszej pracy.
50,12K
Najlepsze
Ranking
Ulubione