Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
1/ 🔥 ИИ-агенты достигают прорывного момента в кибербезопасности.
В нашей последней работе:
🔓 CyberGym: ИИ-агенты обнаружили 15 нулевых уязвимостей в крупных проектах с открытым исходным кодом.
💰 BountyBench: ИИ-агенты решили реальные задачи по поиску уязвимостей на сумму десятки тысяч долларов
🤖 Автономно.
Происходит ключевой сдвиг — ИИ-агенты теперь могут автономно делать то, что раньше могли только элитные хакеры.

2/ 📡 Чтобы отслеживать этот ускоряющийся рубеж, мы запустили Frontier AI Cybersecurity Observatory — открытую платформу для мониторинга возможностей ИИ в наступательных и оборонительных задачах безопасности.
Мы приглашаем сообщества ИИ и безопасности к сотрудничеству и внесению вклада.
Потому что то, что измеряется, становится безопасным.

3/ 🏋️ ♀️ CyberGym — это масштабная оценочная среда, которая проводит стресс-тестирование агентов ИИ на 1500+ реальных уязвимостях в 188 крупных проектах программного обеспечения с открытым исходным кодом.
Он ставит перед агентами следующие задачи:
– Навигация по большим реальным кодовым базам
— Воспроизведение PoC для реальных CVE
– Обнаружение новых, неизвестных уязвимостей

4/ Ключевые выводы от CyberGym:
⚙️ Агенты SOTA и LLM успешно генерировали PoC для ~18% исторических CVE
🚨 Еще более поразительно: они обнаружили 15 нулевого дня в дикой природе

5/ 🐞 BountyBench оценивает агентов ИИ по 25 реальным, сложным системам и 40 баунти за обнаружение ошибок (на сумму до 30 000+ долларов США), охватывая 9 топ-10 категорий OWASP.

6/ 💡 Ключевые выводы от BountyBench:
— ИИ-агенты решали задачи bug bounty на десятки тысяч долларов
— Codex CLI и Claude Code преуспели в установке патчей (90% / 87,5%) по сравнению с эксплуатацией (32,5% / 57,5%)
– Пользовательские агенты показали более равномерные результаты по обоим: эксплойту (40–67,5%), исправлению (45–60%)

7/ Началась автоматизация киберпреступлений.
Нам нужна прозрачная, тщательная оценка этих возможностей, прежде чем они опередят нашу способность реагировать.
Это только начало.
Веб-сайты:
Бумага:
#AI #CyberSecurity #BugBounty #LLM #BountyBench #CyberGym
📋 Мы собираем информацию от исследователей и практиков в области искусственного интеллекта и кибербезопасности о том, как передовой искусственный интеллект изменит ландшафт кибербезопасности.
Ваши взгляды помогут в проведении исследований и разработке политики.
Присоединяйтесь к обсуждению 👉
9/ 🙏Огромное спасибо за соавторов:
Кибергимнастика: @zhun_amg, @tiannengshi, @jingxuan_he, @Nightxade_, @benzhang04
Bountybench: @andystruct Дэниел Хо @danboneh @percyliang и многие студенты, в том числе
@JoeyJi0927, @cel_menders, @DulepetRiya, @ThomasQin52342, @ronyifengwang, @laurawjr, @kyleenliao, @jAlinaHu, @enscry, @NishkaK253710, @_Eth007, @laurenmclane_, @oliviabruvik, @SeKim1112, @RyanLi0802, @SparklySid, @vikramsiva29.
Обсерватория кибербезопасности Frontier AI и соавторы книги «Влияние Frontier AI на ландшафт кибербезопасности»: @yujink_ @WenboGuo4 @tiannengshi @zhun_amg @andystruct
Мы также искренне благодарны всем, кто оставил отзыв о нашей работе.
50,27K
Топ
Рейтинг
Избранное