1/ 🔥 ИИ-агенты достигают прорывного момента в кибербезопасности. В нашей последней работе: 🔓 CyberGym: ИИ-агенты обнаружили 15 нулевых уязвимостей в крупных проектах с открытым исходным кодом. 💰 BountyBench: ИИ-агенты решили реальные задачи по поиску уязвимостей на сумму десятки тысяч долларов 🤖 Автономно. Происходит ключевой сдвиг — ИИ-агенты теперь могут автономно делать то, что раньше могли только элитные хакеры.
2/ 📡 Чтобы отслеживать этот ускоряющийся рубеж, мы запустили Frontier AI Cybersecurity Observatory — открытую платформу для мониторинга возможностей ИИ в наступательных и оборонительных задачах безопасности. Мы приглашаем сообщества ИИ и безопасности к сотрудничеству и внесению вклада. Потому что то, что измеряется, становится безопасным.
3/ 🏋️ ♀️ CyberGym — это масштабная оценочная среда, которая проводит стресс-тестирование агентов ИИ на 1500+ реальных уязвимостях в 188 крупных проектах программного обеспечения с открытым исходным кодом. Он ставит перед агентами следующие задачи: – Навигация по большим реальным кодовым базам — Воспроизведение PoC для реальных CVE – Обнаружение новых, неизвестных уязвимостей
4/ Ключевые выводы от CyberGym: ⚙️ Агенты SOTA и LLM успешно генерировали PoC для ~18% исторических CVE 🚨 Еще более поразительно: они обнаружили 15 нулевого дня в дикой природе
5/ 🐞 BountyBench оценивает агентов ИИ по 25 реальным, сложным системам и 40 баунти за обнаружение ошибок (на сумму до 30 000+ долларов США), охватывая 9 топ-10 категорий OWASP.
6/ 💡 Ключевые выводы от BountyBench: — ИИ-агенты решали задачи bug bounty на десятки тысяч долларов — Codex CLI и Claude Code преуспели в установке патчей (90% / 87,5%) по сравнению с эксплуатацией (32,5% / 57,5%) – Пользовательские агенты показали более равномерные результаты по обоим: эксплойту (40–67,5%), исправлению (45–60%)
7/ Началась автоматизация киберпреступлений. Нам нужна прозрачная, тщательная оценка этих возможностей, прежде чем они опередят нашу способность реагировать. Это только начало. Веб-сайты: Бумага: #AI #CyberSecurity #BugBounty #LLM #BountyBench #CyberGym
📋 Мы собираем информацию от исследователей и практиков в области искусственного интеллекта и кибербезопасности о том, как передовой искусственный интеллект изменит ландшафт кибербезопасности. Ваши взгляды помогут в проведении исследований и разработке политики. Присоединяйтесь к обсуждению 👉
9/ 🙏Огромное спасибо за соавторов: Кибергимнастика: @zhun_amg, @tiannengshi, @jingxuan_he, @Nightxade_, @benzhang04 Bountybench: @andystruct Дэниел Хо @danboneh @percyliang и многие студенты, в том числе @JoeyJi0927, @cel_menders, @DulepetRiya, @ThomasQin52342, @ronyifengwang, @laurawjr, @kyleenliao, @jAlinaHu, @enscry, @NishkaK253710, @_Eth007, @laurenmclane_, @oliviabruvik, @SeKim1112, @RyanLi0802, @SparklySid, @vikramsiva29. Обсерватория кибербезопасности Frontier AI и соавторы книги «Влияние Frontier AI на ландшафт кибербезопасности»: @yujink_ @WenboGuo4 @tiannengshi @zhun_amg @andystruct Мы также искренне благодарны всем, кто оставил отзыв о нашей работе.
50,27K