1. 🔥 Агенти штучного інтелекту досягають проривного моменту в кібербезпеці. У нашій останній роботі: 🔓 CyberGym: AI-агенти виявили 15 нульових днів у великих проєктах з відкритим вихідним кодом 💰 BountyBench: AI-агенти вирішували реальні завдання з баг-баг-баунті на десятки тисяч доларів 🤖 Автономно. Відбувається кардинальна зміна — агенти штучного інтелекту тепер можуть автономно робити те, що раніше могли робити лише елітні люди-хакери.
2. 📡 Щоб відстежувати цей прискорений рубіж, ми запустили Обсерваторію кібербезпеки Frontier AI — відкриту платформу для моніторингу можливостей штучного інтелекту в наступальних і оборонних завданнях безпеки. Ми запрошуємо спільноти розробників штучного інтелекту та безпеки співпрацювати та робити свій внесок. Тому що те, що вимірюється, закріплюється.
3. 🏋️ ♀️ CyberGym – це великомасштабний фреймворк оцінки, який проводить стрес-тестування агентів штучного інтелекту на 1 500+ реальних вразливостях у 188 великих проектах з відкритим вихідним кодом. Він ставить перед агентами: – Орієнтуйтеся у великих реальних кодових базах – Відтворюйте PoC для реальних CVE – Відкрийте нові, невідомі вразливості
4/ Ключові інсайти від CyberGym: ⚙️ Агенти SOTA та LLM успішно генерували PoC для ~18% історичних CVEs 🚨 Ще більш вражаюче: вони виявили 15 нульових днів у дикій природі
5. 🐞 BountyBench оцінює агентів штучного інтелекту на 25 реальних, складних системах і 40 винагородах за виявлення помилок (на суму до $30 000+), що охоплюють 9 категорій OWASP Top 10.
6/ 💡 Ключові інсайти від BountyBench: – Агенти штучного інтелекту вирішували завдання з баг-баунті на десятки тисяч доларів – Codex CLI & Claude Code показали відмінні результати в виправленні (90% / 87,5%) в порівнянні з експлуатацією (32,5% / 57,5%) – Користувацькі агенти показали більш рівномірні результати в обох: Exploit (40–67,5%), Patch (45–60%)
7. Розпочалася автоматизація кіберзлочинів. Нам потрібна прозора, ретельна оцінка цих сил і засобів – до того, як вони перевищать нашу здатність реагувати. Це тільки початок. Веб-сайти: Папір: #AI #CyberSecurity #BugBounty #LLM #BountyBench #CyberGym
8. 📋 Ми збираємо думки від дослідників і практиків у галузі штучного інтелекту та кібербезпеки про те, як передовий штучний інтелект змінить ландшафт кібербезпеки. Ваші погляди допоможуть формувати дослідження та політику. Приєднуйтесь до розмови 👉
9/ 🙏Величезне спасибі співробітникам: Кібертренажерний зал: @zhun_amg, @tiannengshi, @jingxuan_he, @Nightxade_, @benzhang04 Bountybench: @andystruct Даніель Хо @danboneh @percyliang та багато студентів, включаючи @JoeyJi0927, @cel_menders, @DulepetRiya, @ThomasQin52342, @ronyifengwang, @laurawjr, @kyleenliao, @jAlinaHu, @enscry, @NishkaK253710, @_Eth007, @laurenmclane_, @oliviabruvik, @SeKim1112, @RyanLi0802, @SparklySid, @vikramsiva29. Обсерваторія кібербезпеки Frontier AI та співавтори книги «Вплив Frontier AI на ландшафт кібербезпеки»: @yujink_ @WenboGuo4 @tiannengshi @zhun_amg @andystruct Ми також щиро вдячні кожному, хто надав відгук про нашу роботу.
50,11K