Представляємо DeepConf: Глибоке мислення з упевненістю 🚀 Перший метод досягти 99,9% на AIME 2025 за допомогою моделей з відкритим вихідним кодом! Використовуючи GPT-OSS-120B навіть без інструментів, ми досягли цієї майже ідеальної точності, зберігаючи до 85% згенерованих токенів. Це також дає багато сильних переваг для паралельного мислення: 🔥 Підвищення продуктивності: точність ~10% для моделей і наборів даних ⚡ Надефективний: до 85% менше згенерованих токенів 🔧 Plug & play: працює з БУДЬ-ЯКОЮ існуючою моделлю - не потрібно тренуватися (також без налаштування гіперпараметрів!) ⭐ Легко розгортати: всього ~50 рядків коду в vLLM (див. PR нижче) 📚 Папір: 🌐 Проект: Спільна робота з: @FuYichao123 , xuewei_wang @tydsh (подробиці дивіться в коментарях нижче)
316,04K