Нова стаття 📢 Найпотужніші набори даних міркувань мовою бачення (VL) залишаються власністю 🔒, що перешкоджає зусиллям з вивчення їхніх принципів та розробки аналогічних ефективних наборів даних у відкритому доступі 🔓. Таким чином, ми представляємо HoneyBee – набір даних з 2,5 млн прикладів, створений завдяки ретельному кураторству даних. Він тренує міркувальників VLM, які перевершують InternVL2.5/3-Instruct та Qwen2.5-VL-Instruct у масштабах моделей (наприклад, покращення MathVerse на 8% порівняно з QwenVL на масштабі 3B). 🧵👇 Робота, виконана під час моєї стажування в @AIatMeta з 🤝 @ramakanth1729, @Devendr06654102, @scottyih, @gargighosh, @adityagrover_ та @kaiwei_chang.