Zelfs als grok elke post leest, wat doet het dan om ze te koppelen aan gebruikers die het leuk zouden vinden? Het lijkt voor mij niet veel zin te hebben.
Nieuw paper 📢 De meest krachtige vision-language (VL) redeneer datasets blijven eigendom 🔒, wat de inspanningen belemmert om hun principes te bestuderen en soortgelijke effectieve datasets in de openbaarheid te ontwikkelen 🔓.
Daarom introduceren we HoneyBee, een dataset van 2,5 miljoen voorbeelden die is gemaakt door zorgvuldige gegevenscuratie. Het traint VLM redeneerders die beter presteren dan InternVL2.5/3-Instruct en Qwen2.5-VL-Instruct over model schalen (bijv. een verbetering van 8% in MathVerse ten opzichte van QwenVL op de 3B schaal). 🧵👇
Werk gedaan tijdens mijn stage bij @AIatMeta w/ 🤝 @ramakanth1729, @Devendr06654102, @scottyih, @gargighosh, @adityagrover_, en @kaiwei_chang.