Ny artikkel 📢 De kraftigste synsspråk-resonneringsdatasettene (VL) forblir proprietære 🔒, noe som hindrer innsatsen for å studere prinsippene deres og utvikle tilsvarende effektive datasett i det fri 🔓. Derfor introduserer vi HoneyBee, et datasett med 2,5 millioner eksempler laget gjennom nøye datakuratering. Den trener VLM-resonnatorer som overgår InternVL2.5/3-Instruct og Qwen2.5-VL-Instruct på tvers av modellskalaer (f.eks. en 8 % MathVerse-forbedring i forhold til QwenVL på 3B-skalaen). 🧵👇 Arbeid utført under praksisplassen min hos @AIatMeta med 🤝 @ramakanth1729, @Devendr06654102, @scottyih, @gargighosh, @adityagrover_ og @kaiwei_chang.