Зустрічайте нашу найновішу наномодель: LFM2-ColBERT-350M ⚛️ Маючи лише 350 М параметрів, LFM2-ColBERT-350M дозволяє зберігати документи однією мовою та отримувати їх багатьма мовами з високою точністю та швидкістю висновків моделей, що становить лише невелику частку їх розміру. > Найкращий крос-лінгвальний ретривер у класі до 500М > Перевершує більші моделі в німецькій, арабській, корейській, іспанській, португальській, італійській, французькій та японській мовах > Виступає на рівні з набагато більшими моделями англійською мовою > Компактна конструкція 350 М, готова до пошуку в великих масштабах і на пристрої > Масштабується лінійно відповідно до розміру партії, зберігаючи понад 1 тис документів/с у кодуванні документів 1/п 🧵
LFM2-350M-ColBERT забезпечує швидкість виведення на рівні з моделями в 2,3 рази меншими, зберігаючи при цьому високу точність на дев'яти мовах. 2/п
LFM2-ColBERT-350M використовує пізню взаємодію. Більшість досліджень з пошуку зосереджені на бі-енкодерів або реранкерах. Пізня взаємодія поєднує в собі сильні сторони обох, зберігаючи ефективність окремих кодерів, відновлюючи точність на рівні токенів. > Зберігає дрібнозернисту взаємодію без повної перехресної уваги > Підтримує вбудовування попередньо обчисленого документа для масштабування > Балансує між точністю та швидкістю багатомовного пошуку 3/п
50,77K