Découvrez notre tout nouveau modèle nano : LFM2-ColBERT-350M ⚛️ Avec seulement 350M de paramètres, LFM2-ColBERT-350M vous permet de stocker des documents dans une langue et de les récupérer dans de nombreuses langues avec une grande précision et des vitesses d'inférence de modèles d'une fraction de sa taille. > Meilleur récupérateur cross-lingual dans la classe des moins de 500M > Surpasse des modèles plus grands en allemand, arabe, coréen, espagnol, portugais, italien, français et japonais > Performances équivalentes à des modèles beaucoup plus grands en anglais > Design compact de 350M prêt pour la récupération à grande échelle et sur appareil > Évolue linéairement avec la taille du lot, soutenant plus de 1K docs/sec dans l'encodage de documents 1/n 🧵
LFM2-350M-ColBERT offre une vitesse d'inférence comparable à celle de modèles 2,3 fois plus petits, tout en maintenant une haute précision dans neuf langues. 2/n
LFM2-ColBERT-350M utilise l'interaction tardive. La plupart des recherches sur la récupération se concentrent sur les bi-encodeurs ou les re-rankers. L'interaction tardive combine les forces des deux, en conservant l'efficacité des encodeurs séparés tout en restaurant la précision au niveau des tokens. > Préserve les interactions fines sans attention croisée complète > Prend en charge les embeddings de documents pré-calculés pour l'échelle > Équilibre précision et rapidité dans la récupération multilingue 3/n
50,77K