Conoce nuestro modelo nano más reciente: LFM2-ColBERT-350M ⚛️ Con solo 350M de parámetros, LFM2-ColBERT-350M te permite almacenar documentos en un idioma y recuperarlos en muchos idiomas con alta precisión y velocidades de inferencia de modelos que son una fracción de su tamaño. > Mejor recuperador multilingüe en la clase sub-500M > Supera a modelos más grandes en alemán, árabe, coreano, español, portugués, italiano, francés y japonés > Rinde al mismo nivel que modelos mucho más grandes en inglés > Diseño compacto de 350M listo para recuperación a gran escala y en dispositivos > Escala linealmente con el tamaño del lote, manteniendo más de 1K docs/seg en la codificación de documentos 1/n 🧵
LFM2-350M-ColBERT ofrece una velocidad de inferencia comparable a modelos 2.3X más pequeños, manteniendo una alta precisión en nueve idiomas. 2/n
LFM2-ColBERT-350M utiliza interacción tardía. La mayoría de la investigación en recuperación se centra en bi-encoders o re-rankers. La interacción tardía combina las fortalezas de ambos, manteniendo la eficiencia de los encoders separados mientras restaura la precisión a nivel de token. > Preserva interacciones detalladas sin atención cruzada completa > Soporta embeddings de documentos precomputados para escalabilidad > Equilibra precisión y velocidad en la recuperación multilingüe 3/n
50,78K