Conozca nuestro nuevo modelo nano: LFM2-ColBERT-350M ⚛️ Con solo 350 millones de parámetros, LFM2-ColBERT-350M le permite almacenar documentos en un idioma y recuperarlos en muchos idiomas con alta precisión y velocidades de inferencia de modelos de una fracción de su tamaño. > Mejor recuperador multilingüe en la clase sub-500M > Supera a los modelos más grandes en alemán, árabe, coreano, español, portugués, italiano, francés y japonés > Funciona a la par con modelos mucho más grandes en inglés > Diseño compacto de 350 M listo para la recuperación a gran escala y en el dispositivo > Escala linealmente con el tamaño del lote, manteniendo más de 1K documentos por segundo en la codificación de documentos 1/n 🧵
LFM2-350M-ColBERT ofrece una velocidad de inferencia a la par con modelos 2,3 veces más pequeños, al tiempo que mantiene una alta precisión en nueve idiomas. 2/n
LFM2-ColBERT-350M utiliza interacción tardía. La mayoría de las investigaciones de recuperación se centran en bicodificadores o reclasificadores. La interacción tardía combina las fortalezas de ambos, manteniendo la eficiencia de los codificadores separados mientras restaura la precisión a nivel de token. > Conserva las interacciones detalladas sin una atención cruzada completa > Admite incrustaciones de documentos precalculadas para escalar > Equilibra la precisión y la velocidad en la recuperación multilingüe 3/n
50.77K