Poznaj nasz najnowszy model nano: LFM2-ColBERT-350M ⚛️ Przy zaledwie 350M parametrów, LFM2-ColBERT-350M pozwala na przechowywanie dokumentów w jednym języku i ich wyszukiwanie w wielu językach z wysoką dokładnością oraz prędkościami wnioskowania modeli o ułamku jego rozmiaru. > Najlepszy wielojęzyczny wyszukiwacz w klasie poniżej 500M > Przewyższa większe modele w języku niemieckim, arabskim, koreańskim, hiszpańskim, portugalskim, włoskim, francuskim i japońskim > Działa na równi z dużo większymi modelami w języku angielskim > Kompaktowy design 350M gotowy do wyszukiwania na dużą skalę i na urządzeniach > Skaluje się liniowo z rozmiarem partii, utrzymując ponad 1K dokumentów/sek w kodowaniu dokumentów 1/n 🧵
LFM2-350M-ColBERT zapewnia prędkość wnioskowania porównywalną z modelami 2,3 razy mniejszymi, zachowując jednocześnie wysoką dokładność w dziewięciu językach. 2/n
LFM2-ColBERT-350M wykorzystuje późną interakcję. Większość badań nad wyszukiwaniem koncentruje się na bi-enkoderach lub ponownym klasyfikowaniu. Późna interakcja łączy moc obu, zachowując efektywność oddzielnych enkoderów, jednocześnie przywracając precyzję na poziomie tokenów. > Zachowuje szczegółowe interakcje bez pełnej uwagi krzyżowej > Obsługuje wstępnie obliczone osadzenia dokumentów dla skali > Równoważy dokładność i szybkość w wielojęzycznym wyszukiwaniu 3/n
50,77K