Ontmoet ons nieuwste nano-model: LFM2-ColBERT-350M ⚛️ Met slechts 350M parameters stelt LFM2-ColBERT-350M je in staat om documenten in één taal op te slaan en ze in veel talen met hoge nauwkeurigheid en inferentiesnelheden van modellen van een fractie van zijn grootte op te halen. > Beste cross-linguale retriever in de sub-500M klasse > Presteert beter dan grotere modellen in het Duits, Arabisch, Koreaans, Spaans, Portugees, Italiaans, Frans en Japans > Presteert gelijkwaardig aan veel grotere modellen in het Engels > Compact 350M ontwerp klaar voor grootschalige en on-device retrieval > Schaal lineair met batchgrootte, met meer dan 1K docs/sec in documentcodering 1/n 🧵
LFM2-350M-ColBERT levert inferentiesnelheid die vergelijkbaar is met modellen die 2,3 keer kleiner zijn, terwijl het hoge nauwkeurigheid behoudt in negen talen. 2/n
LFM2-ColBERT-350M maakt gebruik van late interactie. De meeste retrievalonderzoeken richten zich op bi-encoders of re-rankers. Late interactie combineert de sterke punten van beide, waarbij de efficiëntie van afzonderlijke encoders behouden blijft terwijl de precisie op token-niveau wordt hersteld. > Behoudt fijnmazige interacties zonder volledige cross-attention > Ondersteunt vooraf berekende documentembeddings voor schaal > Balans tussen nauwkeurigheid en snelheid in meertalige retrieval 3/n
50,76K