介紹我們最新的納米模型:LFM2-ColBERT-350M ⚛️ LFM2-ColBERT-350M 只有 350M 參數,允許您以一種語言存儲文件,並以多種語言檢索,具有高準確性和模型推理速度,僅為其大小的一小部分。 > 在 500M 以下類別中最佳的跨語言檢索器 > 在德語、阿拉伯語、韓語、西班牙語、葡萄牙語、意大利語、法語和日語中超越更大的模型 > 在英語中表現與更大的模型相當 > 緊湊的 350M 設計,適合大規模和設備上的檢索 > 隨著批量大小線性擴展,在文檔編碼中持續超過 1K 文檔/秒 1/n 🧵
LFM2-350M-ColBERT 提供的推理速度與 2.3 倍小的模型相當,同時在九種語言中保持高準確性。 2/n
LFM2-ColBERT-350M 使用延遲互動。 大多數檢索研究專注於雙編碼器或重新排名器。延遲互動結合了兩者的優勢,保持了獨立編碼器的效率,同時恢復了令牌級的精確度。 > 在不進行完全交叉注意的情況下保留細粒度的互動 > 支持預計算的文檔嵌入以擴展規模 > 在多語言檢索中平衡準確性和速度 3/n
50.77K