熱門話題
#
Bonk 生態迷因幣展現強韌勢頭
#
有消息稱 Pump.fun 計劃 40 億估值發幣,引發市場猜測
#
Solana 新代幣發射平臺 Boop.Fun 風頭正勁
介紹我們最新的納米模型:LFM2-ColBERT-350M ⚛️
LFM2-ColBERT-350M 只有 350M 參數,允許您以一種語言存儲文件,並以多種語言檢索,具有高準確性和模型推理速度,僅為其大小的一小部分。
> 在 500M 以下類別中最佳的跨語言檢索器
> 在德語、阿拉伯語、韓語、西班牙語、葡萄牙語、意大利語、法語和日語中超越更大的模型
> 在英語中表現與更大的模型相當
> 緊湊的 350M 設計,適合大規模和設備上的檢索
> 隨著批量大小線性擴展,在文檔編碼中持續超過 1K 文檔/秒
1/n 🧵

LFM2-350M-ColBERT 提供的推理速度與 2.3 倍小的模型相當,同時在九種語言中保持高準確性。
2/n

LFM2-ColBERT-350M 使用延遲互動。
大多數檢索研究專注於雙編碼器或重新排名器。延遲互動結合了兩者的優勢,保持了獨立編碼器的效率,同時恢復了令牌級的精確度。
> 在不進行完全交叉注意的情況下保留細粒度的互動
> 支持預計算的文檔嵌入以擴展規模
> 在多語言檢索中平衡準確性和速度
3/n

50.77K
熱門
排行
收藏

