Gặp gỡ mô hình nano mới nhất của chúng tôi: LFM2-ColBERT-350M ⚛️ Với chỉ 350M tham số, LFM2-ColBERT-350M cho phép bạn lưu trữ tài liệu bằng một ngôn ngữ và truy xuất chúng bằng nhiều ngôn ngữ với độ chính xác cao và tốc độ suy diễn của các mô hình nhỏ hơn nhiều. > Trình truy xuất đa ngôn ngữ tốt nhất trong phân khúc dưới 500M > Vượt trội hơn các mô hình lớn hơn trong tiếng Đức, tiếng Ả Rập, tiếng Hàn, tiếng Tây Ban Nha, tiếng Bồ Đào Nha, tiếng Ý, tiếng Pháp và tiếng Nhật > Hoạt động tương đương với các mô hình lớn hơn nhiều trong tiếng Anh > Thiết kế gọn nhẹ 350M sẵn sàng cho việc truy xuất quy mô lớn và trên thiết bị > Tăng quy mô tuyến tính với kích thước lô, duy trì hơn 1K tài liệu/giây trong mã hóa tài liệu 1/n 🧵
LFM2-350M-ColBERT cung cấp tốc độ suy diễn tương đương với các mô hình nhỏ hơn 2.3X, trong khi vẫn duy trì độ chính xác cao trên chín ngôn ngữ. 2/n
LFM2-ColBERT-350M sử dụng tương tác muộn. Hầu hết các nghiên cứu về truy xuất tập trung vào bi-encoder hoặc re-ranker. Tương tác muộn kết hợp sức mạnh của cả hai, giữ lại hiệu quả của các encoder riêng biệt trong khi phục hồi độ chính xác ở cấp độ token. > Bảo tồn các tương tác chi tiết mà không cần toàn bộ sự chú ý chéo > Hỗ trợ các nhúng tài liệu đã được tính toán trước cho quy mô > Cân bằng độ chính xác và tốc độ trong truy xuất đa ngôn ngữ 3/n
50,78K