Giới thiệu Exa 2.0 Những đột phá trong nghiên cứu và kỹ thuật AI của chúng tôi đã cho phép chúng tôi xây dựng cả API tìm kiếm nhanh nhất (<350ms) và chất lượng tìm kiếm cao nhất trên thị trường. Chi tiết sản phẩm và kỹ thuật bên dưới:
Sứ mệnh duy nhất của Exa là xây dựng một công cụ tìm kiếm hoàn hảo. Một công cụ luôn trả về chính xác thông tin bạn cần nhanh nhất có thể, có sẵn thông qua một API liền mạch. Exa 2.0 là một bước tiến lớn hướng tới mục tiêu đó.
Để xây dựng Exa 2.0, trước tiên chúng tôi cần mở rộng chỉ mục của mình. Hiện tại, chúng tôi phục vụ hàng chục tỷ trang web và làm mới chúng mỗi phút. Tiếp theo, chúng tôi đã tiền huấn luyện và tinh chỉnh một mô hình nhúng để tìm kiếm ngữ nghĩa chính xác trên chỉ mục đó. Exa 2.0 đã được huấn luyện trong hơn một tháng trên cụm 144x H200 của chúng tôi và sử dụng các kiến trúc nhúng mới mà chúng tôi đã phát hiện trong 6 tháng qua. Để phục vụ những nhúng này với độ trễ thấp nhất thế giới, cần có những cập nhật lớn cho cơ sở dữ liệu vector nội bộ của chúng tôi. Một số ví dụ là các thuật toán phân cụm mới, nén từ vựng và tối ưu hóa lắp ráp. Tất cả đều bằng Rust, tất nhiên :)
Cập nhật đầu tiên là Exa Fast. Exa Fast hiện đạt được độ trễ e2e P50 <350ms, thấp hơn 30% so với API nhanh nhất tiếp theo. Khách hàng của chúng tôi đang sử dụng nó để hỗ trợ các trường hợp sử dụng AI đặc biệt nhạy cảm với độ trễ.
Thứ hai là Exa Deep. Exa Deep được thiết kế để tìm kiếm thông tin chất lượng cao nhất có thể. Nó tìm kiếm một cách chủ động, xử lý, rồi lại tìm kiếm để làm điều đó. Exa Deep đứng đầu gần như mọi tiêu chuẩn mà chúng tôi đưa ra.
Tìm kiếm là một không gian vấn đề rất đa dạng. Các tiêu chuẩn như SimpleQA và FRAMES rất hữu ích, nhưng bỏ lỡ nhiều điều quan trọng đối với tìm kiếm AI. Ở đây, chúng tôi trình bày các đánh giá trên một số tiêu chuẩn khác. Chúng tôi có nhiều tiêu chuẩn nội bộ hơn mà chúng tôi sẽ mở mã nguồn sớm.
359,82K