Знайомство з Exa 2.0 Прориви в наших дослідженнях та інженерії штучного інтелекту дозволили нам створити як найшвидший пошуковий API у світі (<350 мс), так і найякісніший пошук на ринку. Глибоке занурення в продукт і техніку нижче:
Єдина місія Exa – створити ідеальну пошукову систему. Такий, який завжди повертає саме ту інформацію, яка вам потрібна, якомога швидше, доступна через безшовний API. Exa 2.0 – це великий крок на шляху до цієї мети.
Щоб створити Exa 2.0, нам спочатку потрібно було розширити наш індекс. Зараз ми обслуговуємо десятки мільярдів веб-сторінок і оновлюємо їх щохвилини. Далі ми попередньо підготували та налаштували модель вбудовування для точного семантичного пошуку за цим індексом. Exa 2.0 навчалася більше місяця на нашому кластері H200 з 144x і використовує нові архітектури вбудовування, які ми виявили за останні 6 місяців. Щоб обслуговувати ці вбудовування з найнижчою затримкою у світі, потрібно було серйозно оновити нашу внутрішню векторну базу даних. Деякі приклади – нові алгоритми кластеризації, лексичне стиснення та оптимізація збірки. Все в Rust, звичайно ж, :)
Перше оновлення – Exa Fast. Exa Fast тепер досягає затримки <350 мс e2e P50, що на 30% нижче, ніж у наступного найшвидшого API. Наші клієнти використовують його для використання штучного інтелекту, особливо чутливого до затримки.
Другий – Exa Deep. Exa Deep призначений для пошуку інформації найвищої якості. Він агентально шукає, обробляє, а потім знову шукає, щоб зробити це. Exa Deep очолює майже всі тести, які ми на нього кидаємо.
Пошук – це дуже різноманітний проблемний простір. Такі тести, як SimpleQA та FRAMES, корисні, але пропускають багато з того, що важливо для пошуку за допомогою штучного інтелекту. Тут ми показуємо evals на деяких інших бенчмарках. У нас є ще багато внутрішніх, з вихідним кодом яких ми скоро відкриємо.
213