Представляем Exa 2.0 Прорывы в наших исследованиях и инженерии в области ИИ позволили нам создать как самый быстрый API поиска (<350 мс), так и поиск самого высокого качества на рынке. Ниже подробности о продукте и технические аспекты:
Единственная миссия Exa заключается в создании идеальной поисковой системы. Системы, которая всегда возвращает именно ту информацию, которая вам нужна, так быстро, как это физически возможно, доступной через бесшовный API. Exa 2.0 — это большой шаг к этой цели.
Чтобы создать Exa 2.0, нам сначала нужно было расширить наш индекс. Теперь мы обслуживаем десятки миллиардов веб-страниц и обновляем их каждую минуту. Затем мы предварительно обучили и дообучили модель встраивания для точного семантического поиска по этому индексу. Exa 2.0 обучалась более месяца на нашем кластере 144x H200 и использует новые архитектуры встраивания, которые мы открыли за последние 6 месяцев. Чтобы обслуживать эти встраивания с наименьшей задержкой в мире, потребовались серьезные обновления нашей внутренней векторной базы данных. Некоторые примеры включают новые алгоритмы кластеризации, лексическую компрессию и оптимизацию сборки. Все на Rust, конечно же :)
Первое обновление — Exa Fast. Exa Fast теперь достигает <350 мс e2e P50 задержки, на 30% ниже, чем у следующего по скорости API. Наши клиенты используют его для реализации особенно чувствительных к задержке случаев использования AI.
Второй — это Exa Deep. Exa Deep разработан для поиска информации самого высокого качества. Он активно ищет, обрабатывает, а затем снова ищет, чтобы достичь этой цели. Exa Deep превосходит почти все критерии, которые мы ему ставим.
Поиск — это очень разнообразная область проблем. Эталоны, такие как SimpleQA и FRAMES, полезны, но упускают многое из того, что имеет значение для поиска с использованием ИИ. Здесь мы показываем оценки по некоторым другим эталонам. У нас есть много других внутренних, которые мы скоро откроем.
359,82K