Presentamos Exa 2.0 Los avances en nuestra investigación e ingeniería de IA nos han permitido crear tanto la API de búsqueda más rápida (<350 ms) como la búsqueda de mayor calidad del mercado. Inmersión profunda técnica y de productos a continuación:
La única misión de Exa es construir un motor de búsqueda perfecto. Uno que siempre devuelve exactamente la información que necesita lo más rápido posible físicamente, disponible a través de una API perfecta. Exa 2.0 es un gran paso hacia ese objetivo.
Para construir Exa 2.0, primero necesitábamos expandir nuestro índice. Ahora servimos decenas de miles de millones de páginas web y las actualizamos cada minuto. A continuación, entrenamos previamente y ajustamos un modelo de incrustación para una búsqueda semántica precisa en ese índice. Exa 2.0 se entrenó durante más de un mes en nuestro clúster H200 de 144x y utiliza nuevas arquitecturas de incrustación que hemos descubierto en los últimos 6 meses. Para servir estas incrustaciones con la latencia más baja del mundo, se requirieron actualizaciones importantes en nuestra base de datos vectorial interna. Algunos ejemplos son los nuevos algoritmos de agrupación en clústeres, la compresión léxica y las optimizaciones de ensamblaje. Todo en Rust, por supuesto, :)
La primera actualización es Exa Fast. Exa Fast ahora alcanza una latencia e2e P50 de <350 ms, un 30% más baja que la siguiente API más rápida. Nuestros clientes lo están utilizando para impulsar casos de uso de IA particularmente sensibles a la latencia.
El segundo es Exa Deep. Exa Deep está diseñado para encontrar información de la más alta calidad posible. Busca, procesa y luego vuelve a buscar para hacerlo. Exa Deep encabeza casi todos los puntos de referencia que le lanzamos.
La búsqueda es un espacio problemático muy diverso. Los puntos de referencia como SimpleQA y FRAMES son útiles, pero pierden gran parte de lo que importa para la búsqueda de IA. Aquí mostramos evaluaciones en algunos otros puntos de referencia. Tenemos muchos más internos que abriremos pronto.
359.81K