Einführung von Exa 2.0 Durchbrüche in unserer AI-Forschung und -Ingenieurwesen haben es uns ermöglicht, sowohl die schnellste Such-API (<350ms) als auch die höchste Suchqualität auf dem Markt zu entwickeln. Produkt- und technische Vertiefung unten:
Exas einziges Ziel ist es, eine perfekte Suchmaschine zu entwickeln. Eine, die immer genau die Informationen zurückgibt, die Sie benötigen, so schnell wie physisch möglich, verfügbar über eine nahtlose API. Exa 2.0 ist ein großer Schritt in Richtung dieses Ziels.
Um Exa 2.0 zu entwickeln, mussten wir zunächst unser Index erweitern. Wir bedienen jetzt zig Milliarden von Webseiten und aktualisieren sie jede Minute. Als nächstes haben wir ein Embedding-Modell vortrainiert und feinabgestimmt, um eine präzise semantische Suche über diesen Index zu ermöglichen. Exa 2.0 wurde über einen Monat auf unserem 144x H200-Cluster trainiert und verwendet neue Embedding-Architekturen, die wir in den letzten 6 Monaten entdeckt haben. Um diese Embeddings mit der niedrigsten Latenz der Welt bereitzustellen, waren umfangreiche Aktualisierungen unserer hauseigenen Vektordatenbank erforderlich. Einige Beispiele sind neue Cluster-Algorithmen, lexikalische Kompression und Optimierungen bei der Zusammenstellung. Alles natürlich in Rust :)
Das erste Update ist Exa Fast. Exa Fast erreicht jetzt eine End-to-End-P50-Latenz von <350 ms, 30 % niedriger als die nächstschnellste API. Unsere Kunden nutzen es, um besonders latenzempfindliche AI-Anwendungsfälle zu unterstützen.
Zweitens ist Exa Deep. Exa Deep wurde entwickelt, um die hochwertigsten Informationen zu finden. Es sucht agentisch, verarbeitet und sucht dann erneut, um dies zu erreichen. Exa Deep übertrifft nahezu jeden Benchmark, den wir ihm vorlegen.
Die Suche ist ein sehr vielfältiger Problembereich. Benchmarks wie SimpleQA und FRAMES sind hilfreich, erfassen jedoch viel von dem, was für die KI-Suche wichtig ist. Hier zeigen wir Auswertungen zu einigen anderen Benchmarks. Wir haben viele weitere interne, die wir bald Open Source stellen werden.
359,81K