Uma técnica simples torna o RAG até 40x mais rápido e 32x eficiente em termos de memória! - Perplexidade o usa em seu índice de pesquisa - O Google o usa no mecanismo Vertex RAG - O Azure o usa em seu pipeline de pesquisa Vamos entender como usá-lo em um sistema RAG (com código):
501,1K