Ajustando Agentes LLM sem Ajustar LLMs! Imagine melhorar o desempenho do seu agente de IA a partir da experiência sem nunca tocar nos pesos do modelo. É exatamente como os humanos lembram episódios passados e aprendem com eles. É precisamente isso que o Memento faz. O conceito central: Em vez de atualizar os pesos do LLM, o Memento aprende com experiências usando memória. Reformula o aprendizado contínuo como aprendizado por reforço online baseado em memória sobre um MDP aumentado por memória. Pense nisso como dar ao seu agente um caderno para lembrar o que funcionou e o que não funcionou! Como funciona? O sistema se divide em dois componentes principais: 1️⃣ Raciocínio Baseado em Casos (CBR) em ação: Decompõe tarefas complexas em subtarefas e recupera experiências passadas relevantes. Sem gradientes necessários, apenas recuperação inteligente de memória! 2️⃣ Executor Executa cada subtarefa usando ferramentas MCP e registra os resultados na memória para referência futura. Através do MCP, o executor pode realizar a maioria das tarefas do mundo real e tem acesso às seguintes ferramentas: 🔍 Pesquisa na web 📄 Manipulação de documentos 🐍 Execução segura de Python 📊 Análise de dados 🎥 Processamento de mídia Achei que este é um caminho realmente bom para construir agentes semelhantes a humanos. 👉 Agora é a sua vez, quais são os seus pensamentos? Compartilhei os links relevantes no próximo tweet! _____ Compartilhe isso com sua rede se achou isso perspicaz ♻️ Me encontre → @akshay_pachaar para mais insights e tutoriais sobre IA e Aprendizado de Máquina!
64,82K