Tópicos populares
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Ajustando Agentes LLM sem Ajustar LLMs!
Imagine melhorar o desempenho do seu agente de IA a partir da experiência sem nunca tocar nos pesos do modelo.
É exatamente como os humanos lembram episódios passados e aprendem com eles.
É precisamente isso que o Memento faz.
O conceito central:
Em vez de atualizar os pesos do LLM, o Memento aprende com experiências usando memória.
Reformula o aprendizado contínuo como aprendizado por reforço online baseado em memória sobre um MDP aumentado por memória.
Pense nisso como dar ao seu agente um caderno para lembrar o que funcionou e o que não funcionou!
Como funciona?
O sistema se divide em dois componentes principais:
1️⃣ Raciocínio Baseado em Casos (CBR) em ação:
Decompõe tarefas complexas em subtarefas e recupera experiências passadas relevantes.
Sem gradientes necessários, apenas recuperação inteligente de memória!
2️⃣ Executor
Executa cada subtarefa usando ferramentas MCP e registra os resultados na memória para referência futura.
Através do MCP, o executor pode realizar a maioria das tarefas do mundo real e tem acesso às seguintes ferramentas:
🔍 Pesquisa na web
📄 Manipulação de documentos
🐍 Execução segura de Python
📊 Análise de dados
🎥 Processamento de mídia
Achei que este é um caminho realmente bom para construir agentes semelhantes a humanos.
👉 Agora é a sua vez, quais são os seus pensamentos?
Compartilhei os links relevantes no próximo tweet!
_____
Compartilhe isso com sua rede se achou isso perspicaz ♻️
Me encontre → @akshay_pachaar para mais insights e tutoriais sobre IA e Aprendizado de Máquina!

64,82K
Top
Classificação
Favoritos