O que são Sistemas de Memória de Agentes?
A memória de um agente é como um agente de IA retém e recupera informação além de uma única janela de contexto: entre passos, sessões e tarefas. Costuma separar a memória de trabalho de curto prazo (o contexto atual) da memória de longo prazo (armazenamentos duráveis que o agente lê e escreve). A memória é o que permite a um agente carregar estado numa tarefa longa, lembrar de um usuário ao longo do tempo e evitar repetir trabalho. É uma camada central da engenharia de harness.
Definição
A memória de agente é o conjunto de mecanismos que um agente de IA usa para armazenar, organizar e recuperar informação além de sua janela de contexto imediata, abrangendo memória de trabalho de curto prazo e memória persistente de longo prazo.
Pontos-chave
- A memória estende um agente além de uma única janela de contexto finita.
- Memória de curto prazo (de trabalho) e de longo prazo (persistente) cumprem papéis distintos.
- A memória de longo prazo costuma ser recuperada sob demanda, como RAG sobre o histórico do agente.
- Uma boa memória evita repetir trabalho e perder estado em tarefas longas.
- O que escrever, manter e esquecer é uma decisão de design, não automática.
Contexto
A janela de contexto de um modelo é finita, então tudo o que um agente precise lembrar além dela precisa de um armazenamento externo. Sem memória, um agente esquece passos anteriores, repete ações e não consegue personalizar entre sessões.
A memória transforma um modelo sem estado num sistema com continuidade. O difícil é a curadoria: decidir o que vale anotar, como organizá-lo e como recuperar só o relevante agora, muito ligado à engenharia de contexto.
Arquitetura
Duas camadas: memória de trabalho (a janela de contexto atual, com a tarefa ativa) e memória de longo prazo (armazenamentos externos — vetorial, chave-valor, documental ou de grafo — escritos durante uma tarefa e recuperados depois). Alguns designs adicionam memória episódica (eventos), semântica (fatos) e procedural (habilidades).
O agente lê memórias relevantes ao contexto a cada passo e escreve novas conforme aprende. Políticas de recuperação, resumo e esquecimento mantêm a memória útil em vez de avassaladora.
Componentes
Benefícios
- Continuidade entre passos, sessões e tarefas.
- Personalização que persiste ao longo do tempo.
- Evita repetir trabalho e perder contexto.
- Habilita agentes com estado e de horizonte longo.
Riscos
- Memórias obsoletas ou erradas contaminam respostas futuras.
- Obrigações de privacidade e governança sobre os dados guardados.
- Recuperar memórias irrelevantes adiciona ruído.
- Crescimento sem limite sem consolidação nem expiração.
Ferramentas e tecnologias
Exemplos
- Um assistente que lembra as preferências de um usuário entre sessões.
- Um agente de longa duração que resume seu progresso para não repetir um passo.
- Um agente de suporte que lembra os chamados anteriores de um cliente quando relevante.
FAQs
- Como a memória de agente difere do RAG?
- O RAG recupera de uma base de conhecimento externa; a memória de agente recupera do próprio estado acumulado do agente. A maquinaria de recuperação é similar, mas a fonte e o caminho de escrita diferem.
- Qual a diferença entre memória de curto e longo prazo?
- A memória de curto prazo (de trabalho) é a janela de contexto viva para a tarefa atual; a de longo prazo é um armazenamento persistente que o agente lê e escreve entre tarefas e sessões.
- Por que não guardar tudo na janela de contexto?
- Janelas são finitas e a qualidade cai ao se encherem. Externalizar o estado para a memória e recuperar só o relevante mantém o agente focado e acessível.
- Quais são as preocupações de governança?
- A memória guardada pode conter dados pessoais ou sensíveis, então precisa de controle de acesso, limites de retenção e capacidade de corrigir ou apagar entradas.