Harness EngineeringAtualizado 2026-06-21 · Versão 1.0

O que são Sistemas de Memória de Agentes?

A memória de um agente é como um agente de IA retém e recupera informação além de uma única janela de contexto: entre passos, sessões e tarefas. Costuma separar a memória de trabalho de curto prazo (o contexto atual) da memória de longo prazo (armazenamentos duráveis que o agente lê e escreve). A memória é o que permite a um agente carregar estado numa tarefa longa, lembrar de um usuário ao longo do tempo e evitar repetir trabalho. É uma camada central da engenharia de harness.

Definição

A memória de agente é o conjunto de mecanismos que um agente de IA usa para armazenar, organizar e recuperar informação além de sua janela de contexto imediata, abrangendo memória de trabalho de curto prazo e memória persistente de longo prazo.

Pontos-chave

  • A memória estende um agente além de uma única janela de contexto finita.
  • Memória de curto prazo (de trabalho) e de longo prazo (persistente) cumprem papéis distintos.
  • A memória de longo prazo costuma ser recuperada sob demanda, como RAG sobre o histórico do agente.
  • Uma boa memória evita repetir trabalho e perder estado em tarefas longas.
  • O que escrever, manter e esquecer é uma decisão de design, não automática.

Contexto

A janela de contexto de um modelo é finita, então tudo o que um agente precise lembrar além dela precisa de um armazenamento externo. Sem memória, um agente esquece passos anteriores, repete ações e não consegue personalizar entre sessões.

A memória transforma um modelo sem estado num sistema com continuidade. O difícil é a curadoria: decidir o que vale anotar, como organizá-lo e como recuperar só o relevante agora, muito ligado à engenharia de contexto.

Arquitetura

Duas camadas: memória de trabalho (a janela de contexto atual, com a tarefa ativa) e memória de longo prazo (armazenamentos externos — vetorial, chave-valor, documental ou de grafo — escritos durante uma tarefa e recuperados depois). Alguns designs adicionam memória episódica (eventos), semântica (fatos) e procedural (habilidades).

O agente lê memórias relevantes ao contexto a cada passo e escreve novas conforme aprende. Políticas de recuperação, resumo e esquecimento mantêm a memória útil em vez de avassaladora.

Componentes

Memória de trabalhoArmazenamento de longo prazo (vetorial/KV/grafo)Política de escritaPolítica de recuperaçãoResumo / consolidaçãoEsquecimento / expiração

Benefícios

  • Continuidade entre passos, sessões e tarefas.
  • Personalização que persiste ao longo do tempo.
  • Evita repetir trabalho e perder contexto.
  • Habilita agentes com estado e de horizonte longo.

Riscos

  • Memórias obsoletas ou erradas contaminam respostas futuras.
  • Obrigações de privacidade e governança sobre os dados guardados.
  • Recuperar memórias irrelevantes adiciona ruído.
  • Crescimento sem limite sem consolidação nem expiração.

Ferramentas e tecnologias

Bancos de dados vetoriaisArmazenamentos chave-valor / documentaisGerenciadores de memória estilo MemGPTFrameworks de agentes (LangGraph, SDKs de agentes)

Exemplos

  • Um assistente que lembra as preferências de um usuário entre sessões.
  • Um agente de longa duração que resume seu progresso para não repetir um passo.
  • Um agente de suporte que lembra os chamados anteriores de um cliente quando relevante.

FAQs

Como a memória de agente difere do RAG?
O RAG recupera de uma base de conhecimento externa; a memória de agente recupera do próprio estado acumulado do agente. A maquinaria de recuperação é similar, mas a fonte e o caminho de escrita diferem.
Qual a diferença entre memória de curto e longo prazo?
A memória de curto prazo (de trabalho) é a janela de contexto viva para a tarefa atual; a de longo prazo é um armazenamento persistente que o agente lê e escreve entre tarefas e sessões.
Por que não guardar tudo na janela de contexto?
Janelas são finitas e a qualidade cai ao se encherem. Externalizar o estado para a memória e recuperar só o relevante mantém o agente focado e acessível.
Quais são as preocupações de governança?
A memória guardada pode conter dados pessoais ou sensíveis, então precisa de controle de acesso, limites de retenção e capacidade de corrigir ou apagar entradas.

Referências