Como a memória de agente difere do RAG?

O RAG recupera de uma base de conhecimento externa; a memória de agente recupera do próprio estado acumulado do agente. A maquinaria de recuperação é similar, mas a fonte e o caminho de escrita diferem.

Qual a diferença entre memória de curto e longo prazo?

A memória de curto prazo (de trabalho) é a janela de contexto viva para a tarefa atual; a de longo prazo é um armazenamento persistente que o agente lê e escreve entre tarefas e sessões.

Por que não guardar tudo na janela de contexto?

Janelas são finitas e a qualidade cai ao se encherem. Externalizar o estado para a memória e recuperar só o relevante mantém o agente focado e acessível.

Quais são as preocupações de governança?

A memória guardada pode conter dados pessoais ou sensíveis, então precisa de controle de acesso, limites de retenção e capacidade de corrigir ou apagar entradas.

Harness EngineeringAtualizado 2026-06-21 · Versão 1.0

O que são Sistemas de Memória de Agentes?

A memória de um agente é como um agente de IA retém e recupera informação além de uma única janela de contexto: entre passos, sessões e tarefas. Costuma separar a memória de trabalho de curto prazo (o contexto atual) da memória de longo prazo (armazenamentos duráveis que o agente lê e escreve). A memória é o que permite a um agente carregar estado numa tarefa longa, lembrar de um usuário ao longo do tempo e evitar repetir trabalho. É uma camada central da engenharia de harness.

Legível por máquina: JSON

Definição

A memória de agente é o conjunto de mecanismos que um agente de IA usa para armazenar, organizar e recuperar informação além de sua janela de contexto imediata, abrangendo memória de trabalho de curto prazo e memória persistente de longo prazo.

Pontos-chave

A memória estende um agente além de uma única janela de contexto finita.
Memória de curto prazo (de trabalho) e de longo prazo (persistente) cumprem papéis distintos.
A memória de longo prazo costuma ser recuperada sob demanda, como RAG sobre o histórico do agente.
Uma boa memória evita repetir trabalho e perder estado em tarefas longas.
O que escrever, manter e esquecer é uma decisão de design, não automática.

Contexto

A janela de contexto de um modelo é finita, então tudo o que um agente precise lembrar além dela precisa de um armazenamento externo. Sem memória, um agente esquece passos anteriores, repete ações e não consegue personalizar entre sessões.

A memória transforma um modelo sem estado num sistema com continuidade. O difícil é a curadoria: decidir o que vale anotar, como organizá-lo e como recuperar só o relevante agora, muito ligado à engenharia de contexto.

Arquitetura

Duas camadas: memória de trabalho (a janela de contexto atual, com a tarefa ativa) e memória de longo prazo (armazenamentos externos — vetorial, chave-valor, documental ou de grafo — escritos durante uma tarefa e recuperados depois). Alguns designs adicionam memória episódica (eventos), semântica (fatos) e procedural (habilidades).

O agente lê memórias relevantes ao contexto a cada passo e escreve novas conforme aprende. Políticas de recuperação, resumo e esquecimento mantêm a memória útil em vez de avassaladora.

Componentes

Memória de trabalhoArmazenamento de longo prazo (vetorial/KV/grafo)Política de escritaPolítica de recuperaçãoResumo / consolidaçãoEsquecimento / expiração

Benefícios

Continuidade entre passos, sessões e tarefas.
Personalização que persiste ao longo do tempo.
Evita repetir trabalho e perder contexto.
Habilita agentes com estado e de horizonte longo.

Riscos

Memórias obsoletas ou erradas contaminam respostas futuras.
Obrigações de privacidade e governança sobre os dados guardados.
Recuperar memórias irrelevantes adiciona ruído.
Crescimento sem limite sem consolidação nem expiração.

Ferramentas e tecnologias

Bancos de dados vetoriaisArmazenamentos chave-valor / documentaisGerenciadores de memória estilo MemGPTFrameworks de agentes (LangGraph, SDKs de agentes)

Exemplos

Um assistente que lembra as preferências de um usuário entre sessões.
Um agente de longa duração que resume seu progresso para não repetir um passo.
Um agente de suporte que lembra os chamados anteriores de um cliente quando relevante.

FAQs

Como a memória de agente difere do RAG?: O RAG recupera de uma base de conhecimento externa; a memória de agente recupera do próprio estado acumulado do agente. A maquinaria de recuperação é similar, mas a fonte e o caminho de escrita diferem.
Qual a diferença entre memória de curto e longo prazo?: A memória de curto prazo (de trabalho) é a janela de contexto viva para a tarefa atual; a de longo prazo é um armazenamento persistente que o agente lê e escreve entre tarefas e sessões.
Por que não guardar tudo na janela de contexto?: Janelas são finitas e a qualidade cai ao se encherem. Externalizar o estado para a memória e recuperar só o relevante mantém o agente focado e acessível.
Quais são as preocupações de governança?: A memória guardada pode conter dados pessoais ou sensíveis, então precisa de controle de acesso, limites de retenção e capacidade de corrigir ou apagar entradas.