{
  "slug": "agent-memory",
  "category": "harness",
  "updated": "2026-06-21",
  "version": "1.0",
  "url": "https://santismm.com/en/knowledge/agent-memory",
  "urls": {
    "en": "https://santismm.com/en/knowledge/agent-memory",
    "es": "https://santismm.com/es/knowledge/agent-memory",
    "pt": "https://santismm.com/pt/knowledge/agent-memory"
  },
  "evidence": {
    "evidenceLevel": "industry_observation",
    "confidenceLevel": "high",
    "sourceType": [
      "industry_observation",
      "paper"
    ]
  },
  "references": [
    {
      "title": "Packer et al. — MemGPT: Towards LLMs as Operating Systems (2023)",
      "url": "https://arxiv.org/abs/2310.08560"
    },
    {
      "title": "Anthropic — Building Effective Agents (2024)",
      "url": "https://www.anthropic.com/research/building-effective-agents"
    }
  ],
  "related": [
    "harness-engineering",
    "context-engineering",
    "ai-agent",
    "enterprise-rag"
  ],
  "locales": {
    "en": {
      "title": "What are Agent Memory Systems?",
      "summary": "Agent memory is how an AI agent retains and recalls information beyond a single context window — across steps, sessions and tasks. It typically separates short-term working memory (the current context) from long-term memory (durable stores the agent reads from and writes to). Memory is what lets an agent carry state through a long task, remember a user over time, and avoid repeating work. It is a core layer of harness engineering.",
      "definition": "Agent memory is the set of mechanisms an AI agent uses to store, organize and retrieve information beyond its immediate context window, spanning short-term working memory and long-term persistent memory.",
      "takeaways": [
        "Memory extends an agent beyond a single finite context window.",
        "Short-term (working) vs long-term (persistent) memory serve different roles.",
        "Long-term memory is often retrieved on demand, like RAG over the agent's own history.",
        "Good memory prevents repeated work and lost state on long tasks.",
        "What to write, keep and forget is a design decision, not automatic."
      ],
      "context": [
        "A model's context window is finite, so anything an agent must remember beyond it needs an external store. Without memory, an agent forgets earlier steps, repeats actions and cannot personalize across sessions.",
        "Memory turns a stateless model into a system with continuity. The hard part is curation: deciding what is worth writing down, how to organize it, and how to retrieve only what is relevant now — closely tied to context engineering."
      ],
      "architecture": [
        "Two layers: working memory (the current context window, holding the active task) and long-term memory (external stores — vector, key-value, document or graph — written during a task and retrieved later). Some designs add episodic (events), semantic (facts) and procedural (skills) memory.",
        "The agent reads relevant memories into context at each step and writes new ones as it learns. Retrieval, summarization and forgetting policies keep memory useful rather than overwhelming."
      ],
      "components": [
        "Working memory",
        "Long-term store (vector/KV/graph)",
        "Write policy",
        "Retrieval policy",
        "Summarization / consolidation",
        "Forgetting / expiry"
      ],
      "pros": [
        "Continuity across steps, sessions and tasks.",
        "Personalization that persists over time.",
        "Avoids repeated work and lost context.",
        "Enables long-horizon, stateful agents."
      ],
      "risks": [
        "Stale or wrong memories poison future answers.",
        "Privacy and governance obligations on stored data.",
        "Retrieval of irrelevant memories adds noise.",
        "Unbounded growth without consolidation or expiry."
      ],
      "tools": [
        "Vector databases",
        "Key-value / document stores",
        "MemGPT-style memory managers",
        "Agent frameworks (LangGraph, Agents SDKs)"
      ],
      "examples": [
        "An assistant remembering a user's preferences across sessions.",
        "A long-running agent summarizing progress so it never repeats a step.",
        "A support agent recalling a customer's prior tickets when relevant."
      ],
      "faqs": [
        {
          "q": "How is agent memory different from RAG?",
          "a": "RAG retrieves from an external knowledge base; agent memory retrieves from the agent's own accumulated state. The retrieval machinery is similar, but the source and write path differ."
        },
        {
          "q": "What is the difference between short- and long-term memory?",
          "a": "Short-term (working) memory is the live context window for the current task; long-term memory is a persistent store the agent reads from and writes to across tasks and sessions."
        },
        {
          "q": "Why not keep everything in the context window?",
          "a": "Windows are finite and quality drops as they fill. Externalizing state to memory and retrieving only what is relevant keeps the agent focused and affordable."
        },
        {
          "q": "What are the governance concerns?",
          "a": "Stored memory may contain personal or sensitive data, so it needs access control, retention limits and the ability to correct or delete entries."
        }
      ]
    },
    "es": {
      "title": "¿Qué son los Sistemas de Memoria de Agentes?",
      "summary": "La memoria de un agente es cómo un agente de IA retiene y recuerda información más allá de una sola ventana de contexto: entre pasos, sesiones y tareas. Suele separar la memoria de trabajo a corto plazo (el contexto actual) de la memoria a largo plazo (almacenes duraderos que el agente lee y escribe). La memoria es lo que permite a un agente arrastrar estado en una tarea larga, recordar a un usuario en el tiempo y evitar repetir trabajo. Es una capa central de la ingeniería de harness.",
      "definition": "La memoria de agente es el conjunto de mecanismos que un agente de IA usa para almacenar, organizar y recuperar información más allá de su ventana de contexto inmediata, abarcando memoria de trabajo a corto plazo y memoria persistente a largo plazo.",
      "takeaways": [
        "La memoria extiende a un agente más allá de una sola ventana de contexto finita.",
        "La memoria a corto plazo (de trabajo) y a largo plazo (persistente) cumplen roles distintos.",
        "La memoria a largo plazo suele recuperarse bajo demanda, como RAG sobre el historial del agente.",
        "Una buena memoria evita repetir trabajo y perder estado en tareas largas.",
        "Qué escribir, conservar y olvidar es una decisión de diseño, no automática."
      ],
      "context": [
        "La ventana de contexto de un modelo es finita, así que todo lo que un agente deba recordar más allá de ella necesita un almacén externo. Sin memoria, un agente olvida pasos previos, repite acciones y no puede personalizar entre sesiones.",
        "La memoria convierte un modelo sin estado en un sistema con continuidad. Lo difícil es la curación: decidir qué merece anotarse, cómo organizarlo y cómo recuperar solo lo relevante ahora, muy ligado a la ingeniería de contexto."
      ],
      "architecture": [
        "Dos capas: memoria de trabajo (la ventana de contexto actual, con la tarea activa) y memoria a largo plazo (almacenes externos —vectorial, clave-valor, documental o de grafo— escritos durante una tarea y recuperados después). Algunos diseños añaden memoria episódica (eventos), semántica (hechos) y procedimental (habilidades).",
        "El agente lee memorias relevantes al contexto en cada paso y escribe nuevas a medida que aprende. Las políticas de recuperación, resumen y olvido mantienen la memoria útil en vez de abrumadora."
      ],
      "components": [
        "Memoria de trabajo",
        "Almacén a largo plazo (vectorial/KV/grafo)",
        "Política de escritura",
        "Política de recuperación",
        "Resumen / consolidación",
        "Olvido / expiración"
      ],
      "pros": [
        "Continuidad entre pasos, sesiones y tareas.",
        "Personalización que persiste en el tiempo.",
        "Evita repetir trabajo y perder contexto.",
        "Habilita agentes con estado y de horizonte largo."
      ],
      "risks": [
        "Memorias obsoletas o erróneas contaminan respuestas futuras.",
        "Obligaciones de privacidad y gobernanza sobre los datos guardados.",
        "Recuperar memorias irrelevantes añade ruido.",
        "Crecimiento sin límite sin consolidación ni expiración."
      ],
      "tools": [
        "Bases de datos vectoriales",
        "Almacenes clave-valor / documentales",
        "Gestores de memoria estilo MemGPT",
        "Frameworks de agentes (LangGraph, SDKs de agentes)"
      ],
      "examples": [
        "Un asistente que recuerda las preferencias de un usuario entre sesiones.",
        "Un agente de larga duración que resume su progreso para no repetir un paso.",
        "Un agente de soporte que recuerda los tickets previos de un cliente cuando es relevante."
      ],
      "faqs": [
        {
          "q": "¿En qué se diferencia la memoria de agente de RAG?",
          "a": "RAG recupera de una base de conocimiento externa; la memoria de agente recupera del propio estado acumulado del agente. La maquinaria de recuperación es similar, pero la fuente y la ruta de escritura difieren."
        },
        {
          "q": "¿Cuál es la diferencia entre memoria a corto y largo plazo?",
          "a": "La memoria a corto plazo (de trabajo) es la ventana de contexto viva para la tarea actual; la de largo plazo es un almacén persistente que el agente lee y escribe entre tareas y sesiones."
        },
        {
          "q": "¿Por qué no guardar todo en la ventana de contexto?",
          "a": "Las ventanas son finitas y la calidad cae al llenarse. Externalizar el estado a memoria y recuperar solo lo relevante mantiene al agente enfocado y asequible."
        },
        {
          "q": "¿Cuáles son las preocupaciones de gobernanza?",
          "a": "La memoria guardada puede contener datos personales o sensibles, así que necesita control de acceso, límites de retención y capacidad de corregir o borrar entradas."
        }
      ]
    },
    "pt": {
      "title": "O que são Sistemas de Memória de Agentes?",
      "summary": "A memória de um agente é como um agente de IA retém e recupera informação além de uma única janela de contexto: entre passos, sessões e tarefas. Costuma separar a memória de trabalho de curto prazo (o contexto atual) da memória de longo prazo (armazenamentos duráveis que o agente lê e escreve). A memória é o que permite a um agente carregar estado numa tarefa longa, lembrar de um usuário ao longo do tempo e evitar repetir trabalho. É uma camada central da engenharia de harness.",
      "definition": "A memória de agente é o conjunto de mecanismos que um agente de IA usa para armazenar, organizar e recuperar informação além de sua janela de contexto imediata, abrangendo memória de trabalho de curto prazo e memória persistente de longo prazo.",
      "takeaways": [
        "A memória estende um agente além de uma única janela de contexto finita.",
        "Memória de curto prazo (de trabalho) e de longo prazo (persistente) cumprem papéis distintos.",
        "A memória de longo prazo costuma ser recuperada sob demanda, como RAG sobre o histórico do agente.",
        "Uma boa memória evita repetir trabalho e perder estado em tarefas longas.",
        "O que escrever, manter e esquecer é uma decisão de design, não automática."
      ],
      "context": [
        "A janela de contexto de um modelo é finita, então tudo o que um agente precise lembrar além dela precisa de um armazenamento externo. Sem memória, um agente esquece passos anteriores, repete ações e não consegue personalizar entre sessões.",
        "A memória transforma um modelo sem estado num sistema com continuidade. O difícil é a curadoria: decidir o que vale anotar, como organizá-lo e como recuperar só o relevante agora, muito ligado à engenharia de contexto."
      ],
      "architecture": [
        "Duas camadas: memória de trabalho (a janela de contexto atual, com a tarefa ativa) e memória de longo prazo (armazenamentos externos — vetorial, chave-valor, documental ou de grafo — escritos durante uma tarefa e recuperados depois). Alguns designs adicionam memória episódica (eventos), semântica (fatos) e procedural (habilidades).",
        "O agente lê memórias relevantes ao contexto a cada passo e escreve novas conforme aprende. Políticas de recuperação, resumo e esquecimento mantêm a memória útil em vez de avassaladora."
      ],
      "components": [
        "Memória de trabalho",
        "Armazenamento de longo prazo (vetorial/KV/grafo)",
        "Política de escrita",
        "Política de recuperação",
        "Resumo / consolidação",
        "Esquecimento / expiração"
      ],
      "pros": [
        "Continuidade entre passos, sessões e tarefas.",
        "Personalização que persiste ao longo do tempo.",
        "Evita repetir trabalho e perder contexto.",
        "Habilita agentes com estado e de horizonte longo."
      ],
      "risks": [
        "Memórias obsoletas ou erradas contaminam respostas futuras.",
        "Obrigações de privacidade e governança sobre os dados guardados.",
        "Recuperar memórias irrelevantes adiciona ruído.",
        "Crescimento sem limite sem consolidação nem expiração."
      ],
      "tools": [
        "Bancos de dados vetoriais",
        "Armazenamentos chave-valor / documentais",
        "Gerenciadores de memória estilo MemGPT",
        "Frameworks de agentes (LangGraph, SDKs de agentes)"
      ],
      "examples": [
        "Um assistente que lembra as preferências de um usuário entre sessões.",
        "Um agente de longa duração que resume seu progresso para não repetir um passo.",
        "Um agente de suporte que lembra os chamados anteriores de um cliente quando relevante."
      ],
      "faqs": [
        {
          "q": "Como a memória de agente difere do RAG?",
          "a": "O RAG recupera de uma base de conhecimento externa; a memória de agente recupera do próprio estado acumulado do agente. A maquinaria de recuperação é similar, mas a fonte e o caminho de escrita diferem."
        },
        {
          "q": "Qual a diferença entre memória de curto e longo prazo?",
          "a": "A memória de curto prazo (de trabalho) é a janela de contexto viva para a tarefa atual; a de longo prazo é um armazenamento persistente que o agente lê e escreve entre tarefas e sessões."
        },
        {
          "q": "Por que não guardar tudo na janela de contexto?",
          "a": "Janelas são finitas e a qualidade cai ao se encherem. Externalizar o estado para a memória e recuperar só o relevante mantém o agente focado e acessível."
        },
        {
          "q": "Quais são as preocupações de governança?",
          "a": "A memória guardada pode conter dados pessoais ou sensíveis, então precisa de controle de acesso, limites de retenção e capacidade de corrigir ou apagar entradas."
        }
      ]
    }
  }
}