Harness EngineeringActualizado 2026-06-21 · Versión 1.0

¿Qué son los Sistemas de Memoria de Agentes?

La memoria de un agente es cómo un agente de IA retiene y recuerda información más allá de una sola ventana de contexto: entre pasos, sesiones y tareas. Suele separar la memoria de trabajo a corto plazo (el contexto actual) de la memoria a largo plazo (almacenes duraderos que el agente lee y escribe). La memoria es lo que permite a un agente arrastrar estado en una tarea larga, recordar a un usuario en el tiempo y evitar repetir trabajo. Es una capa central de la ingeniería de harness.

Definición

La memoria de agente es el conjunto de mecanismos que un agente de IA usa para almacenar, organizar y recuperar información más allá de su ventana de contexto inmediata, abarcando memoria de trabajo a corto plazo y memoria persistente a largo plazo.

Puntos clave

  • La memoria extiende a un agente más allá de una sola ventana de contexto finita.
  • La memoria a corto plazo (de trabajo) y a largo plazo (persistente) cumplen roles distintos.
  • La memoria a largo plazo suele recuperarse bajo demanda, como RAG sobre el historial del agente.
  • Una buena memoria evita repetir trabajo y perder estado en tareas largas.
  • Qué escribir, conservar y olvidar es una decisión de diseño, no automática.

Contexto

La ventana de contexto de un modelo es finita, así que todo lo que un agente deba recordar más allá de ella necesita un almacén externo. Sin memoria, un agente olvida pasos previos, repite acciones y no puede personalizar entre sesiones.

La memoria convierte un modelo sin estado en un sistema con continuidad. Lo difícil es la curación: decidir qué merece anotarse, cómo organizarlo y cómo recuperar solo lo relevante ahora, muy ligado a la ingeniería de contexto.

Arquitectura

Dos capas: memoria de trabajo (la ventana de contexto actual, con la tarea activa) y memoria a largo plazo (almacenes externos —vectorial, clave-valor, documental o de grafo— escritos durante una tarea y recuperados después). Algunos diseños añaden memoria episódica (eventos), semántica (hechos) y procedimental (habilidades).

El agente lee memorias relevantes al contexto en cada paso y escribe nuevas a medida que aprende. Las políticas de recuperación, resumen y olvido mantienen la memoria útil en vez de abrumadora.

Componentes

Memoria de trabajoAlmacén a largo plazo (vectorial/KV/grafo)Política de escrituraPolítica de recuperaciónResumen / consolidaciónOlvido / expiración

Beneficios

  • Continuidad entre pasos, sesiones y tareas.
  • Personalización que persiste en el tiempo.
  • Evita repetir trabajo y perder contexto.
  • Habilita agentes con estado y de horizonte largo.

Riesgos

  • Memorias obsoletas o erróneas contaminan respuestas futuras.
  • Obligaciones de privacidad y gobernanza sobre los datos guardados.
  • Recuperar memorias irrelevantes añade ruido.
  • Crecimiento sin límite sin consolidación ni expiración.

Herramientas y tecnologías

Bases de datos vectorialesAlmacenes clave-valor / documentalesGestores de memoria estilo MemGPTFrameworks de agentes (LangGraph, SDKs de agentes)

Ejemplos

  • Un asistente que recuerda las preferencias de un usuario entre sesiones.
  • Un agente de larga duración que resume su progreso para no repetir un paso.
  • Un agente de soporte que recuerda los tickets previos de un cliente cuando es relevante.

FAQs

¿En qué se diferencia la memoria de agente de RAG?
RAG recupera de una base de conocimiento externa; la memoria de agente recupera del propio estado acumulado del agente. La maquinaria de recuperación es similar, pero la fuente y la ruta de escritura difieren.
¿Cuál es la diferencia entre memoria a corto y largo plazo?
La memoria a corto plazo (de trabajo) es la ventana de contexto viva para la tarea actual; la de largo plazo es un almacén persistente que el agente lee y escribe entre tareas y sesiones.
¿Por qué no guardar todo en la ventana de contexto?
Las ventanas son finitas y la calidad cae al llenarse. Externalizar el estado a memoria y recuperar solo lo relevante mantiene al agente enfocado y asequible.
¿Cuáles son las preocupaciones de gobernanza?
La memoria guardada puede contener datos personales o sensibles, así que necesita control de acceso, límites de retención y capacidad de corregir o borrar entradas.

Referencias