¿En qué se diferencia de la ingeniería de prompts?

La ingeniería de prompts crea una sola instrucción. La ingeniería de contexto gestiona todo el conjunto de información en la ventana a lo largo de una ejecución de agente, incluyendo recuperación, memoria, resultados de herramientas y compresión.

¿Por qué no usar simplemente una ventana de contexto más grande?

Las ventanas más grandes ayudan pero no eliminan el problema: la calidad y el coste se degradan al llenarse de tokens de baja señal. La curación sigue ganando.

¿Cómo se relaciona con RAG y la memoria?

RAG y la memoria son fuentes de contexto; la ingeniería de contexto decide qué de ellas entra realmente en la ventana, cuándo y en qué forma.

¿Es parte de la ingeniería de harness?

Sí. La gestión de contexto es una de las capas centrales del harness que convierte la capacidad del modelo en comportamiento fiable del agente.

Harness EngineeringActualizado 2026-06-21 · Versión 1.0

¿Qué es la Ingeniería de Contexto (Context Engineering)?

La ingeniería de contexto es la disciplina de decidir qué información entra en la ventana de contexto limitada de un modelo en cada paso, y qué se queda fuera. Como los agentes se ejecutan en muchos pasos, meter todo ingenuamente en el contexto degrada calidad y coste. La ingeniería de contexto cura las instrucciones, el conocimiento recuperado, los resultados de herramientas y la memoria adecuados para que el modelo tenga justo lo que necesita cuando lo necesita. Es una parte central de la ingeniería de harness.

Legible por máquina: JSON

Definición

La ingeniería de contexto es la práctica de curar, comprimir y secuenciar la información que se coloca en la ventana de contexto de un modelo para que tenga la señal más relevante —y el menor ruido— en cada paso.

Puntos clave

El contexto es un recurso escaso; lo que dejas fuera importa tanto como lo que incluyes.
Más contexto no es mejor: los tokens irrelevantes degradan calidad y suben el coste.
Técnicas: recuperación, resumen, compactación y memoria estructurada.
Generaliza la ingeniería de prompts de un prompt a toda una ejecución de agente.
Es una capa central del harness alrededor del modelo.

Contexto

Todo modelo tiene una ventana de contexto finita, y la calidad se degrada cuando se llena de contenido de baja señal. En uso de un solo turno es manejable, pero los agentes acumulan historial, salidas de herramientas y documentos recuperados a lo largo de muchos pasos, saturando rápido la ventana.

La ingeniería de contexto trata la ventana como un presupuesto a gestionar de forma deliberada: conservar las instrucciones duraderas, recuperar solo lo relevante ahora, resumir o compactar el resto y guardar el estado a largo plazo fuera de la ventana en memoria.

Arquitectura

Movimientos clave: seleccionar (recuperar solo pasajes relevantes), comprimir (resumir pasos previos), compactar (descartar o plegar turnos obsoletos) y externalizar (llevar el estado a largo plazo a un almacén de memoria y traerlo bajo demanda).

En un bucle de agente, el contexto se reensambla en cada paso desde fuentes en capas: instrucciones de sistema estables, estado de la tarea, conocimiento recuperado relevante, resultados recientes de herramientas y memorias a largo plazo seleccionadas, ordenadas para que la señal más importante sea la más saliente.

Componentes

Instrucciones de sistemaEstado de la tareaConocimiento recuperadoResultados de herramientasMemoria a largo plazoResúmenes / compactación

Beneficios

Mantiene alta la calidad cuando las tareas se alargan.
Controla el coste de tokens y la latencia.
Reduce la distracción y la alucinación por ruido.
Habilita agentes de horizonte largo dentro de un contexto finito.

Riesgos

Una compresión demasiado agresiva puede descartar información necesaria.
Una recuperación pobre inyecta contexto irrelevante o erróneo.
Complejidad al decidir qué conservar en cada paso.
Los errores aquí aparecen como regresiones sutiles de calidad.

Herramientas y tecnologías

Pipelines de recuperación / RAGModelos de resumenAlmacenes de memoriaFrameworks de gestión de contexto (p. ej. LangGraph)

Ejemplos

Resumir pasos anteriores del agente para que la ventana siga enfocada en la subtarea actual.
Recuperar solo la sección de la política relevante a una pregunta en vez de todo el manual.
Guardar las preferencias de un usuario en memoria y recordarlas solo cuando son relevantes.

FAQs

¿En qué se diferencia de la ingeniería de prompts?: La ingeniería de prompts crea una sola instrucción. La ingeniería de contexto gestiona todo el conjunto de información en la ventana a lo largo de una ejecución de agente, incluyendo recuperación, memoria, resultados de herramientas y compresión.
¿Por qué no usar simplemente una ventana de contexto más grande?: Las ventanas más grandes ayudan pero no eliminan el problema: la calidad y el coste se degradan al llenarse de tokens de baja señal. La curación sigue ganando.
¿Cómo se relaciona con RAG y la memoria?: RAG y la memoria son fuentes de contexto; la ingeniería de contexto decide qué de ellas entra realmente en la ventana, cuándo y en qué forma.
¿Es parte de la ingeniería de harness?: Sí. La gestión de contexto es una de las capas centrales del harness que convierte la capacidad del modelo en comportamiento fiable del agente.