OrquestaciónActualizado 2026-06-21 · Versión 1.0

Encadenamiento de Prompts (Prompt Chaining)

El encadenamiento de prompts descompone una tarea en una secuencia fija de llamadas al LLM, donde cada paso trabaja sobre la salida del anterior. Cambia algo de latencia por mucha más precisión y control, y es el patrón de flujo más simple: úsalo cuando una tarea se divide limpiamente en subtareas ordenadas.

Evidencia: Observación del sectorConfianza: AltaFuente: Observación del sectorFuente: Paper

Problema

Un solo prompt al que se le pide hacer varias cosas a la vez produce salidas de menor calidad, más difíciles de controlar y de depurar cuando fallan.

Cuándo usarlo

Usa el encadenamiento cuando una tarea se descompone en una secuencia clara y ordenada de subtareas —por ejemplo esquema, luego borrador, luego edición— y cada paso se beneficia del resultado del anterior.

Solución

Divide la tarea en pasos discretos y ejecuta una llamada al LLM por paso, pasando cada salida a la siguiente. Opcionalmente añade comprobaciones programáticas (gates) entre pasos para validar resultados intermedios antes de continuar.

Como cada llamada tiene un único trabajo enfocado, los prompts son más simples, las salidas más fiables y los fallos quedan localizados en un paso concreto que puedes inspeccionar y corregir.

Componentes

Pasos ordenadosPrompt por pasoGates / validación entre pasosEstado pasado entre pasos

Beneficios

  • Mayor precisión al dar a cada llamada un único trabajo enfocado.
  • Más fácil de depurar: los fallos se localizan en un paso.
  • Los gates de validación pueden atrapar errores entre pasos.

Riesgos

  • Mayor latencia total por las llamadas secuenciales.
  • Los errores pueden acumularse en la cadena si no se comprueban.
  • Demasiados pasos añaden coste y fragilidad.

Cuándo no usarlo

  • Cuando la tarea es lo bastante simple para una sola llamada.
  • Cuando las subtareas son independientes: paraleliza en su lugar.
  • Cuando el camino no se conoce de antemano: usa un bucle de agente.

Tecnologías

LangGraphOpenAI Agents SDKClaude Agent SDKWorkflow engines

Ejemplos

  • Generar un esquema, luego escribir cada sección, luego revisar el tono.
  • Extraer campos estructurados, luego validarlos, luego resumir.
  • Traducir un documento, luego comprobar la traducción contra el original.

KPIs

Tasa de éxito de extremo a extremo
Proporción de cadenas que producen un resultado final correcto; los errores se acumulan entre pasos.
Tasa de error por paso
Fallo en cada eslabón: un paso fiable al 95% encadenado cinco veces da ~77% de extremo a extremo.
Latencia y coste totales
Suma de todas las llamadas de la cadena; más pasos significan más de ambos.
Tasa de recuperación
Con qué frecuencia un paso intermedio fallido se detecta y corrige en vez de propagarse en silencio.

Modos de fallo observados

  • Propagación de errores: un fallo temprano en la cadena corrompe todos los pasos posteriores.
  • Acumulación de latencia y coste a medida que la cadena se alarga.
  • Transferencias frágiles cuando el formato de salida de un paso no coincide con la entrada esperada del siguiente.
  • Pérdida de contexto entre pasos, de modo que eslabones posteriores olvidan restricciones fijadas antes.

Lecciones aprendidas

  • Valida o verifica entre pasos para detectar errores antes de que se propaguen.
  • Mantén las cadenas tan cortas como permita la tarea; cada paso extra multiplica la probabilidad de fallo.
  • Fija el contrato de salida de cada paso para que las transferencias no se rompan en silencio.
  • Usa el encadenamiento para trabajo genuinamente secuencial; paraleliza los pasos independientes.

FAQs

¿En qué se diferencia del agente?
El encadenamiento sigue una secuencia fija predefinida. Un agente decide sus propios pasos de forma dinámica. Prefiere el encadenamiento cuando el camino se conoce de antemano.
¿Cuándo debo añadir gates entre pasos?
Siempre que un resultado intermedio deba cumplir una condición antes de seguir: evita que los errores se propaguen por la cadena.
¿El encadenamiento aumenta el coste?
Sí, moderadamente —más llamadas significan más tokens y latencia— pero la ganancia en fiabilidad suele compensarlo en tareas de varias partes.

Referencias