Agente Supervisor
Un agente supervisor es un coordinador persistente que gestiona un equipo de subagentes especializados. Lee el estado de la conversación, decide qué especialista debe actuar a continuación, le enruta los mensajes e integra los resultados hacia el objetivo. A diferencia de un descompositor de un solo paso, el supervisor permanece en el bucle durante muchos turnos, delegando por capacidad y replanificando hasta que la tarea se completa o se devuelve al usuario.
Problema
Un único agente con muchas herramientas, instrucciones y dominios pierde el foco: su prompt se infla, la selección de herramientas se degrada y confunde asuntos no relacionados. Los flujos reales requieren distinta experiencia en cada paso (investigación, código, facturación, cumplimiento), pero ningún agente plano elige de forma fiable la capacidad correcta en el momento correcto ni mantiene coherentes las interacciones largas de varios pasos.
Cuándo usarlo
Usa un supervisor cuando el trabajo abarca varias capacidades especializadas, distintas y reutilizables que deben colaborar en una conversación o bucle de varios turnos, cuando las decisiones de enrutamiento dependen de un estado que evoluciona en lugar de un plan fijo, y cuando necesitas un punto central claro para aplicar políticas, gestionar traspasos y observar qué hizo cada agente. Encaja con equipos heterogéneos de agentes más que con trabajadores paralelos uniformes.
Solución
El supervisor posee el bucle de control y el estado compartido de la conversación. En cada turno inspecciona los últimos mensajes y el objetivo, y decide si responde directamente, delega en un especialista nombrado o termina. La delegación es por capacidad: cada subagente tiene un alcance declarado (por ejemplo un agente de código, uno de datos, uno de conocimiento), y el supervisor enruta al elegido la porción de contexto relevante. El especialista ejecuta su propio bucle de herramientas enfocado y devuelve un resultado o una solicitud de aclaración, que el supervisor registra antes de decidir el siguiente paso.
El control regresa al supervisor después del turno de cada especialista, de modo que sigue siendo el único punto de decisión en lugar de permitir que los agentes se llamen libremente entre sí. El supervisor integra resultados parciales, resuelve conflictos entre especialistas, decide cuándo se satisface un objetivo y cuándo devolver el control al usuario. Salvaguardas como presupuestos de pasos, reglas de transiciones permitidas y condiciones de terminación explícitas evitan que el bucle se cicle. Mensajes de traspaso estructurados y una traza compartida hacen auditable cada delegación, para que los equipos vean a quién se le pidió qué y por qué.
Componentes
Beneficios
- Especialistas enfocados con prompts más pequeños y limpios
- Enrutamiento y aplicación de políticas centralizados
- Agentes modulares que evolucionan de forma independiente
- Rastro de auditoría claro de quién hizo qué
Riesgos
- Bucles de traspaso infinitos o de ida y vuelta
- La sobrecarga de coordinación infla latencia y costo
- El supervisor se convierte en cuello de botella de enrutamiento
- La pérdida de contexto en los traspasos degrada la calidad
Cuándo no usarlo
- Una sola capacidad resuelve toda la tarea
- Encaja mejor un fan-out paralelo fijo (orchestrator-workers)
- Los presupuestos de latencia o costo prohíben saltos extra
Tecnologías
Ejemplos
- Enrutamiento de soporte al cliente entre especialistas de facturación, técnicos y de cuenta
- Tarea de software repartida entre agentes de código, pruebas y documentación
- Asistente de investigación que delega en agentes de búsqueda, análisis y redacción
KPIs
- Tasa de éxito de tareas / cumplimiento del objetivo
- Proporción de sesiones que alcanzan el resultado previsto sin rescate humano; la señal principal de calidad del equipo supervisor.
- Traspasos por tarea resuelta
- Promedio de delegaciones hasta la finalización; vigila una deriva al alza que señale indecisión o rebote de enrutamiento, no más trabajo útil.
- Sobrecarga de coordinación
- Tokens, llamadas y latencia extra atribuibles al supervisor frente a un solo agente; lo bueno es que el enrutamiento justifique su costo.
- Precisión de enrutamiento
- Fracción de delegaciones enviadas al especialista correcto en el primer intento, evaluada contra casos etiquetados.
Modos de fallo observados
- Dos agentes se devuelven el trabajo sin avanzar hasta que un presupuesto corta el bucle
- El supervisor enruta mal al especialista equivocado y nunca recupera el hilo
- Se pierde contexto crítico en el traspaso, así que el especialista resuelve el problema equivocado
- Los resultados parciales de los especialistas entran en conflicto y el supervisor los integra de forma incoherente
Lecciones aprendidas
- Aplica presupuestos de pasos estrictos y terminación explícita para que los bucles siempre acaben
- Haz los traspasos estructurados, con intención y alcance, no volcados de mensajes en bruto
- Mantén alcances de especialista estrechos y sin solapamiento para reducir la ambigüedad de enrutamiento
- Instrumenta cada delegación; no puedes depurar un bucle multiagente que no puedes ver
FAQs
- ¿En qué se diferencia de orchestrator-workers?
- Orchestrator-workers descompone una tarea en llamadas paralelas, a menudo homogéneas, y las fusiona. Un supervisor es un coordinador persistente sobre especialistas heterogéneos a lo largo de un bucle de varios turnos, que vuelve a decidir el enrutamiento a medida que evoluciona el estado en lugar de ejecutar un plan fijo.
- ¿Cómo evito bucles de traspaso infinitos?
- Devuelve el control al supervisor tras el turno de cada especialista, prohíbe llamadas libres entre pares, fija un presupuesto de pasos o tokens, define transiciones permitidas y añade condiciones de terminación explícitas para que el bucle no se cicle indefinidamente.
- ¿Cuándo debe un especialista devolver el control al supervisor?
- Siempre que termine su tarea acotada, necesite una capacidad que no posee, encuentre ambigüedad que requiera una decisión, o detecte que es el agente equivocado para la solicitud. El supervisor entonces integra y elige el siguiente paso.