Como isto difere de orchestrator-workers?

Orchestrator-workers decompõe uma tarefa em chamadas paralelas, muitas vezes homogêneas, e as funde. Um supervisor é um coordenador persistente sobre especialistas heterogêneos ao longo de um laço de vários turnos, redecidindo o roteamento à medida que o estado evolui em vez de executar um plano fixo.

Como evito laços de transferência infinitos?

Devolva o controle ao supervisor após o turno de cada especialista, proíba chamadas livres entre pares, defina um orçamento de passos ou tokens, defina transições permitidas e adicione condições de término explícitas para que o laço não entre em ciclo indefinidamente.

Quando um especialista deve devolver o controle ao supervisor?

Sempre que concluir sua tarefa delimitada, precisar de uma capacidade que não possui, encontrar ambiguidade que exija uma decisão, ou detectar que é o agente errado para o pedido. O supervisor então integra e escolhe o próximo passo.

OrquestraçãoAtualizado 2026-06-21 · Versão 1.0

Agente Supervisor

Um agente supervisor é um coordenador persistente que gerencia uma equipe de subagentes especializados. Ele lê o estado da conversa, decide qual especialista deve agir em seguida, roteia mensagens para ele e integra os resultados em direção ao objetivo. Diferente de um decompositor de uma única etapa, o supervisor permanece no laço por muitos turnos, delegando por capacidade e replanejando até a tarefa terminar ou voltar ao usuário.

Evidência: Observação do setorConfiança: AltaFonte: Observação do setorFonte: Paper

Legível por máquina: JSON

Problema

Um único agente com muitas ferramentas, instruções e domínios perde o foco: seu prompt incha, a seleção de ferramentas piora e ele confunde assuntos sem relação. Fluxos reais exigem expertise diferente em cada etapa (pesquisa, código, faturamento, conformidade), mas nenhum agente plano escolhe de forma confiável a capacidade certa no momento certo nem mantém coerentes as interações longas de várias etapas.

Quando usar

Use um supervisor quando o trabalho abrange várias capacidades especializadas, distintas e reutilizáveis que precisam colaborar em uma conversa ou laço de vários turnos, quando as decisões de roteamento dependem de um estado em evolução em vez de um plano fixo, e quando você precisa de um ponto central claro para aplicar políticas, gerenciar transferências e observar o que cada agente fez. Ele se encaixa em equipes heterogêneas de agentes mais do que em trabalhadores paralelos uniformes.

Solução

O supervisor detém o laço de controle e o estado compartilhado da conversa. A cada turno ele inspeciona as mensagens mais recentes e o objetivo, e então decide se responde diretamente, delega a um especialista nomeado ou encerra. A delegação é por capacidade: cada subagente tem um escopo declarado (por exemplo um agente de código, um de dados, um de conhecimento), e o supervisor roteia ao escolhido a fatia de contexto relevante. O especialista executa seu próprio laço de ferramentas focado e devolve um resultado ou um pedido de esclarecimento, que o supervisor registra antes de decidir o próximo passo.

O controle volta ao supervisor após o turno de cada especialista, de modo que ele permanece o único ponto de decisão em vez de deixar os agentes se chamarem livremente. O supervisor integra resultados parciais, resolve conflitos entre especialistas, decide quando um objetivo foi satisfeito e quando devolver o controle ao usuário. Salvaguardas como orçamentos de passos, regras de transições permitidas e condições de término explícitas impedem que o laço entre em ciclo. Mensagens de transferência estruturadas e um rastro compartilhado tornam cada delegação auditável, para que as equipes vejam a quem foi pedido o quê e por quê.

Componentes

Supervisor (roteador/planejador)Subagentes especialistas com escopos declaradosRepositório compartilhado de conversa/estadoProtocolo de transferência e esquema de mensagensOrçamento de passos e guarda de términoRastro e observabilidade por agente

Benefícios

Especialistas focados com prompts menores e mais limpos
Roteamento e aplicação de políticas centralizados
Agentes modulares que evoluem de forma independente
Trilha de auditoria clara de quem fez o quê

Riscos

Laços de transferência infinitos ou de vai e volta
A sobrecarga de coordenação infla latência e custo
O supervisor vira gargalo de roteamento
A perda de contexto nas transferências degrada a qualidade

Quando não usar

Uma única capacidade resolve a tarefa inteira
Um fan-out paralelo fixo se encaixa melhor (orchestrator-workers)
Orçamentos de latência ou custo proíbem saltos extras

Tecnologias

LangGraph (supervisor)OpenAI Agents SDKMulti-agent frameworksMessage routing

Exemplos

Roteamento de suporte ao cliente entre especialistas de faturamento, técnicos e de conta
Tarefa de software dividida entre agentes de código, testes e documentação
Assistente de pesquisa que delega a agentes de busca, análise e redação

KPIs

Taxa de sucesso de tarefas / cumprimento do objetivo: Parcela de sessões que atingem o resultado pretendido sem resgate humano; o principal sinal de qualidade da equipe supervisora.
Transferências por tarefa resolvida: Média de delegações até a conclusão; observe uma deriva de alta que sinalize indecisão ou repique de roteamento, e não mais trabalho útil.
Sobrecarga de coordenação: Tokens, chamadas e latência extras atribuíveis ao supervisor frente a um único agente; o bom é o roteamento justificar seu custo.
Acurácia de roteamento: Fração de delegações enviadas ao especialista correto na primeira tentativa, avaliada contra casos rotulados.

Modos de falha observados

Dois agentes devolvem o trabalho um ao outro sem progredir até um orçamento cortar o laço
O supervisor roteia mal para o especialista errado e nunca recupera o fio
Contexto crítico é descartado na transferência, então o especialista resolve o problema errado
Os resultados parciais dos especialistas conflitam e o supervisor os integra de forma incoerente

Lições aprendidas

Imponha orçamentos de passos rígidos e término explícito para que os laços sempre acabem
Faça transferências estruturadas, com intenção e escopo, não despejos de mensagens em bruto
Mantenha escopos de especialista estreitos e sem sobreposição para reduzir a ambiguidade de roteamento
Instrumente cada delegação; você não consegue depurar um laço multiagente que não consegue ver

FAQs

Como isto difere de orchestrator-workers?: Orchestrator-workers decompõe uma tarefa em chamadas paralelas, muitas vezes homogêneas, e as funde. Um supervisor é um coordenador persistente sobre especialistas heterogêneos ao longo de um laço de vários turnos, redecidindo o roteamento à medida que o estado evolui em vez de executar um plano fixo.
Como evito laços de transferência infinitos?: Devolva o controle ao supervisor após o turno de cada especialista, proíba chamadas livres entre pares, defina um orçamento de passos ou tokens, defina transições permitidas e adicione condições de término explícitas para que o laço não entre em ciclo indefinidamente.
Quando um especialista deve devolver o controle ao supervisor?: Sempre que concluir sua tarefa delimitada, precisar de uma capacidade que não possui, encontrar ambiguidade que exija uma decisão, ou detectar que é o agente errado para o pedido. O supervisor então integra e escolhe o próximo passo.