Agente Supervisor
Um agente supervisor é um coordenador persistente que gerencia uma equipe de subagentes especializados. Ele lê o estado da conversa, decide qual especialista deve agir em seguida, roteia mensagens para ele e integra os resultados em direção ao objetivo. Diferente de um decompositor de uma única etapa, o supervisor permanece no laço por muitos turnos, delegando por capacidade e replanejando até a tarefa terminar ou voltar ao usuário.
Problema
Um único agente com muitas ferramentas, instruções e domínios perde o foco: seu prompt incha, a seleção de ferramentas piora e ele confunde assuntos sem relação. Fluxos reais exigem expertise diferente em cada etapa (pesquisa, código, faturamento, conformidade), mas nenhum agente plano escolhe de forma confiável a capacidade certa no momento certo nem mantém coerentes as interações longas de várias etapas.
Quando usar
Use um supervisor quando o trabalho abrange várias capacidades especializadas, distintas e reutilizáveis que precisam colaborar em uma conversa ou laço de vários turnos, quando as decisões de roteamento dependem de um estado em evolução em vez de um plano fixo, e quando você precisa de um ponto central claro para aplicar políticas, gerenciar transferências e observar o que cada agente fez. Ele se encaixa em equipes heterogêneas de agentes mais do que em trabalhadores paralelos uniformes.
Solução
O supervisor detém o laço de controle e o estado compartilhado da conversa. A cada turno ele inspeciona as mensagens mais recentes e o objetivo, e então decide se responde diretamente, delega a um especialista nomeado ou encerra. A delegação é por capacidade: cada subagente tem um escopo declarado (por exemplo um agente de código, um de dados, um de conhecimento), e o supervisor roteia ao escolhido a fatia de contexto relevante. O especialista executa seu próprio laço de ferramentas focado e devolve um resultado ou um pedido de esclarecimento, que o supervisor registra antes de decidir o próximo passo.
O controle volta ao supervisor após o turno de cada especialista, de modo que ele permanece o único ponto de decisão em vez de deixar os agentes se chamarem livremente. O supervisor integra resultados parciais, resolve conflitos entre especialistas, decide quando um objetivo foi satisfeito e quando devolver o controle ao usuário. Salvaguardas como orçamentos de passos, regras de transições permitidas e condições de término explícitas impedem que o laço entre em ciclo. Mensagens de transferência estruturadas e um rastro compartilhado tornam cada delegação auditável, para que as equipes vejam a quem foi pedido o quê e por quê.
Componentes
Benefícios
- Especialistas focados com prompts menores e mais limpos
- Roteamento e aplicação de políticas centralizados
- Agentes modulares que evoluem de forma independente
- Trilha de auditoria clara de quem fez o quê
Riscos
- Laços de transferência infinitos ou de vai e volta
- A sobrecarga de coordenação infla latência e custo
- O supervisor vira gargalo de roteamento
- A perda de contexto nas transferências degrada a qualidade
Quando não usar
- Uma única capacidade resolve a tarefa inteira
- Um fan-out paralelo fixo se encaixa melhor (orchestrator-workers)
- Orçamentos de latência ou custo proíbem saltos extras
Tecnologias
Exemplos
- Roteamento de suporte ao cliente entre especialistas de faturamento, técnicos e de conta
- Tarefa de software dividida entre agentes de código, testes e documentação
- Assistente de pesquisa que delega a agentes de busca, análise e redação
KPIs
- Taxa de sucesso de tarefas / cumprimento do objetivo
- Parcela de sessões que atingem o resultado pretendido sem resgate humano; o principal sinal de qualidade da equipe supervisora.
- Transferências por tarefa resolvida
- Média de delegações até a conclusão; observe uma deriva de alta que sinalize indecisão ou repique de roteamento, e não mais trabalho útil.
- Sobrecarga de coordenação
- Tokens, chamadas e latência extras atribuíveis ao supervisor frente a um único agente; o bom é o roteamento justificar seu custo.
- Acurácia de roteamento
- Fração de delegações enviadas ao especialista correto na primeira tentativa, avaliada contra casos rotulados.
Modos de falha observados
- Dois agentes devolvem o trabalho um ao outro sem progredir até um orçamento cortar o laço
- O supervisor roteia mal para o especialista errado e nunca recupera o fio
- Contexto crítico é descartado na transferência, então o especialista resolve o problema errado
- Os resultados parciais dos especialistas conflitam e o supervisor os integra de forma incoerente
Lições aprendidas
- Imponha orçamentos de passos rígidos e término explícito para que os laços sempre acabem
- Faça transferências estruturadas, com intenção e escopo, não despejos de mensagens em bruto
- Mantenha escopos de especialista estreitos e sem sobreposição para reduzir a ambiguidade de roteamento
- Instrumente cada delegação; você não consegue depurar um laço multiagente que não consegue ver
FAQs
- Como isto difere de orchestrator-workers?
- Orchestrator-workers decompõe uma tarefa em chamadas paralelas, muitas vezes homogêneas, e as funde. Um supervisor é um coordenador persistente sobre especialistas heterogêneos ao longo de um laço de vários turnos, redecidindo o roteamento à medida que o estado evolui em vez de executar um plano fixo.
- Como evito laços de transferência infinitos?
- Devolva o controle ao supervisor após o turno de cada especialista, proíba chamadas livres entre pares, defina um orçamento de passos ou tokens, defina transições permitidas e adicione condições de término explícitas para que o laço não entre em ciclo indefinidamente.
- Quando um especialista deve devolver o controle ao supervisor?
- Sempre que concluir sua tarefa delimitada, precisar de uma capacidade que não possui, encontrar ambiguidade que exija uma decisão, ou detectar que é o agente errado para o pedido. O supervisor então integra e escolhe o próximo passo.