GOV-004PlaybookAtualizado 2026-06-21 · Versão 1.0

Checklist de Governança de IA Agêntica

Um checklist prático e neutro para governar a IA agêntica na empresa, que traduz os princípios do EU AI Act, ISO/IEC 42001 e NIST AI RMF em controles concretos que você pode implementar num harness. Cobre supervisão humana, guard-rails, registro de auditoria, avaliação, controle de acesso, defesa contra injeção de prompts e resposta a incidentes, e mapeia cada controle aos padrões e unidades de conhecimento que o operacionalizam. Use-o como portão de prontidão antes de deixar um agente agir em produção.

Evidência: Observação do setorConfiança: MédiaFonte: Observação do setorFonte: Experiência pessoal
EU AI ActISO/IEC 42001NIST AI RMF

Definição

O checklist de governança de IA agêntica é um conjunto de controles operacionais que transforma os frameworks de governança de IA em requisitos concretos e implementáveis para agentes autônomos que agem em produção.

Escopo

Equipes que constroem ou implantam agentes autônomos ou semiautônomos que usam ferramentas, agem sobre sistemas ou tomam decisões consequentes. É um companheiro prático dos frameworks formais, não um substituto de aconselhamento jurídico.

Requisitos-chave

  • Supervisão humana por risco: coloque portões de aprovação nas ações de alto impacto, irreversíveis ou reguladas.
  • Guard-rails em entradas e saídas, incluindo defesa contra injeção de prompts e PII.
  • Registro de auditoria e observabilidade completos para que cada ação seja rastreável.
  • Avaliação antes e depois da implantação, contra um conjunto de avaliação mantido.
  • Acesso de menor privilégio às ferramentas e dados que o agente pode alcançar.
  • Uma resposta a incidentes e um interruptor de parada definidos para os agentes em produção.

Controles

Portões de aprovação humana
Roteie as ações de alto impacto por um ponto de controle humano (Art. 14 do EU AI Act). Implementa o padrão de portão de aprovação humana.
Guard-rails
Valide e restrinja entradas e saídas; defenda contra a injeção de prompts e bloqueie ações fora da política.
Registro de auditoria e observabilidade
Rastreie cada decisão, chamada de ferramenta e ação para que o agente seja revisável e os incidentes reconstruíveis.
Harness de avaliação
Pontue o comportamento contra um conjunto de avaliação antes de implantar e monitore regressões depois: o 'Medir' do NIST.
Acesso de menor privilégio
Restrinja as ferramentas, os dados e as permissões que um agente pode alcançar ao mínimo que sua tarefa requer.
Resposta a incidentes e interruptor de parada
Defina como detectar, parar e remediar um agente que se comporta mal, incluindo uma forma de pará-lo imediatamente.

Lista de verificação

  • 01Classifique o risco do agente e identifique quais ações precisam de aprovação humana.
  • 02Implemente guard-rails para entradas/saídas e defesa contra injeção de prompts.
  • 03Habilite registro de auditoria e observabilidade ponta a ponta.
  • 04Monte um conjunto de avaliação e execute-o antes da implantação e continuamente.
  • 05Aplique menor privilégio a ferramentas, dados e credenciais.
  • 06Defina resposta a incidentes, limiares de monitoramento e um interruptor de parada.
  • 07Mapeie cada controle para suas obrigações sob o EU AI Act, ISO 42001 e NIST AI RMF.
  • 08Documente a responsabilidade e revise o agente periodicamente.

Erros comuns

  • Dar a um agente amplo acesso a ferramentas/dados 'por precaução', criando um grande raio de impacto.
  • Colocar portões em tudo (fadiga de aprovação) ou em nada (sem supervisão) em vez de fazê-lo por risco.
  • Implantar sem um conjunto de avaliação, deixando qualidade e segurança sem medição.
  • Não ter interruptor de parada nem plano de incidentes quando um agente se comporta mal em produção.
  • Ignorar a injeção de prompts como superfície de ataque para agentes com ferramentas.

Evidência de produção

Contexto
Equipes que colocam em produção um agente autônomo ou semiautônomo que usa ferramentas e toma ações consequentes.
Cenário
Antes do go-live, a equipe executa o checklist como portão de prontidão: classifica o risco do agente, coloca portões de aprovação humana nas ações de alto impacto, adiciona guard-rails e defesa contra injeção de prompts, habilita registro de auditoria e observabilidade, monta um conjunto de avaliação, restringe o acesso de menor privilégio e define resposta a incidentes e um interruptor de parada.
Tecnologia
Um harness que combina um portão de aprovação humana, guard-rails, registro de auditoria/observabilidade, um harness de avaliação e acesso restrito a ferramentas e credenciais.
Carga
Aplicado por agente antes da implantação e revisado periodicamente; o controle mais pesado (aprovação humana) é reservado para o pequeno conjunto de ações de alto impacto.
Resultados
Padrão observado: equipes que colocam portões por risco, aplicam menor privilégio e instrumentam desde o dia um contêm o raio de impacto dos erros do agente; as que dão acesso amplo 'por precaução' ou implantam sem avaliações descobrem as falhas em produção. Meça a adequação do escalonamento, a taxa de ações erradas e o tempo médio de detecção.

Lições aprendidas

  • Trate o checklist como um portão de prontidão, não como uma auditoria pontual: execute-o novamente à medida que as ferramentas e a autonomia do agente crescem.
  • O acesso de menor privilégio e a aprovação humana baseada em risco limitam o raio de impacto mais do que qualquer guard-rail isolado.
  • Sem um conjunto de avaliação e registro de auditoria antes do lançamento, você não distingue um agente seguro de um com sorte.
  • Atribua cada controle a um responsável concreto; governança sem prestação de contas é só documentação.

Exemplos

  • Um agente cuja ação de reembolso tem portão de aprovação humana enquanto as consultas somente leitura correm livres.
  • Um guard-rail que bloqueia uma instrução injetada para exfiltrar dados via uma ferramenta.
  • Uma execução de avaliação que detecta uma regressão de segurança antes de implantar uma atualização do agente.

FAQs

Isto substitui o EU AI Act ou a ISO 42001?
Não. É um conjunto de controles prático que operacionaliza seus princípios para agentes. Use-o junto aos frameworks formais e ao aconselhamento jurídico, não no lugar deles.
Qual controle importa mais para os agentes autônomos?
A supervisão humana baseada em risco mais o acesso de menor privilégio e o registro de auditoria: juntos limitam o que um agente pode fazer e tornam cada ação responsável.
Como conecta com a biblioteca de padrões?
Cada controle mapeia para padrões que o implementam —portão de aprovação humana para a supervisão, reflexão e avaliador-otimizador para a qualidade— e para unidades de conhecimento como guard-rails e observabilidade de IA.

Referências