Base de conhecimento de IA agêntica

Base de conhecimento

Base de conhecimento de IA agêntica

Unidades autocontidas e citáveis sobre IA aplicada e agêntica — cada uma construída como uma unidade de conhecimento reutilizável para pessoas, buscadores e agentes de IA. Cada entrada traz definição, pontos-chave, FAQs, referências, data e versão.

Conceitos

O que é IA Agêntica (Agentic AI)?

A IA agêntica designa sistemas que perseguem objetivos em vários passos — planejam, chamam ferramentas, agem sobre um ambiente e reagem ao feedback — em vez de produzir uma única resposta. Transforma um modelo de linguagem de gerador de texto em um ator capaz de concluir tarefas. A mudança que representa é passar do software 'faça você mesmo', em que a pessoa conduz cada passo, ao software 'faça por mim', em que o sistema executa o trabalho e reporta o resultado.

Conceitos

O que é Avaliação de IA Agêntica?

A avaliação de IA agêntica é a prática de medir quão bem um agente conclui tarefas de vários passos com uso de ferramentas num ambiente, não só a qualidade de uma única resposta. À medida que os modelos saturam os benchmarks estáticos de conhecimento, a avaliação se desloca de medir capacidade (o que um modelo sabe) para medir agência (o que um sistema realmente consegue concluir). Boas avaliações são o laço de feedback que torna possível a engenharia de harness.

Conceitos

O que é um Agente de IA?

Um agente de IA é um sistema que combina um modelo com ferramentas, memória e um laço de controle para tomar ações rumo a um objetivo, em vez de só responder a um prompt. Ele percebe uma situação, decide o que fazer, age por meio de ferramentas, observa o resultado e repete até concluir. A autonomia vai de uma única chamada de ferramenta à execução de tarefas complexas de horizonte longo.

Conceitos

O que são Embeddings e Busca Vetorial?

Um embedding é um vetor numérico que representa o significado de um texto (ou imagens, áudio, código) de modo que itens semanticamente similares ficam próximos no espaço vetorial. A busca vetorial encontra os embeddings mais próximos de uma consulta, permitindo buscar por significado em vez de palavras-chave. Os embeddings são a espinha dorsal da geração aumentada por recuperação, da busca semântica, do clustering e da recomendação.

Conceitos

O que é Fine-tuning (Ajuste fino)?

O fine-tuning continua o treinamento de um modelo pré-treinado com um conjunto de dados menor e direcionado para especializar seu comportamento, estilo ou conhecimento de domínio. É muito mais barato que o pré-treinamento e muda os pesos do modelo, ao contrário do prompting ou da recuperação, que o deixam intacto. Use-o para fixar um formato, tom ou habilidade consistentes; use recuperação quando precisar de fatos frescos ou privados.

Conceitos

O que são Modelos de Fundação (Foundation Models)?

Um modelo de fundação é um modelo grande pré-treinado em escala com dados amplos que pode ser adaptado a uma ampla variedade de tarefas posteriores. Os modelos de linguagem (LLMs) e os multimodais são os exemplos canônicos. O termo, cunhado em Stanford em 2021, captura uma mudança: em vez de treinar um modelo sob medida por tarefa, as organizações constroem sobre uma base geral compartilhada e depois a especializam via prompting, recuperação ou fine-tuning.

Conceitos

O que é o Model Context Protocol (MCP)?

O Model Context Protocol (MCP) é um padrão aberto para conectar modelos e agentes de IA a ferramentas, fontes de dados e sistemas externos por meio de uma interface única e uniforme. Apresentado pela Anthropic no fim de 2024, padroniza como uma aplicação expõe contexto e capacidades a um modelo, atuando como um adaptador universal para que qualquer cliente compatível converse com qualquer servidor compatível.

Conceitos

O que é Engenharia de Prompts (Prompt Engineering)?

A engenharia de prompts é a prática de projetar as entradas dadas a um modelo de linguagem para que ele produza a saída desejada de forma confiável. Um bom prompt especifica o papel, a tarefa, as restrições, o formato de saída e, quando útil, exemplos. É a alavanca mais acessível para guiar o comportamento do modelo — e uma camada do harness mais amplo — mas sozinha não torna um sistema confiável em escala.

Conceitos

O que são Modelos de Raciocínio (Reasoning Models)?

Os modelos de raciocínio são modelos de linguagem treinados para gastar computação extra 'pensando' antes de responder, gerando passos de raciocínio internos para resolver problemas mais difíceis de matemática, código e lógica. Trocam latência e custo por precisão em tarefas complexas de vários passos. A ideia central é a computação em inferência (test-time compute): deixar um modelo raciocinar mais na inferência, em vez de só torná-lo maior, pode melhorar muito os resultados.

Conceitos

O que é Uso de Ferramentas (Function Calling)?

O uso de ferramentas, também chamado function calling, permite a um modelo de linguagem invocar funções, APIs ou código externos para obter informação ou tomar ações no mundo real. O modelo decide qual ferramenta chamar e com quais argumentos; a aplicação executa a ferramenta e devolve o resultado, que o modelo usa para continuar. O uso de ferramentas é a ponte que transforma um gerador de texto num agente que de fato faz coisas.

Harness Engineering

O que são Sistemas de Memória de Agentes?

A memória de um agente é como um agente de IA retém e recupera informação além de uma única janela de contexto: entre passos, sessões e tarefas. Costuma separar a memória de trabalho de curto prazo (o contexto atual) da memória de longo prazo (armazenamentos duráveis que o agente lê e escreve). A memória é o que permite a um agente carregar estado numa tarefa longa, lembrar de um usuário ao longo do tempo e evitar repetir trabalho. É uma camada central da engenharia de harness.

Harness Engineering

O que é Observabilidade de Agentes de IA?

A observabilidade de IA é a prática de instrumentar sistemas de IA — sobretudo agentes — para poder ver o que fizeram e por quê. Captura rastros de cada passo: prompts, chamadas de ferramentas, contexto recuperado, saídas do modelo, tokens, latência e custo. Como os agentes são não determinísticos e de vários passos, a observabilidade é o que torna as falhas diagnosticáveis e a melhoria sistemática. É a camada que alimenta a avaliação e fecha o laço da engenharia de harness.

Harness Engineering

O que é Engenharia de Contexto (Context Engineering)?

A engenharia de contexto é a disciplina de decidir qual informação entra na janela de contexto limitada de um modelo a cada passo, e o que fica de fora. Como os agentes rodam em muitos passos, enfiar tudo ingenuamente no contexto degrada qualidade e custo. A engenharia de contexto cura as instruções, o conhecimento recuperado, os resultados de ferramentas e a memória adequados para que o modelo tenha exatamente o que precisa quando precisa. É uma parte central da engenharia de harness.

Harness Engineering

O que é Engenharia de Harness (Harness Engineering)?

A engenharia de harness é a disciplina de projetar e otimizar o andaime ao redor de um modelo de IA — prompts, ferramentas, memória, ambiente, laço de controle e guard-rails — para que o modelo tenha desempenho confiável em tarefas reais. Sua premissa central: à medida que os modelos base convergem em capacidade bruta, a vantagem competitiva se desloca do modelo para o harness à sua volta. O mesmo modelo pode passar ou falhar numa tarefa quase inteiramente conforme seu harness.

Padrões

O que é RAG empresarial (Enterprise RAG)?

O RAG empresarial (geração aumentada por recuperação) é o padrão de fundamentar as respostas de um modelo nos próprios documentos da organização, recuperados no momento da consulta, em vez de depender da memória paramétrica do modelo. Permite usar conhecimento privado, atual e governado — políticas, manuais, chamados, contratos — sem retreinar um modelo, mantendo o controle de acesso, as citações e a auditabilidade que as empresas exigem.

Padrões

O que é o Padrão Human-in-the-Loop?

Human-in-the-loop (HITL) é um padrão de design em que uma pessoa revisa, aprova ou corrige a saída de um sistema de IA antes de surtir efeito, sobretudo em ações de alto impacto. Em vez de autonomia total, o agente propõe e um humano dispõe. É um controle primário para gerir o risco em sistemas agênticos e um requisito recorrente em marcos de governança como o Regulamento de IA da UE e o NIST AI RMF.

Arquiteturas

O que é uma Arquitetura Multiagente?

Uma arquitetura multiagente divide uma tarefa entre vários agentes especializados que colaboram, delegam ou competem para alcançar um objetivo, em vez de depender de um único agente geral. Formas comuns: um orquestrador que delega a trabalhadores, pipelines em que cada agente possui uma etapa, e padrões de debate ou crítico. Pode melhorar a modularidade e a confiabilidade em tarefas complexas, mas adiciona custo de coordenação e só deve ser adotada quando um único agente fica aquém de forma demonstrável.

Governança

O que é Governança de IA (AI Governance)?

A governança de IA é o conjunto de políticas, processos, papéis e controles que garantem que a IA seja construída e usada de forma responsável, legal e segura. Abrange gestão de riscos, prestação de contas, transparência, segurança e conformidade ao longo do ciclo de vida da IA. Na prática operacionaliza marcos reconhecidos — o Regulamento de IA da UE, o NIST AI Risk Management Framework e a ISO/IEC 42001 — em controles concretos que uma organização pode implementar, evidenciar e auditar.

Governança

O que são Guard-rails de IA (Guardrails)?

Os guard-rails são controles em tempo de execução que limitam o que entra e sai de um sistema de IA, mantendo seu comportamento seguro, em conformidade com a política e a regulação. Verificam e filtram entradas e saídas, validam ações de ferramentas, bloqueiam conteúdo não permitido e impõem limites, situando-se ao redor do modelo como camada de segurança. São um controle primário e operacional na governança de IA e uma defesa-chave contra o mau uso e a injeção de prompts.

Governança

O que é Injeção de Prompts (Prompt Injection)?

A injeção de prompts é um ataque em que instruções maliciosas escondidas na entrada de um modelo de linguagem sequestram seu comportamento, fazendo-o ignorar suas regras, vazar dados ou usar mal as ferramentas. Lidera o OWASP Top 10 para aplicações LLM. A causa raiz é que os modelos não conseguem separar de forma confiável as instruções confiáveis do conteúdo não confiável, então qualquer texto que um agente leia — uma página web, um documento, o resultado de uma ferramenta — pode carregar um ataque.