alexi.sh
Todos os artigosSegurança do navegadorPrivacidade de redeFerramentas de privacidadeModelagem de ameaçasProgramação com IAFerramentas de dev

alexi.shLaboratório de Engenharia de IA

ai-coding

Segurança MCP: Os Riscos do Protocolo de Contexto de Modelo e Como Governá-lo (2026)

PrivSec Lab5 min de leitura
Código fonte num editor escuro, uma ilustração do código que um agente de IA lê e executa através de ferramentas conectadas

O MCP permite que agentes de IA se conectem às suas ferramentas e dados através de uma interface aberta — e essa conexão é a superfície de ataque. Os verdadeiros riscos de segurança do MCP em 2026 (envenenamento de ferramentas, rug pulls, ataques entre servidores) e como governar servidores MCP de forma segura.

O Protocolo de Contexto de Modelo (MCP) é o padrão aberto que permite que um agente de IA se conecte às suas ferramentas, ficheiros e aplicações através de uma interface comum — frequentemente descrito como "USB-C para IA". É realmente útil, e ao longo de 2025 e 2026 foi adotado em assistentes de IA, IDEs e frameworks de agentes. Mas o mesmo conector que torna um agente poderoso é também a sua maior superfície de ataque. Os movimentos recentes para governar agentes de IA nas empresas — fornecedores de segurança lançando ferramentas para monitorizar agentes de codificação, e camadas de governança baseadas em MCP a serem integradas no Claude, ChatGPT e Copilot — são um sinal do mesmo: conectar um agente ao seu ambiente é uma decisão de segurança, não uma configuração de conveniência. Aqui está a visão honesta da segurança do MCP em 2026 e como governá-lo.

Por que o MCP é um problema de segurança, não apenas uma funcionalidade

O MCP em si é apenas a canalização: uma forma padrão para um modelo descobrir ferramentas, ler suas descrições e chamá-las. O risco não é o protocolo — é o que flui através dele.

Quando um agente se conecta a um servidor MCP, esse servidor fornece duas coisas em que o modelo confia: descrições de ferramentas (texto que informa ao modelo o que cada ferramenta faz e como chamá-la) e saídas de ferramentas (o que quer que a ferramenta retorne). O modelo lê ambos e age com base neles. Assim, cada servidor MCP que você conecta é efetivamente código e instruções a serem executadas com os privilégios do seu agente. Tudo o que o agente pode alcançar — os seus ficheiros, um repositório, uma API, o seu email — um servidor malicioso pode tentar alcançar através do agente.

Esta é a mesma mudança que torna a segurança de agentes de IA difícil em geral, aplicada a um conector específico: a segurança da sua configuração MCP é a segurança de cada servidor que você conecta a ele.

Os riscos específicos do MCP em 2026

Estes não são hipotéticos — investigadores de segurança já os documentaram em clientes MCP reais.

  • Envenenamento de ferramentas. Um servidor malicioso esconde instruções dentro da descrição de uma ferramenta — texto que o modelo lê, mas o utilizador geralmente não. Uma ferramenta que parece ser um inofensivo add(a, b) pode secretamente instruir o agente a ler ficheiros privados e exfiltrá-los. Como os utilizadores tendem a aprovar chamadas de ferramentas sem inspecionar a descrição, este é um dos ataques específicos do MCP mais impactantes.
  • Rug pulls (redefinição silenciosa). Uma ferramenta MCP muda a sua própria definição depois de você a ter instalado e aprovado. Você verificou algo seguro; o servidor mais tarde substitui por um comportamento malicioso sem o informar.
  • Sombreamento de ferramentas e ataques entre servidores. Quando vários servidores se conectam ao mesmo agente, um comprometido pode substituir ou interceptar chamadas destinadas a uma ferramenta confiável — um problema de "deputado confuso" onde o agente faz o que o atacante deseja pensando que está a usar uma ferramenta legítima.
  • A trifeta de exfiltração. A combinação realmente perigosa é um agente que tem dados privados, lê conteúdo não confiável e tem um caminho de exfiltração para o exterior. O MCP torna fácil ligar todos os três acidentalmente.
  • Injeção indireta de prompt. Mesmo um servidor honesto retorna saídas que o agente lê — uma página web, um problema, um documento — que podem conter instruções ocultas. O agente pode obedecê-las como se viessem de si.

Um close-up do lado de um portátil mostrando uma porta USB e um slot para cartão SD, ilustrando o MCP como um conector universal para ligar ferramentas a uma IA

Como governar o MCP de forma segura

Não precisa evitar o MCP. Precisa governar o que conecta e limitá-lo para que um único servidor malicioso não se torne um desastre. Os princípios são sabedoria antiga de segurança aplicada a um novo conector.

  • Verifique e fixe servidores confiáveis. Prefira servidores MCP oficiais ou bem avaliados. Não conecte servidores de terceiros arbitrários a um agente que possui acesso real, e esteja atento a definições de ferramentas que mudam após a instalação.
  • Menor privilégio por servidor. Dê a cada servidor apenas o acesso necessário para o seu trabalho, usando credenciais limitadas e revogáveis — nunca as suas contas principais ou chaves de produção. Se um servidor só precisa ler, não o deixe escrever.
  • Limite o raio de explosão. Evite conectar muitos servidores não confiáveis ao mesmo agente, pois um servidor comprometido pode interceptar outros. Isole trabalhos sensíveis de qualquer coisa que leia a web aberta.
  • Humano no circuito para ações de alto impacto. Exija confirmação explícita antes de qualquer coisa irreversível — enviar dinheiro, apagar dados, publicar publicamente, alterar acessos. Deixe o agente rascunhar; você aprova.
  • Trate descrições e saídas de ferramentas como não confiáveis. Ambas podem conter instruções injetadas. A mesma cautela aplica-se quando um agente usa ferramentas de revisão de código de IA ou qualquer ferramenta que ingira conteúdo externo.
  • Registe e audite chamadas de ferramentas. Mantenha um registo de quais servidores e ferramentas o agente usou, para que possa identificar anomalias e revogar rapidamente.
  • Mantenha segredos fora de prompts e argumentos de ferramentas. Senhas e chaves de API coladas num prompt ou numa chamada de ferramenta tornam-se texto num servidor. Use tokens limitados e gestores de segredos em vez disso.

A conclusão honesta

A segurança do MCP resume-se a uma mudança de mentalidade: um servidor MCP não é um plugin que você instala e esquece — é um novo participante com autonomia e acesso, e deve tratá-lo como alguém em quem não confia totalmente. O protocolo é aberto e útil; o perigo está em conceder confiança ampla e permanente a servidores que você não verificou. Conecte-se deliberadamente, limite cada servidor de forma rigorosa, mantenha um humano como barreira em qualquer coisa irreversível, e assuma que cada descrição e saída de ferramenta pode estar a tentar sequestrar o seu agente. As equipas que agora constroem governança em torno de agentes de IA — e os agentes de codificação de IA que mais dependem do MCP — estão a convergir exatamente nisso: conecte-se menos, confie de forma restrita e verifique.

Image: Pixabay (source)

Também disponível em

FAQ

O que é segurança MCP?
A segurança MCP é a prática de conectar modelos e agentes de IA de forma segura a ferramentas e dados externos através do Protocolo de Contexto de Modelo — um padrão aberto introduzido pela Anthropic no final de 2024, frequentemente descrito como 'USB-C para IA'. O MCP em si é apenas um conector: a questão de segurança é o que você conecta a ele e o quanto confia. Cada servidor MCP ao qual um agente se conecta é código e instruções a serem executadas com o acesso do agente, portanto, um servidor malicioso ou comprometido pode ler os seus dados, chamar outras ferramentas ou tomar ações em seu nome. A segurança MCP significa verificar servidores, limitar permissões de forma rigorosa e tratar descrições e saídas de ferramentas como entrada não confiável.
O que é envenenamento de ferramentas no MCP?
Envenenamento de ferramentas é quando um servidor MCP malicioso esconde instruções dentro da descrição ou metadados de uma ferramenta — texto que o modelo lê, mas o utilizador geralmente não. O modelo trata essas instruções ocultas como comandos, então uma ferramenta que parece ser uma função inofensiva de 'somar dois números' pode secretamente instruir o agente a ler ficheiros privados e enviá-los para algum lugar. Investigadores de segurança documentaram isso como um dos riscos específicos do MCP mais impactantes, porque os utilizadores tendem a aprovar chamadas de ferramentas sem inspecionar as descrições subjacentes.
O que é um rug pull no MCP?
Um rug pull, também chamado de redefinição silenciosa, é quando uma ferramenta MCP muda a sua própria definição depois de você já a ter instalado e confiado nela. Você aprova uma ferramenta que parece segura, e mais tarde o servidor troca silenciosamente por instruções maliciosas sem o notificar. Um ataque relacionado é o sombreamento de ferramentas, onde um servidor malicioso substitui ou intercepta chamadas destinadas a uma ferramenta confiável. Ambos exploram o facto de que a confiança concedida uma vez raramente é reavaliada, razão pela qual monitorizar mudanças nas definições de ferramentas é importante.
O MCP é seguro para usar?
O MCP é amplamente seguro para uso diário se você se conectar apenas a servidores em que confia e limitar o seu acesso de forma rigorosa, mas não é seguro conectar servidores de terceiros arbitrários com permissões amplas e simplesmente ignorar. O protocolo é um conector aberto, portanto, a sua segurança depende inteiramente dos servidores que você conecta e do acesso que lhes concede. Use servidores oficiais ou bem avaliados, dê a cada um credenciais revogáveis separadas em vez das suas contas principais, mantenha um humano no circuito para ações de alto impacto, e reveja o que as ferramentas podem fazer antes de as aprovar.
Como posso proteger servidores MCP?
Aplique o princípio do menor privilégio: dê a cada servidor MCP apenas o acesso necessário para o seu trabalho, usando tokens limitados e revogáveis em vez de chaves de administrador ou suas contas principais. Verifique e fixe servidores confiáveis, prefira os oficiais, e esteja atento a definições de ferramentas que mudam após a instalação. Trate descrições e saídas de ferramentas como conteúdo não confiável que pode conter instruções injetadas. Evite conectar muitos servidores não confiáveis ao mesmo agente, pois um servidor comprometido pode interceptar outros. Registe chamadas de ferramentas para que possa auditar e revogar, e mantenha segredos fora de prompts e argumentos de ferramentas.