alexi.sh
Alle ArtikelBrowser-SicherheitNetzwerk-PrivatsphäreDatenschutz-ToolsBedrohungsmodellierungKI-ProgrammierungDev-Tools

alexi.shAI Engineering Lab

ai-coding

MCP-Sicherheit: Die Risiken des Model Context Protocol und wie man es verwaltet (2026)

PrivSec Lab5 Min. Lesezeit
Quellcode in einem dunklen Editor, eine Illustration des Codes, den ein KI-Agent liest und durch verbundene Tools ausführt

MCP ermöglicht es KI-Agenten, über eine offene Schnittstelle auf Ihre Tools und Daten zuzugreifen – und genau diese Verbindung ist die Angriffsfläche. Die tatsächlichen MCP-Sicherheitsrisiken im Jahr 2026 (Tool-Vergiftung, Rug Pulls, serverübergreifende Angriffe) und wie man MCP-Server sicher verwaltet.

Das Model Context Protocol (MCP) ist der offene Standard, der es einem KI-Agenten ermöglicht, über eine gemeinsame Schnittstelle auf Ihre Tools, Dateien und Apps zuzugreifen – oft als "USB-C für KI" beschrieben. Es ist wirklich nützlich und wurde bis 2025 und 2026 in KI-Assistenten, IDEs und Agenten-Frameworks übernommen. Doch derselbe Anschluss, der einen Agenten leistungsfähig macht, ist auch seine größte Angriffsfläche. Die jüngsten Bestrebungen zur Regulierung von KI-Agenten in Unternehmen – Sicherheitsanbieter, die Tools zur Überwachung von Codierungsagenten bereitstellen, und MCP-basierte Governance-Schichten, die in Claude, ChatGPT und Copilot integriert werden – sind ein Zeichen für dasselbe: Einen Agenten mit Ihrer Umgebung zu verbinden, ist eine Sicherheitsentscheidung, keine Komforteinstellung. Hier ist das ehrliche Bild der MCP-Sicherheit im Jahr 2026 und wie man sie verwaltet.

Warum MCP ein Sicherheitsproblem ist und nicht nur ein Feature

MCP selbst ist nur die Infrastruktur: ein standardisierter Weg für ein Modell, Tools zu entdecken, ihre Beschreibungen zu lesen und sie aufzurufen. Das Risiko ist nicht das Protokoll – es ist das, was dadurch fließt.

Wenn ein Agent eine Verbindung zu einem MCP-Server herstellt, liefert dieser Server zwei Dinge, denen das Modell vertraut: Tool-Beschreibungen (Text, der dem Modell sagt, was jedes Tool tut und wie es aufgerufen wird) und Tool-Ausgaben (was auch immer das Tool zurückgibt). Das Modell liest beides und handelt danach. Jeder MCP-Server, den Sie anschließen, ist effektiv Code und Anweisungen, die mit den Berechtigungen Ihres Agenten ausgeführt werden. Alles, was der Agent erreichen kann – Ihre Dateien, ein Repository, eine API, Ihre E-Mails – kann ein bösartiger Server durch den Agenten zu erreichen versuchen.

Dies ist derselbe Wandel, der KI-Agenten-Sicherheit im Allgemeinen schwierig macht, angewendet auf einen spezifischen Anschluss: Die Sicherheit Ihrer MCP-Einrichtung ist die Sicherheit jedes Servers, den Sie daran anschließen.

Die MCP-spezifischen Risiken im Jahr 2026

Diese sind nicht hypothetisch – Sicherheitsforscher haben sie bei realen MCP-Clients dokumentiert.

  • Tool-Vergiftung. Ein bösartiger Server versteckt Anweisungen in der Beschreibung eines Tools – Text, den das Modell liest, den der Benutzer jedoch normalerweise nicht sieht. Ein Tool, das wie ein harmloses add(a, b) aussieht, kann heimlich den Agenten anweisen, private Dateien zu lesen und sie zu exfiltrieren. Da Benutzer dazu neigen, Tool-Aufrufe zu genehmigen, ohne die Beschreibung zu überprüfen, ist dies einer der wirkungsvollsten MCP-spezifischen Angriffe.
  • Rug Pulls (stille Neudefinition). Ein MCP-Tool ändert seine eigene Definition nachdem Sie es installiert und genehmigt haben. Sie haben etwas Sicheres geprüft; der Server tauscht später bösartiges Verhalten ein, ohne Sie zu informieren.
  • Tool-Schatten und serverübergreifende Angriffe. Wenn mehrere Server mit demselben Agenten verbunden sind, kann ein kompromittierter Server Aufrufe überschreiben oder abfangen, die für ein vertrauenswürdiges Tool bestimmt sind – ein "verwirrtes Stellvertreter"-Problem, bei dem der Agent den Befehlen des Angreifers folgt, während er denkt, er benutze ein legitimes Tool.
  • Die Exfiltrationstrias. Die wirklich gefährliche Kombination ist ein Agent, der private Daten hat, nicht vertrauenswürdige Inhalte liest und einen Exfiltrationsweg nach außen hat. MCP macht es einfach, alle drei versehentlich zu verbinden.
  • Indirekte Prompt-Injektion. Selbst ein ehrlicher Server gibt Ausgaben zurück, die der Agent liest – eine Webseite, ein Problem, ein Dokument –, die versteckte Anweisungen enthalten können. Der Agent kann ihnen gehorchen, als kämen sie von Ihnen.

Nahaufnahme der Seite eines Laptops mit einem USB-Anschluss und einem SD-Kartensteckplatz, die MCP als universellen Anschluss zum Verbinden von Tools mit einer KI veranschaulichen

Wie man MCP sicher verwaltet

Sie müssen MCP nicht vermeiden. Sie müssen verwalten, was Sie anschließen, und es so einrahmen, dass ein einziger schlechter Server nicht zur Katastrophe wird. Die Prinzipien sind alte Sicherheitsweisheiten, angewendet auf einen neuen Anschluss.

  • Vertrauenswürdige Server prüfen und festlegen. Bevorzugen Sie offizielle oder gut bewertete MCP-Server. Schließen Sie keine beliebigen Drittanbieter-Server an einen Agenten an, der echten Zugriff hat, und achten Sie auf Tool-Definitionen, die sich nach der Installation ändern.
  • Minimaler Zugriff pro Server. Geben Sie jedem Server nur den Zugriff, den seine Aufgabe benötigt, indem Sie eingeschränkte, widerrufbare Anmeldeinformationen verwenden – niemals Ihre Hauptkonten oder Produktionsschlüssel. Wenn ein Server nur lesen muss, lassen Sie ihn nicht schreiben.
  • Begrenzen Sie den Explosionsradius. Vermeiden Sie es, viele nicht vertrauenswürdige Server mit demselben Agenten zu verbinden, da ein kompromittierter Server andere abfangen kann. Isolieren Sie sensible Arbeiten von allem, was das offene Web liest.
  • Mensch im Loop für hochwirksame Aktionen. Fordern Sie eine explizite Bestätigung an, bevor etwas Unumkehrbares geschieht – Geld senden, Daten löschen, öffentlich posten, Zugriff ändern. Lassen Sie den Agenten entwerfen; Sie genehmigen.
  • Behandeln Sie Tool-Beschreibungen und -Ausgaben als nicht vertrauenswürdig. Beide können injizierte Anweisungen enthalten. Die gleiche Vorsicht gilt, wenn ein Agent KI-Code-Review-Tools oder ein beliebiges Tool verwendet, das externe Inhalte aufnimmt.
  • Protokollieren und prüfen Sie Tool-Aufrufe. Führen Sie ein Protokoll darüber, welche Server und Tools der Agent verwendet hat, damit Sie Anomalien erkennen und schnell widerrufen können.
  • Halten Sie Geheimnisse aus Eingabeaufforderungen und Tool-Argumenten heraus. Passwörter und API-Schlüssel, die in eine Eingabeaufforderung oder einen Tool-Aufruf eingefügt werden, werden zu Text auf einem Server. Verwenden Sie stattdessen eingeschränkte Tokens und Geheimnis-Manager.

Die ehrliche Erkenntnis

MCP-Sicherheit läuft auf eine Denkweise hinaus: Ein MCP-Server ist kein Plugin, das Sie installieren und vergessen – es ist ein neuer Teilnehmer mit Autonomie und Zugriff, und Sie sollten ihn wie einen behandeln, dem Sie nicht vollständig vertrauen. Das Protokoll ist offen und nützlich; die Gefahr liegt darin, Servern, die Sie nicht überprüft haben, breites, dauerhaftes Vertrauen zu gewähren. Verbinden Sie bewusst, beschränken Sie jeden Server eng, halten Sie einen menschlichen Schutz bei allem Unumkehrbaren und gehen Sie davon aus, dass jede Tool-Beschreibung und -Ausgabe versucht, Ihren Agenten zu kapern. Die Teams, die jetzt Governance um KI-Agenten aufbauen – und die KI-Codierungsagenten, die am meisten auf MCP angewiesen sind – kommen genau darauf: weniger verbinden, eng vertrauen und verifizieren.

Image: Pixabay (source)

Auch verfügbar in

FAQ

Was ist MCP-Sicherheit?
MCP-Sicherheit ist die Praxis, KI-Modelle und -Agenten sicher über das Model Context Protocol – einen offenen Standard, der Ende 2024 von Anthropic eingeführt wurde und oft als 'USB-C für KI' bezeichnet wird – mit externen Tools und Daten zu verbinden. MCP selbst ist nur ein Anschluss: Die Sicherheitsfrage ist, was Sie daran anschließen und wie sehr Sie ihm vertrauen. Jeder MCP-Server, mit dem ein Agent verbunden ist, ist Code und Anweisungen, die mit dem Zugriff des Agenten ausgeführt werden, sodass ein bösartiger oder kompromittierter Server Ihre Daten lesen, andere Tools aufrufen oder in Ihrem Namen handeln kann. MCP-Sicherheit bedeutet, Server zu prüfen, Berechtigungen eng zu fassen und Tool-Beschreibungen und -Ausgaben als nicht vertrauenswürdige Eingaben zu behandeln.
Was ist Tool-Vergiftung in MCP?
Tool-Vergiftung tritt auf, wenn ein bösartiger MCP-Server Anweisungen in der Beschreibung oder den Metadaten eines Tools versteckt – Text, den das Modell liest, den der Benutzer jedoch normalerweise nicht sieht. Das Modell behandelt diese versteckten Anweisungen als Befehle, sodass ein Tool, das wie eine harmlose 'Zwei Zahlen addieren'-Funktion aussieht, heimlich den Agenten anweisen kann, private Dateien zu lesen und sie irgendwohin zu senden. Sicherheitsforscher haben dies als eines der wirkungsvollsten MCP-spezifischen Risiken dokumentiert, da Benutzer dazu neigen, Tool-Aufrufe zu genehmigen, ohne die zugrunde liegenden Beschreibungen zu überprüfen.
Was ist ein MCP-Rug Pull?
Ein Rug Pull, auch stille Neudefinition genannt, tritt auf, wenn ein MCP-Tool seine eigene Definition ändert, nachdem Sie es bereits installiert und ihm vertraut haben. Sie genehmigen ein Tool, das sicher aussieht, und später tauscht der Server heimlich bösartige Anweisungen ein, ohne Sie zu benachrichtigen. Ein verwandter Angriff ist das Tool-Schatten, bei dem ein bösartiger Server Aufrufe überschreibt oder abfängt, die für ein vertrauenswürdiges Tool bestimmt sind. Beide nutzen die Tatsache aus, dass einmal gewährtes Vertrauen selten erneut überprüft wird, weshalb es wichtig ist, Tool-Definitionen auf Änderungen zu überwachen.
Ist MCP sicher zu verwenden?
MCP ist im Allgemeinen sicher für den täglichen Gebrauch, wenn Sie nur mit Servern verbinden, denen Sie vertrauen, und deren Zugriff eng fassen, aber es ist nicht sicher, beliebige Drittanbieter-Server mit weitreichenden Berechtigungen zu verbinden und sich dann zurückzulehnen. Das Protokoll ist ein offener Anschluss, daher hängt seine Sicherheit vollständig von den Servern ab, die Sie anschließen, und dem Zugriff, den Sie ihnen gewähren. Verwenden Sie offizielle oder gut bewertete Server, geben Sie jedem separate widerrufbare Anmeldeinformationen anstelle Ihrer Hauptkonten, halten Sie einen Menschen im Loop für hochwirksame Aktionen und überprüfen Sie, was Tools tun können, bevor Sie sie genehmigen.
Wie sichere ich MCP-Server?
Wenden Sie das Prinzip des geringsten Privilegs an: Geben Sie jedem MCP-Server nur den Zugriff, den seine Aufgabe benötigt, indem Sie eingeschränkte, widerrufbare Tokens anstelle von Admin-Schlüsseln oder Ihren Hauptkonten verwenden. Prüfen und fixieren Sie vertrauenswürdige Server, bevorzugen Sie offizielle und achten Sie auf Tool-Definitionen, die sich nach der Installation ändern. Behandeln Sie Tool-Beschreibungen und -Ausgaben als nicht vertrauenswürdige Inhalte, die injizierte Anweisungen enthalten können. Vermeiden Sie es, viele nicht vertrauenswürdige Server mit demselben Agenten zu verbinden, da ein kompromittierter Server andere abfangen kann. Protokollieren Sie Tool-Aufrufe, damit Sie prüfen und widerrufen können, und halten Sie Geheimnisse aus Eingabeaufforderungen und Tool-Argumenten heraus.