Governance 13. Juni 2026 11 Min. Lesezeit

Multi-Agent-Governance 2026: Warum die meisten Agenten-Flotten außer Kontrolle sind

Unternehmen verwalten 2026 im Schnitt dutzende Agenten – aber nur eine Minderheit hat Sichtbarkeit darüber, was diese tun und mit wem sie kommunizieren. Während neue Standards wie NIST Agent Security und die OWASP Top 10 für Agentic AI live gehen, klafft eine gefährliche Lücke zwischen Management-Vertrauen und realer Kontrolle. Dieser Deep-Dive zeigt eine umsetzbare Governance-Architektur.

Governance-Cockpit – Agenten-Flotte unter Kontrolle

KILL-SWITCH

Flotten-Map & Kommunikation

Orchestrator ● identifiziert

●

● shadow

●

● identifiziert & geloggt ● Shadow-Agent

Status-Ampeln

Logging

Identität

Policy

OWASP Top 10 Agentic

A1Goal Hijacking

A3Memory Poisoning

A5Tool-Missbrauch

In den meisten Mittelstands-IT-Abteilungen lautet die ehrliche Antwort auf die Frage „Wie viele KI-Agenten laufen bei Ihnen produktiv?" inzwischen: „Mehr, als wir genau wissen." Was 2024 als einzelner Chatbot begann, ist 2026 zu einer ganzen Flotte aus autonomen Helfern gewachsen – im Vertrieb, im Support, in der Buchhaltung, im Code-Deployment. Jeder einzelne dieser Agenten trifft Entscheidungen, ruft Werkzeuge auf und tauscht Daten mit anderen Agenten aus. Und genau hier beginnt das Problem.

Die Diskrepanz zwischen dem, was Führungskräfte glauben zu kontrollieren, und dem, was technisch tatsächlich durchgesetzt wird, ist 2026 zur größten ungelösten Risikoquelle der Unternehmens-KI geworden. Dieser Artikel zeigt die Zahlen hinter der Kontroll-Lücke, ordnet die neuen Standards von NIST und OWASP ein und liefert eine konkrete Governance-Architektur, die Sie auf eigener Infrastruktur umsetzen können.

Die Kontroll-Lücke in Zahlen

Mehrere unabhängige Erhebungen aus dem ersten Halbjahr 2026 – unter anderem von Analystenhäusern wie Gartner und Forrester sowie Branchenumfragen von Sicherheitsanbietern – zeichnen ein konsistentes Bild: Die Verbreitung von Agentic AI ist der Fähigkeit, sie zu kontrollieren, weit vorausgeeilt.

Die Kernbefunde sind ernüchternd. Rund 63 % der befragten Organisationen können sogenannte Purpose-Limitations – also die verbindliche Einschränkung dessen, wofür ein Agent eingesetzt werden darf – technisch nicht durchsetzen. Sie haben den Zweck zwar dokumentiert, aber kein System, das ein Abweichen verhindert. Noch gravierender: Etwa 60 % können einen fehlverhaltenden Agenten nicht zuverlässig stoppen, wenn er einmal aus dem Ruder läuft. Es fehlt schlicht der Notschalter.

Bei der Sichtbarkeit sieht es nicht besser aus. Nur knapp ein Viertel der Unternehmen (rund 24 %) weiß überhaupt, welche ihrer Agenten miteinander kommunizieren. In einem Multi-Agent-System, in dem ein Agent einen anderen beauftragt und Ergebnisse weiterreicht, ist diese Blindheit besonders kritisch – eine Fehlentscheidung pflanzt sich durch die ganze Kette fort. Und über die Hälfte aller produktiven Agenten läuft nach diesen Zahlen ganz ohne dediziertes Logging oder Security-Oversight.

Die zentrale Erkenntnis: Governance scheitert 2026 nicht am fehlenden Willen, sondern an der fehlenden technischen Durchsetzung. Eine Policy, die nur in einem Confluence-Dokument steht, aber zur Laufzeit nicht erzwungen wird, ist aus Sicht eines autonomen Agenten schlicht nicht existent.

Diese Lücke ist kein abstraktes Risiko. Ein Agent ohne Purpose-Limitation, der Zugriff auf eine Zahlungs-API hat, ist ein einziger manipulierter Prompt davon entfernt, realen Schaden anzurichten. Wer ihn dann nicht stoppen kann und nicht protokolliert hat, was geschah, steht im Schadensfall ohne jede Handhabe da – betrieblich wie haftungsrechtlich.

Shadow Agents und Agent Sprawl

Der Hauptgrund für die Kontroll-Lücke heißt Geschwindigkeit. Agenten lassen sich heute in Minuten erstellen – über Plattform-Builder, Low-Code-Tools oder direkt im Entwickler-Workflow. Was die Produktivität beflügelt, erzeugt zugleich einen Effekt, den Sicherheitsteams aus der klassischen IT als „Sprawl" kennen: unkontrollierten Wildwuchs.

Branchenerhebungen sprechen 2026 von durchschnittlich rund 37 deployten Agenten pro Organisation – mit klar steigender Tendenz und großer Streuung. Viele dieser Agenten entstehen außerhalb der Aufsicht der IT-Abteilung: Eine Fachabteilung baut sich schnell einen Helfer, ein Entwickler hinterlegt einen autonomen Skript-Agenten in der CI/CD-Pipeline, ein Vertriebler verknüpft ein KI-Tool mit dem CRM. Diese Shadow Agents sind das agentische Pendant zur klassischen Schatten-IT – nur mit deutlich mehr Handlungsmacht, weil sie nicht nur Daten lesen, sondern aktiv Aktionen ausführen.

Jeder unkontrollierte Agent vergrößert die Angriffsfläche und häuft technische Schuld an. Er nutzt oft langlebige Zugangsschlüssel, hält keine sauberen Logs vor und kennt keine Guardrails. Besonders tückisch: Das Management fühlt sich dennoch sicher. Erhebungen zufolge überschätzen rund 82 % der Führungskräfte die Schutzwirkung ihrer bestehenden Policies – sie gehen davon aus, dass dokumentierte Regeln auch greifen, während die Realität auf Code-Ebene eine andere ist.

Die Konsequenz ist eindeutig: Ohne eine vollständige Inventur gibt es keine Governance. Man kann nichts steuern, was man nicht kennt. Der erste Schritt jeder ernsthaften Multi-Agent-Governance ist deshalb keine Policy und kein Tool, sondern eine ehrliche Bestandsaufnahme: Welche Agenten existieren, wer hat sie erstellt, worauf greifen sie zu, und mit wem sprechen sie?

Praxisbeispiel: Der vergessene Rechnungs-Agent
Ein mittelständischer Großhändler entdeckte bei einer Inventur einen Agenten, den ein ausgeschiedener Mitarbeiter vor acht Monaten gebaut hatte. Der Agent zog automatisch Lieferantenrechnungen aus Postfächern, extrahierte Beträge und legte Buchungsvorschläge an – mit einem statischen API-Key, der nie rotiert wurde, und ohne jegliches Logging. Niemand in der IT wusste von seiner Existenz. Erst eine systematische Erfassung aller maschinellen Identitäten brachte ihn ans Licht. Im Schadensfall hätte das Unternehmen weder nachvollziehen können, was der Agent getan hatte, noch ihn schnell abschalten können.

Neue Standards 2026

Die gute Nachricht: 2026 ist auch das Jahr, in dem belastbare Referenzrahmen für Agenten-Sicherheit verfügbar werden. Wer Governance aufbaut, muss nicht bei null anfangen, sondern kann sich an etablierten Strukturen orientieren.

NIST Agent Security Initiative

Das US-amerikanische NIST hat seine Arbeit am AI Risk Management Framework um eine spezifische Initiative für Agenten-Sicherheit erweitert. Sie liefert einen strukturierten Referenzrahmen, der die besonderen Eigenschaften autonomer Systeme adressiert: Autonomie, Werkzeugnutzung, Gedächtnis und Agent-zu-Agent-Kommunikation. Für deutsche Mittelständler ist NIST kein verpflichtendes Regelwerk, aber ein international anschlussfähiges Vokabular – gerade für Unternehmen mit US-Geschäft oder internationalen Lieferketten.

OWASP Top 10 for Agentic AI

Analog zu den seit Jahren bewährten OWASP-Listen für Web-Anwendungen ist 2026 eine eigene Top-10-Liste für agentische Systeme erschienen. Sie standardisiert die typischen Bedrohungen und gibt Teams eine gemeinsame Sprache. Die wichtigsten Risiken im Überblick:

Goal Hijacking: Ein Angreifer manipuliert das Ziel eines Agenten, sodass er statt der vorgesehenen Aufgabe eine fremde verfolgt – häufig über Prompt Injection in scheinbar harmlosen Eingabedaten.
Memory Poisoning: Das persistente Gedächtnis eines Agenten wird mit manipulierten Informationen vergiftet, die spätere Entscheidungen dauerhaft verfälschen.
Tool-Missbrauch: Ein Agent wird dazu gebracht, ihm zugängliche Werkzeuge – APIs, Datenbanken, Shell-Zugriffe – auf eine nicht vorgesehene, schädliche Weise zu nutzen.

Regulatorik und Werkzeuge

Parallel verschärft sich der regulatorische Rahmen. Mit den Hochrisiko-Pflichten des EU AI Act, die im August 2026 wirksam werden, rücken Nachvollziehbarkeit, menschliche Aufsicht und Risikomanagement von der Kür zur Pflicht. Auf der Werkzeugseite stehen zunehmend offene Bausteine bereit – etwa ein quelloffenes Agent-Governance-Toolkit von Microsoft, das Inventarisierung und Policy-Verwaltung erleichtert. Solche Bausteine ersetzen keine Architektur, beschleunigen aber den Einstieg erheblich.

Standard / Rahmen	Fokus	Relevanz für den Mittelstand
NIST Agent Security	Risikomanagement-Referenz für autonome Systeme	Strukturgeber
OWASP Top 10 Agentic	Konkrete Bedrohungskategorien (Goal Hijacking u.a.)	Pflichtlektüre
EU AI Act (Hochrisiko)	Verbindliche Pflichten ab August 2026	Rechtlich bindend
Microsoft Agent Governance Toolkit	Open-Source-Bausteine für Inventur & Policies	Beschleuniger

Agent Identity und Least Privilege

Das Fundament jeder Multi-Agent-Governance ist Identität. Solange Agenten unter geteilten Sammel-Accounts oder generischen Service-Konten laufen, lässt sich keine ihrer Aktionen einem konkreten Verursacher zuordnen – und damit weder protokollieren noch sinnvoll einschränken.

Jeder Agent braucht eine eigene, nachvollziehbare Identität. So wie jeder Mitarbeiter ein eindeutiges Benutzerkonto hat, muss jeder Agent als distinktes Subjekt im Identity-System geführt werden. Erst dann lassen sich Berechtigungen granular vergeben und Aktionen lückenlos zurückverfolgen.

Darauf setzt das Prinzip des Least Privilege auf: Ein Agent erhält ausschließlich Zugriff auf die Tools, Daten und APIs, die er für seine konkrete Aufgabe zwingend benötigt – nicht mehr. Ein Support-Agent, der Tickets beantwortet, braucht keinen Schreibzugriff auf die Finanzbuchhaltung. Diese Eingrenzung ist die wirksamste Einzelmaßnahme gegen Tool-Missbrauch und gegen die Schadensausbreitung bei einem kompromittierten Agenten.

Statt statischer, langlebiger API-Keys – die bei einem Leak unbegrenzt nutzbar bleiben – sollten Agenten mit kurzlebigen, eng gefassten (scoped) Credentials arbeiten. Ein Token, das nach Minuten verfällt und nur für einen bestimmten Endpunkt gilt, ist für einen Angreifer weitaus weniger wert. Schließlich gilt es, menschliche und maschinelle Identitäten klar zu trennen: Ein Agent darf nie unter der persönlichen Identität eines Mitarbeiters handeln, sonst verschwimmt die Verantwortlichkeit und Audit-Trails werden wertlos.

Faustregel: Wenn Sie nach einem Vorfall nicht innerhalb von Minuten beantworten können „Welcher Agent hat das getan, mit welcher Berechtigung und in wessen Auftrag?", dann fehlt Ihnen das Identity-Fundament – und alle weiteren Governance-Maßnahmen stehen auf Sand.

Logging, Observability und Kill-Switch

Identität schafft die Voraussetzung, Observability macht das Verhalten sichtbar. Da über die Hälfte der Agenten 2026 ohne dediziertes Logging läuft, ist hier der größte Nachholbedarf – und zugleich der größte Hebel.

Vollständiges Logging aller Agenten-Aktionen und Tool-Calls ist nicht verhandelbar. Jeder Werkzeugaufruf, jede Datenabfrage, jede Entscheidung sollte mit Zeitstempel, Agenten-Identität, Eingabe und Ergebnis festgehalten werden. Diese Protokolle sind die Grundlage für alles Weitere: Fehleranalyse, Sicherheitsuntersuchung und regulatorischer Nachweis.

Auf diesen Daten setzt die Erkennung von Drift und anomalem Verhalten auf. Ein Agent, der plötzlich Werkzeuge nutzt, die er bislang nie aufrief, oder dessen Anfragevolumen sprunghaft steigt, sollte automatisch Alarm auslösen. Anomalie-Erkennung verwandelt passive Logs in ein aktives Frühwarnsystem.

Und schließlich braucht jede Flotte einen Kill-Switch – einen Notfall-Stopp, mit dem sich ein einzelner Agent oder die gesamte Flotte sofort anhalten lässt. Dass 60 % der Unternehmen genau das nicht können, ist die gefährlichste Einzellücke der aktuellen Erhebungen. Der Kill-Switch ist die letzte Verteidigungslinie, wenn alle anderen Kontrollen versagen. Ergänzend liefern saubere Audit-Trails die Nachweise, die der EU AI Act für Hochrisiko-Systeme verlangt. Wie sich solche Praktiken in einen umfassenden Sicherheitsansatz einfügen, beschreiben wir auch in unserem Angebot zur KI-Sicherheit.

Policy-Enforcement zur Laufzeit

Hier liegt der Kern der gesamten Problematik: Governance, die nur dokumentiert ist, schützt nicht. Sie muss zur Laufzeit technisch durchgesetzt werden. Genau das unterscheidet echte Kontrolle von der Scheinsicherheit, der 82 % der Führungskräfte aufsitzen.

Purpose-Limitation technisch durchsetzen bedeutet, dass das System einem Agenten aktiv verwehrt, etwas zu tun, das außerhalb seines definierten Zwecks liegt – nicht erst im Nachhinein im Log auffällt, sondern in dem Moment blockiert wird, in dem er es versucht. Dafür sorgen Guardrails und Pre-Action-Checks: Vor jedem kritischen Schritt prüft eine Kontrollinstanz, ob die geplante Aktion erlaubt ist.

Für besonders folgenreiche, irreversible Aktionen – eine Zahlung auslösen, einen Datensatz endgültig löschen, eine E-Mail an Kunden versenden – sollte ein Human-in-the-Loop zwischengeschaltet sein. Ein Mensch bestätigt, bevor der Agent den Punkt ohne Wiederkehr überschreitet. Das verlangsamt nicht jeden Prozess, sondern gezielt die wenigen, die es verdienen.

Damit das skaliert, müssen Runtime-Policies zentral verwaltet werden. Verteilt man die Regeln in den Code jedes einzelnen Agenten, entsteht ein Flickenteppich, der bei dutzenden Agenten unwartbar wird. Eine zentrale Policy-Engine, die alle Agenten konsultieren, hält die Kontrolle konsistent und änderbar. Dieser Ansatz ist eng mit dem Prinzip des kontinuierlichen Red Teaming verwandt: Man testet die Guardrails aktiv gegen Angriffsversuche, statt auf ihre Wirksamkeit zu hoffen. Gerade weil das Alignment eines Agenten – also die Ausrichtung an den beabsichtigten Zielen – nie perfekt ist, braucht es diese durchgesetzte äußere Schranke.

Praxisbeispiel: Der gestoppte Goal-Hijacking-Versuch
Bei einem Maschinenbauer verarbeitet ein Agent eingehende Lieferanten-E-Mails und legt Bestellvorschläge an. In einer manipulierten E-Mail war versteckter Text eingebettet: eine Anweisung, sämtliche Bestelldaten an eine externe Adresse zu senden – ein klassischer Goal-Hijacking-Versuch per Prompt Injection. Weil eine zur Laufzeit erzwungene Policy dem Agenten ausschließlich den Zugriff auf das interne ERP erlaubte und jeder externe Versand einen Human-in-the-Loop erforderte, lief der Angriff ins Leere. Der Versuch landete im Audit-Log, das Anomalie-System schlug Alarm – und ein Mensch entschied. Eine reine Dokumenten-Policy hätte hier nichts verhindert.

Governance on-premise verankern

Wo diese Governance betrieben wird, entscheidet maßgeblich über ihre Wirksamkeit und über die Datenhoheit. Für den Mittelstand mit sensiblen Daten spricht vieles dafür, die Kontrollebene im eigenen Netz zu verankern.

Logs und Identitäten im eigenen Netz statt in fremder Cloud zu halten, ist mehr als eine Vorsichtsmaßnahme. Audit-Trails enthalten oft das sensibelste Wissen überhaupt: Sie zeigen, welche Daten Agenten verarbeitet, welche Geschäftsentscheidungen sie berührt und welche internen Prozesse sie durchlaufen haben. Diese Metadaten an einen Cloud-Anbieter abzugeben, kann mehr verraten als die Nutzdaten selbst.

On-Premise ermöglicht zudem eine Zero-Trust-Segmentierung der Agenten-Kommunikation: Agenten werden in Netzsegmente gegliedert, die nur explizit erlaubte Kommunikationswege zulassen. Damit lässt sich verhindern, dass ein kompromittierter Agent ungehindert mit beliebigen anderen Agenten oder Systemen spricht. Wie sich ein solches Modell aufbauen lässt, behandeln wir ausführlich in unserem Ansatz zu KI Zero-Trust.

Der dritte Vorteil ist die Integration in bestehende SIEM- und IAM-Landschaften. Die meisten mittelständischen Unternehmen betreiben bereits ein Identity- und Access-Management sowie eine Security-Monitoring-Plattform. Eine on-premise verankerte Agent-Governance dockt an diese vorhandenen Systeme an, statt eine isolierte Parallelwelt zu schaffen – Agenten werden so zu regulären Subjekten im selben Sicherheitsmodell wie Menschen und Server. Den ganzheitlichen Aufbau einer solchen Kontrollebene begleiten wir im Rahmen unserer Agent-Governance-Leistung, und die zugrundeliegenden Agenten-Architekturen entwickeln wir im Bereich Multi-Agent-Systeme.

Der Betrieb solcher Flotten – vom Deployment über Versionierung bis zum Monitoring – fällt zunehmend unter die Disziplin LLMOps. Governance ist dabei kein nachträglicher Aufsatz, sondern ein integraler Bestandteil des Betriebsmodells. Wer Agenten produktiv betreibt, betreibt damit zwingend auch deren Kontrolle – die einzige Frage ist, ob bewusst und durchgesetzt oder unbewusst und auf Hoffnung gebaut.

Häufig gestellte Fragen zu Multi-Agent-Governance

Was ist Multi-Agent-Governance?

Die Gesamtheit aus Identität, Berechtigungen, Logging, Policy-Enforcement und Notfall-Kontrolle für KI-Agenten. Ziel ist, jederzeit zu wissen und zu steuern, was Agenten dürfen, tun und mit wem sie kommunizieren.

Was sind die OWASP Top 10 für Agentic AI?

Ein 2026 veröffentlichtes Risiko-Framework speziell für Agenten, das Bedrohungen wie Goal Hijacking, Memory Poisoning und Tool-Missbrauch standardisiert beschreibt – analog zu den klassischen OWASP-Listen.

Warum reicht eine dokumentierte Policy nicht aus?

Studien zeigen, dass 82% der Führungskräfte ihre Policies überschätzen, während die Mehrheit der Agenten ohne Logging läuft. Governance muss zur Laufzeit technisch durchgesetzt werden, nicht nur auf Papier stehen.

Wie hilft On-Premise bei Agenten-Governance?

On-Premise hält Logs, Identitäten und Audit-Trails im eigenen Netz, ermöglicht Zero-Trust-Segmentierung der Agenten-Kommunikation und integriert sich in vorhandene SIEM- und IAM-Systeme.

Passende Leistungen

Agent-Governance KI Zero-Trust KI-Sicherheit Multi-Agent-Systeme

Ihre Agenten-Flotte unter Kontrolle bringen

Wir bauen Ihre Multi-Agent-Governance auf – Identität, Logging, Policy-Enforcement und Kill-Switch, On-Premise und DSGVO-konform. Kostenlose Erstberatung.

Governance-Beratung anfragen KI-Schnellcheck