Nutanix Agent Gateway: Einheitliche Governance und Kostenkontrolle für Agentic AI

KI-Agenten handeln autonom, spawnen Sub-Agenten und verursachen unkontrollierte Tokenkosten. Nutanix Agent Gateway bringt Governance, Observability und Kostenkontrolle in eine einzige Steuerungsebene – jetzt GA in Enterprise AI 2.7.
Von Chatbots zu autonomen Agenten – und warum das ein Governance-Problem ist
Generative KI hat sich schneller entwickelt, als die meisten IT-Organisationen Schritt halten konnten. Was als reaktive Chatbots begann, die Fragen beantworten, hat sich zu autonomen Agenten entwickelt, die aktiv mit Unternehmenstools, Geschäftssystemen und LLMs interagieren – und dieselben Agenten können inzwischen Sub-Agenten mit gleichem Funktionsumfang erzeugen.
Das klingt beeindruckend. Und es ist ein echtes Betriebsproblem.
Mit zunehmendem Agent Sprawl in Organisationen wächst der Multiplikatoreffekt auf Token-Verbrauch und Risiken bei der Zugriffskontrolle. Wer heute keine zentrale Steuerungsebene hat, verliert die Kontrolle – über Kosten, Zugriffe und Compliance. Nach einer aktuellen Gartner-Prognose könnten bis 2027 mehr als 40 % der Agentic-AI-Projekte eingestellt werden – unter anderem aufgrund steigender Kosten, eines unklaren Geschäftsnutzens oder unzureichender Governance- und Risikokontrollen.
Genau in diese Lücke stoßt der Nutanix Agent Gateway – ab sofort allgemein verfügbar als Teil von Nutanix Enterprise AI 2.7.
Was der Nutanix Agent Gateway konkret leistet
Der Nutanix Agent Gateway ist eng in den privaten Inferenz-Stack von Nutanix Enterprise AI integriert und liefert Unternehmen eine einheitliche Steuerungsebene über öffentlich gehostete Modelle und privat selbst gehostete Modelle hinweg.
Im Kern fungiert er als zentraler Gateway, der den Traffic von Agenten zu LLMs steuert – aber auch den Zugriff auf Model Context Protocol (MCP) Server, über die Agenten auf Unternehmenstools wie GitHub oder Stripe zugreifen. Organisationen erhalten zentrale Policy-Durchsetzung, umfassende Nutzungstransparenz und Echtzeit-Kostenzurechnung für Token über öffentliche und selbst gehostete Inferenzumgebungen hinweg.
Die konkreten Funktionen im Überblick:
- Token-Observability und Kostenkontrolle: Zentrales Token-Tracking über alle Modell-Anbieter hinweg. Teams behalten die Kontrolle über Kosten, können Workloads auf selbst gehostete Modelle verlagern und die Abhängigkeit von teuren Hosted-Providern reduzieren.
- MCP-Governance: Zugriffskontrollrichtlinien und Tool-Level-Filterung für MCP-Server – für sicheren Agentenzugriff auf Geschäftstools und private Datenquellen innerhalb einer kontrollierten, governance-konformen Umgebung. Governance umfasst dabei insbesondere Richtlinien für Modellzugriffe, Rollen- und Berechtigungskonzepte, Kostenkontrolle, Nachvollziehbarkeit von Agentenaktivitäten sowie die Einhaltung regulatorischer Anforderungen.
- Granulares Rate Limiting: Token-Kontingente und -Limits lassen sich zentral durchsetzen, mit Echtzeit-Sichtbarkeit auf Ebene jedes Agenten und jedes Teams.
- Audit-Protokollierung: Jede MCP-Anfrage wird mit vollständigem Audit-Trail aufgezeichnet – und schafft damit eine wichtige Grundlage für Nachvollziehbarkeit, Governance und Compliance-Anforderungen.
- Unified API: Externe Provider-Modelle und selbst gehostete Modelle sind über eine einzige API zugänglich – Entwickler behalten die Freiheit, das jeweils passende Modell für den jeweiligen Anwendungsfall zu wählen.
Das eigentliche Risiko: Shadow AI und unkontrollierter Zugriff
Was passiert, wenn Governance fehlt? Entwickler, denen sicherer Zugang zu Modellen und Agenten fehlt, bauen Shadow AI – mit ernsthaften Risiken für Datenlecks, Datenschutzverletzungen, unautorisierte Systemzugriffe und regulatorische Compliance-Anforderungen. Das ist keine theoretische Bedrohung. Es ist der Normalzustand in Organisationen, die KI-Initiativen dezentral gestartet haben, ohne zentrale Steuerung nachzuziehen.
Infrastrukturteams ohne zentrale Kontrolle sehen sich mit operativen und sicherheitsrelevanten Risiken konfrontiert, während gleichzeitig die Frage offen bleibt: Wie ermöglicht man sicheren KI-Zugang, ohne Entwickler zu bremsen?
Der Agent Gateway beantwortet genau diese Frage. Entwickler erhalten die Modellzugriffe, die sie brauchen. Die IT behält die Kontrolle über Kosten, Zugriffe und Audit-Trails. Keine Reibungsverluste, keine Governance-Lücken.
Deployment und Verfügbarkeit
Der Nutanix Agent Gateway kann schnell in der Public Cloud oder auf unterstützter Kubernetes-Infrastruktur bereitgestellt werden und bietet die Möglichkeit, durch zentrale Steuerung und den gezielten Einsatz selbst gehosteter Modelle die Betriebskosten zu optimieren. Er steht allen Nutanix Enterprise AI-Kunden zur Verfügung.
Hinweis: Die MCP-Server-Unterstützung befindet sich aktuell in der Tech Preview – sie sollte noch nicht in Produktionsumgebungen eingesetzt werden. Die übrigen Features sind vollständig GA.
Einordnung für den Mittelstand
KI-Governance ist kein Konzernthema mehr. Wer heute mehrere KI-Agenten betreibt – auch in kleinerem Maßstab – braucht eine Antwort auf die Fragen: Wer greift womit auf welche Daten zu? Wer verursacht welche Kosten? Was passiert, wenn ein Agent außer Kontrolle gerät?
Der Nutanix Agent Gateway liefert diese Antworten – ohne separate KI-Infrastruktur aufbauen zu müssen. Für Unternehmen, die bereits auf Nutanix Enterprise AI setzen, ist er der logische nächste Schritt. Für alle anderen ist er ein konkreter Anlass, die eigene Agentic-AI-Strategie auf Governance-Tauglichkeit zu prüfen – bevor die ersten produktiven Einsätze die Fragen erzwingen.
Mit zunehmender Autonomie von KI-Agenten steigen sowohl betriebliche als auch regulatorische Anforderungen an Transparenz, Zugriffskontrolle und Nachvollziehbarkeit. Eine zentrale Governance-Ebene wird damit zu einem wesentlichen Baustein eines nachhaltigen KI-Betriebs.
Sprechen Sie uns für weitere Details, eine Beratung oder ein Expertengespräch gerne auch direkt an oder wenden Sie sich formlos an hallo@enthus.de.
Schreiben Sie uns
Sie haben Fragen zu diesem Blog-Beitrag oder benötigen einen Expertenrat zu einem anderen Thema,
dann schreiben Sie uns gerne und wir melden uns bei Ihnen zurück.

