Cloudera im 4. Quartal 2025 als führender Anbieter für Data-Fabric-Plattformen ausgezeichnet von The Forrester Wave™

Lesen sie den Bericht
  • Cloudera Cloudera
  • | Partner

    Cloudera Agent Studio und NVIDIA bringen Agenten der nächsten Generation in die Unternehmens-KI

    Charu Anchlia headshot
    Suryakant Bhardwaj headshot
    Pamela Pan headshot
    Männer mit Smartphones in der Hand und schwebendem KI-Text

    Autonome Agenten verfolgen komplexe Ziele, ohne dass sie bei jedem Schritt menschliche Anweisungen benötigen. In Unternehmensumgebungen bringt der Einsatz dieser Agenten eine Reihe anspruchsvollerer Herausforderungen mit sich: Sie müssen heterogene Datensysteme navigieren, Compliance-, Audit- und Datensouveränitätsvorgaben erfüllen und alle Daten innerhalb der operativen Grenzen des Unternehmens halten.

    Agenten mit langfristiger Perspektive stellen eine neue Klasse autonomer KI dar, die über einzelne Aufgaben hinausgeht und Ziele über Dutzende aufeinanderfolgender Entscheidungen hinweg verfolgt, wobei sie Workflows über Stunden oder Tage hinweg ausführen und dabei stets den Kontext im Blick behalten. Auf Unternehmensebene verstärken sich all diese Herausforderungen.

    Eine Architektur für KI-Agenten in Unternehmen

    Cloudera hat Cloudera Agent Studio (Teil von Cloudera AI Studios) in Zusammenarbeit mit NVIDIA entwickelt, um genau diese Herausforderungen zu bewältigen. 

    • NVIDIA Nemotron bietet die Grundlage für das Modell: Es wurde speziell für agentische KI und die hohen Anforderungen an die Inferenzleistung bei langfristigen Workflows entwickelt. 

    • Cloudera Agent Studio bietet die Orchestrierungsschicht, die auf dieser Grundlage durch vier architektonische Säulen aufbaut: dynamische mehrstufige Planung, transparente Zusammenarbeit mehrerer Agenten, Kontextoptimierung für Genauigkeit und isolierte Ausführung. Jede Säule befasst sich mit einer spezifischen Anforderung, die entsteht, wenn autonome Agenten auf Unternehmensebene agieren. 

    Abbildung 1: Cloudera Agent Studio koordiniert autonome Workflows durch iterative, mehrstufige Planung, die Zusammenarbeit mehrerer Agenten mit Tools und Fähigkeiten, artefaktgesteuertes Context Engineering und die Ausführung in einer Sandbox – aufbauend auf dem Modell-Serving mit Cloudera AI Inference, unterstützt durch NVIDIA NIM und Nemotron-Modelle für agentische KI.

    The Foundation: Private Model Deployment mit NVIDIA Nemotron

    KI im Unternehmensbereich beginnt mit Daten-Governance. Prompts, proprietäre Daten und Modellausgaben müssen innerhalb der betrieblichen Grenzen des Unternehmens bleiben und Compliance-Anforderungen erfüllen, ohne dass dabei Kompromisse bei der Architektur eingegangen werden. Das ist die zentrale Anforderung an private KI: Der gesamte Inferenz-Stack wird innerhalb des Unternehmens ausgeführt, nicht außerhalb.

    Der Cloudera AI Inference Service, der auf NVIDIA NIM-Mikroservices basiert, ermöglicht eine leistungsstarke und skalierbare Modellbereitstellung direkt innerhalb der Unternehmensumgebung, wobei Prompts, Daten und Ausgaben innerhalb des Sicherheitsperimeters verbleiben. Der Dienst wird durch den NVIDIA-KI-Stack beschleunigt, zu dem unter anderem Blackwell-GPUs und Dynamo-Triton gehören, und unterstützt eine breite Palette von Modellen, darunter die Nemotron-Modellfamilie von NVIDIA für agentische KI mit fortschrittlicher Argumentation, Tool-Nutzung und langfristigen Workflows. Diese Grundlage ermöglicht es Unternehmen, KI-Agenten für den Unternehmensbereich direkt auf der Grundlage ihrer eigenen Daten zu entwickeln und zu betreiben – sicher und im großen Maßstab.

    Die vier Säulen von Cloudera Agent Studio

    1. Dynamische, iterative, mehrstufige Planung

    Unternehmensdatenumgebungen sind nicht sauber. In der Praxis gibt es Dutzende von Datenbanken mit uneinheitlichen Schemata, lückenhafter Dokumentation und ohne eindeutigen Weg von einer geschäftlichen Fragestellung zur richtigen Datenquelle. Der Agent muss diesen Pfad zur Laufzeit konstruieren.

    Der Orchestrator von Agent Studio betrachtet die Erkundung als Teil der Ausführung. Er zerlegt komplexe Anfragen in mehrstufige Pläne, führt sie iterativ aus und evaluiert sich selbst nach jedem Schritt, bevor er sich für einen Pfad entscheidet. Dieser selbstkorrigierende Planungszyklus sorgt dafür, dass Agenten auch in Umgebungen, die sie noch nie zuvor erlebt haben, zuverlässig agieren und langfristige Workflows über viele aufeinanderfolgende Schritte hinweg aufrechterhalten können.

    2. Zusammenarbeit mit mehreren Agenten: Wiederverwendbarkeit und Transparenz

    Komplexe Unternehmens-Workflows erstrecken sich über mehrere Domains, die jeweils unterschiedliche Denkstrategien und spezialisierte Tools erfordern. Ein einzelner Agent, der versucht, alle diese Aufgaben abzudecken, kann für keine davon optimal ausgelegt sein, und je größer sein Aufgabenbereich ist, desto schwieriger wird es, das Verhalten des Agenten zu verstehen und zu steuern. 

    Agent Studio basiert auf spezialisierten Agenten, die jeweils auf eine bestimmte Domäne zugeschnitten sind und mit den entsprechenden Tools ausgestattet sind. Sie werden von einem Orchestrator koordiniert, der weiß, wie man delegiert. Was diese Zusammenarbeit transparent und wiederverwendbar macht, ist die Art und Weise, wie Agenten kommunizieren: Jeder Agent schreibt strukturierte Ausgaben in den gemeinsamen Projektkontext, und nachfolgende Agenten konsumieren diese Ausgaben als explizite, überprüfbare Eingaben. Die gesamte Argumentationskette ist in jedem Schritt nachvollziehbar und bietet so die von Unternehmen geforderte Prüfbarkeit sowie die Möglichkeit, auf früheren Arbeiten in verschiedenen Durchläufen aufzubauen.

    3. Kontext-Engineering: Genauigkeit, Geschwindigkeit und Kosten

    Bei Unternehmensdatenskalen funktioniert die direkte Übergabe von Rohdaten an das Modell nicht. Kontextfenster sind begrenzt, und mit zunehmendem unstrukturiertem Kontext nimmt die Genauigkeit deutlich ab, bevor das Fensterlimit erreicht wird.

    Agent Studio behandelt das Kontextfenster wie ein Präzisionsinstrument: Bei jedem Schritt gelangen nur die Informationen, die für die jeweilige Aufgabe des Agenten relevant sind, in das Modell. Dieses artefaktgesteuerte Design reduziert den Token-Verbrauch, senkt die Inferenzkosten und Latenz und verbessert gleichzeitig die Genauigkeit. Genau diese Kombination macht langfristige Workflows auf Unternehmensebene praktikabel.

    4. Ausführung in einer Sandbox

    Die wahre Stärke autonomer Agenten liegt in ihrer Fähigkeit, Tools, Fähigkeiten und ausführbaren Code dynamisch zu generieren, wenn Workflows dies erfordern – Fähigkeiten, die Agent Studio nativ unterstützt. Ohne Isolierung stellen jedoch von Agenten generierter Code und Tools, die direkt auf Unternehmenssystemen ausgeführt werden, ein inakzeptables Risiko dar. 

    Wir haben die Ausführungsschicht von Agent Studio so konzipiert, dass standardmäßig eine Isolierung gewährleistet ist. Der gesamte vom Agenten generierte Code und die Ausführung von Tools laufen in einer Sandbox-Laufzeitumgebung, ohne Zugriff auf Systeme außerhalb des definierten Bereichs. Die Agenten beginnen mit null Berechtigungen, und jede Aktion wird auf der Infrastrukturebene durch Richtlinien durchgesetzt, nicht innerhalb des Agentenprozesses selbst. Dadurch erhalten regulierte Branchen die erforderliche Überprüfbarkeit, ohne die Möglichkeiten der Agenten einzuschränken. 

    Kundenerfolgsgeschichte: Agentische KI revolutioniert die Datenanalyse im Petabyte-Maßstab

    Cloudera verwaltet über 30 Exabyte an strukturierten Daten in seinem Kundenstamm und führt strukturierte Datenanalysen durch, bei denen diese Architektur sofortige Wirkung zeigt. Ein großes Medien- und Unterhaltungsunternehmen hat die Lösung eingeführt, um Geschäftsanwendern und Analysten eine Schnittstelle in natürlicher Sprache für ihre Betriebsdaten zu bieten. Ihr Datenbestand umfasste Petabytes über Dutzende von Datenbanken, oft mit widersprüchlichen Metadaten und spärlicher Dokumentation.

    Cloudera Agent Studio orchestrierte spezialisierte Agenten, die von NVIDIA Nemotron unterstützt und innerhalb des privaten Netzwerks des Kunden ausgeführt werden. Eine analytische Frage eines Geschäftsanwenders löste eine iterative Planungsschleife aus: Der Orchestrator erkundete den Datenbestand, bewältigte Schema-Mehrdeutigkeiten und identifizierte selbstständig die richtigen Datenquellen. Wenn die Analyse statistische Berechnungen erforderte, die über die Möglichkeiten von SQL hinausgingen, delegierte der Orchestrator die Aufgabe an den entsprechenden Codeausführungsagenten. Zwischenausgaben wurden als Artefakte gespeichert und durch den langfristigen Workflow weitergegeben. Der gesamte generierte Code wird in einer Sandbox-Umgebung ausgeführt, wobei ein vollständiger Audit-Trail durchgängig aufbewahrt wird.

    Workflows, für die früher ein Data Engineer, ein Entwickler und ein Analyst nacheinander tätig werden mussten, wurden nun für jeden Geschäftsanwender zugänglich. Die Ausgaben der Agenten, einschließlich SQL-Befehlen, generiertem Code und Visualisierungen, wurden durchgehend im gemeinsamen Projektkontext erstellt und sind jeweils überprüfbar und auditierbar. Diese Artefakte konnten auch als Produktions-Pipelines exportiert werden. Da der von den Agenten generierte Code auch dann deterministisch ist, wenn die zugrunde liegenden Modelle es nicht sind, sind diese Pipelines ohne zusätzlichen Entwicklungsaufwand zuverlässig und reproduzierbar.

    Architektur als Wettbewerbsvorteil

    Jede Säule in dieser Architektur baut auf der vorherigen auf. Eine private Inferenzschicht bildet die Grundlage und gewährleistet das Anrufaufkommen und die Zuverlässigkeit, die für langfristige Workflows erforderlich sind. Iterative Planung ermöglicht Agenten, sich in Umgebungen zu bewegen, die sie noch nie gesehen haben. Die Zusammenarbeit mehrerer Agenten ermöglicht domainspezifische Präzision bei mehrstufigen Argumenten. Das artefaktbasierte Kontextmanagement verbessert die Genauigkeit und senkt gleichzeitig den Rechenaufwand und die Latenz. Die Ausführung in einer Sandbox gewährleistet, dass die Agenten innerhalb definierter Grenzen sicher agieren können, wobei jede Aktion kontrolliert und überprüfbar ist.

    Cloudera und NVIDIA setzen diese Architektur mithilfe von Cloudera Agent Studio, Cloudera AI Inference – basierend auf NVIDIA NIM – und der NVIDIA Nemotron-Modellfamilie in die Praxis um. Gemeinsam bilden sie die Grundlage für den Aufbau von Orchestrierung und agentischer Argumentation, die erforderlich sind, um KI-Agenten für Unternehmen direkt auf Unternehmensdaten auszuführen – sicher, vertraulich und im großen Maßstab.

    Weitere Informationen finden Sie in Cloudera Agent Studio in Aktion.

    Your form submission has failed.

    This may have been caused by one of the following:

    • Your request timed out
    • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.