Vor drei Jahren begannen Cloudera-Kunden, die Möglichkeiten generativer KI zu erkunden, um Dateninteraktionen zu transformieren. Dazu entwickelten sie intelligente Assistenten, fassten komplexe Dokumente zusammen und generierten auf Abruf Erkenntnisse. Heute verwalten unsere Kunden mehr als 25 Exabyte (das sind 25 Milliarden Gigabyte!) an Unternehmensdaten in On-Premises- und Cloud-Umgebungen.
Die Art und Weise, wie Unternehmen ihre Daten verwalten, ist entscheidend: Im Zeitalter von KI ist Kontext nicht nur hilfreich – er entscheidet darüber, ob ein präzises Ergebnis oder Halluzinationen generiert werden. KI-Modelle benötigen nahtlosen Zugriff auf proprietäre Daten, um Erkenntnisse zu generieren, Fragen zu beantworten oder Arbeitsabläufe zu automatisieren. In den meisten Unternehmen sind diese Daten jedoch fragmentiert in isolierten Objektspeichern, Iceberg-Tabellen, Kafka-Streams und operativen Datenbanken hinterlegt. Entwickler verschwenden wertvolle Zeit mit dem Schreiben benutzerdefinierter Konnektoren und der Pflege fragiler Pipelines – was Innovationen und Wertschöpfung ausbremst.
Hier kommen die MCP-Server (Model-Context-Protocol-Server) von Cloudera ins Spiel. Unsere Server basieren auf MCP und bieten einen universellen Zugang zur Verwaltung von Unternehmensdaten. MCP ist ein offener Standard, mit dem Ziel, die Integration von KI auf die gleiche Weise zu standardisieren, wie Microsoft Open Database Connectivity (ODBC) relationale Datenbanken standardisiert hat (mehr zu MCP im nächsten Abschnitt).
Um dieses Ziel zu unterstützen, bringen wir Cloudera MCP Server für Apache Iceberg über Impala auf den Markt. Apache Iceberg ist das Backbone moderner Lakehouses und ermöglicht Verwaltung im Petabyte-Bereich, ACID-Konformität, Zeitreisen und granulare Governance. Es ist der perfekte Ausgangspunkt, um die Lücke zwischen Daten und KI zu schließen.
Mit Apache Iceberg gehen wir eine wichtige Herausforderung an: KI-Anwendungen benötigen kontrollierten Zugriff auf Analysedaten in Echtzeit und ohne zusätzlichen kundenspezifischen Code. Mit unserem MCP-Server können Entwickler Iceberg-Tabellen in natürlicher Sprache abfragen und nahtlos in Frameworks integrieren – wie CrewAI, Microsoft AutoGen, LangChain oder LangGraph, LlamaIndex und agentenbasierte KI-Toolkits, die mit diesen Frameworks arbeiten, wie etwa das Toolkit NVIDIA Agent Intelligence (AIQ) – und gleichzeitig mit Cloudera SDX-Richtlinien für zuverlässige Sicherheit sorgen. Und das ist erst der Anfang: Bei zukünftigem Cloudera MCP Servern werden wir die Unterstützung auf Streaming-Daten, operative Datenbanken und Datei-/Objektspeicher ausweiten.
Abbildung 1: Zwei Szenarien, in denen KI-Agenten auf Daten für KI-Kontexte zugreifen:
Da Unternehmen die Einführung agentenbasierter Architekturen vorantreiben, ist eine konsistente Integrationsschicht wichtiger denn je.
„Der Hype um die Einführung agentenbasierter Architekturen veranlasst Unternehmen dazu, mehrere Initiativen parallel zu starten. Diese Dynamik ist zwar vielversprechend, birgt jedoch auch die Gefahr, dass ein modernes Äquivalent zum Spaghetti-Code entsteht – ein Phänomen, das wir bereits in den Anfängen der Softwareentwicklung erlebt haben. Was Unternehmen hingegen wirklich brauchen, ist eine vereinfachte, standardbasierte Architektur, die die Interoperabilität zwischen den verschiedenen Systemen im agentenbasierten Ökosystem gewährleistet. MCP von Anthropic entwickelt sich zu einem vielversprechenden Standard in diesem Bereich und wird bereits von zahlreichen KI-Anbietern eingesetzt“, so Sanjeev Mohan, Geschäftsleiter von SanjMo und ehemaliger Analyst bei Gartner, Inc.
MCP ist kein proprietäres Tool von Cloudera, sondern ein weit verbreiteter Standard, der eine Bindung an einen bestimmten Anbieter vermeidet und gleichzeitig Zugang zu einem wachsenden Ökosystem von Tools bietet. Der Ansatz von Cloudera für MCP-Server steht im Einklang mit der Philosophie von MCP, die auf Offenheit, Einfachheit und Kontrolle beruht. MCP-Server von Cloudera werden nativ auf der einheitlichen Plattform von Cloudera ausgeführt, wodurch riskante Datenbewegungen vermieden werden und eine nahtlose Bereitstellung sowohl in Multi-Cloud- als auch in On-Premises-Umgebungen ermöglicht wird.
Die transformative Kraft von KI hängt von der Qualität der Daten ab, mit denen sie gespeist wird. Wenn Daten und KI-Systeme isoliert voneinander arbeiten, verzögern unzusammenhängende Informationen die Gewinnung von Erkenntnissen. Außerdem verursachen sie instabile Pipelines und bewirken, dass Modelle den für genaue Entscheidungen notwendigen Kontext nicht erhalten.
Cloudera führt Daten und KI zusammen – in einem einzigen, zusammenhängenden Lebenszyklus. Daten fließen reibungslos in KI-Workflows ein, die durch gemeinsame Metadaten, Sicherheitsrichtlinien und optimierte Rechenressourcen verwaltet werden. Dieser Ansatz verhindert kostspielige Datenduplikate und -verschiebungen und ermöglicht die Rückverfolgbarkeit jeder Vorhersage bis zu ihrer Quelle. So stellt er Transparenz, Vertrauen und Compliance sicher.
Sind Sie so weit, Reibungsverluste bei der Integration hinter sich zu lassen? Erkunden Sie die MCP-Server von Cloudera für Apache Iceberg hier – derzeit als Vorschau verfügbar – und erfahren Sie, wie Sie Ihren KI-Anwendungen den Kontext mitgeben können, den sie benötigen, und zwar genau dort, wo sich Ihre Daten befinden. Starten Sie noch heute und probieren Sie unsere KOSTENLOSE 5-Tage-Testversion aus.
This may have been caused by one of the following: