Erfahren Sie hier von drei Branchenexperten die Trends für 2025 bei Daten und KI 

Jetzt ansehen

Informieren Sie sich über das neue Kubernetes-Release für Bewegtdaten.      Webinar ansehen

Übersicht

Was ist Streaming?

Cloudera Streaming (vormals Cloudera Stream Processing) ermöglicht es Kunden, Datenströme in Datenprodukte umzuwandeln, indem es Funktionen zur Datenstromanalyse für komplexe Muster und zur Gewinnung verwertbarer Informationen bereitstellt.

Streaming basiert auf Apache Flink und Kafka und dient als vollständige Unternehmenslösung für Datenstromverwaltung und zustandsbehaftete Verarbeitung. Dank der Kombination von Kafka als Grundlage für die Speicherung von Datenströmen, Flink als der zentralen Engine für die In‑Stream-Verarbeitung sowie erstklassiger Unterstützung branchenüblicher Schnittstellen wie SQL und REST können Entwickler, Datenanalysten und Datenwissenschaftler ganz einfach hybride Pipelines für Streaming-Daten erstellen, die Echtzeit-Datenprodukte, Dashboards, Business-Intelligence-Anwendungen, Microservices und Data Science Notebooks unterstützen. 

Indem Datenverarbeitungskomponenten weiter nach oben verschoben werden, können die Echtzeit-Anforderungen zahlreicher Anwendungsfälle erfüllt werden – von Betrugserkennung und Netzwerkbedrohungsanalyse über Manufacturing Intelligence und Commerce-Optimierung bis hin zu Echtzeit-Angeboten und sofortigen Kreditgenehmigungen.

Hybride Streaming-Datenpipelines auf Basis von Cloudera Streaming

Ein Diagramm hybrider Streaming-Pipelines | Cloudera

Anwendungsfälle für Cloudera Streaming

  • Betrugserkennung
  • Kundenanalysen
  • Marktüberwachung
  • Protokollanalysen

Betrugserkennung

Vermeiden Sie Verluste in Millionenhöhe, indem Sie Finanzbetrug proaktiv ermitteln. 

Unternehmen der Einzelhandels-, der Finanzdienstleistungs- und anderer Branchen haben Mühe, Kundendaten zu schützen und Finanzbetrug zu verhindern. Mit den Funktionen von Cloudera Streaming können Kundentransaktionen in Echtzeit verarbeitet, Muster erkannt, vorausschauende Warnungen erstellt und verwertbare Informationen aufgedeckt werden, um potenzielle Betrugsfälle zu verhindern.

Logo der BRI Bank
PT Bank Rakyat Indonesia

Nutzung von Big Data, KI und ML, um Kunden besser zu verstehen

Die Bank erreichte einen Rückgang von Betrugsfällen um 40 Prozent.

Kundenerfolgsgeschichte lesen

Kundenanalysen

Kundenanalysen in Echtzeit verbessern Kundeninteraktionen sowie die Bindung und Zufriedenheit von Kunden.

Jedes Unternehmen ist auf Echtzeitanalysen angewiesen, um die Kundenbindung zu verbessern. Durch übermäßige Datenmengen tun sich jedoch viele mit der Implementierung entsprechender Lösungen schwer. Cloudera Streaming ermöglicht Kundenanalysen, indem es große Datenmengen mit Latenzen von weniger als einer Sekunde verarbeitet. Gleichzeitig erkennt es Kundeninteraktionen und liefert bessere Angebotsvorschläge in Echtzeit.

Große Fluggesellschaft

Verbesserung des Kundenerlebnisses dank datengesteuerter Automatisierung

Reduzierung des Datenvolumens um 50 Prozent, da die Übertragung von Datenströmen nur einmal bezahlt wird.

Kundenerfolgsgeschichte lesen

Marktüberwachung

Wickeln Sie Millionen von Transaktionen pro Sekunde ab, und skalieren Sie auf Petabyte an Finanzinformationen.

Kundenanforderungen an Echtzeit-Berichterstattung und schnellere SLA-Bereitstellung stellen Finanzbörsen vor Herausforderungen. Petabytes von Daten müssen verarbeitet werden, um diese Services bereitzustellen. Cloudera Streams Messaging kann problemlos große Datenmengen streamen, sodass Wertpapierbörsen schnell marktgerechte Echtzeit-Analysen erstellen und die immer anspruchsvolleren SLAs erfüllen können.

Logo der BSE, Bombay Stock Exchange
Bombay Stock Exchange

Die weltweit schnellste Börse nutzt Echtzeit-Analysen zur Verbesserung von Data Governance und branchenführenden SLAs

Reduzierung der Betriebskosten um 95 %

Kundenerfolgsgeschichte lesen

Protokollanalysen

Modernisieren Sie Ihre Protokollierungsinfrastruktur, um Analysen in Echtzeit zu erhalten.

Protokolldaten werden für Unternehmen immer wertvoller. IT-Organisationen kämpfen jedoch mit der Einführung effektiver Prozesse zur Erfassung von Protokollen, mit der Verteilung von relevanten Informationen in vorgeschalteten Prozessen und mit der Generierung von Schlüsselkennzahlen. Die Funktionen von Cloudera Streaming unterstützen den Ausbau der Protokollverarbeitung, liefern Echtzeit-Einblicke im gesamten Unternehmen und sorgen für erheblich geringere Betriebskosten.

Globe-Logo
Globe Telecom

Ermöglichen Sie den digitalen Lebensstil mobiler Kunden mit einer modernen Analyseumgebung

Ein Volumen von 9.600 PB an verwalteten mobilen Daten

Kundenerfolgsgeschichte lesen

Informieren Sie sich über das neue Kubernetes-Release für Bewegtdaten

Funktionen von Cloudera Streaming

  • Streaming Analytics auf Basis von Apache Flink
  • Streams Messaging auf Basis von Apache Kafka

Streaming-Analytics

Cloudera Streaming Analytics basiert auf Apache Flink mit SQL Stream Builder und bietet:

  • Funktionen zur latenzarmen Datenstromverarbeitung
  • vereinfachte Entwicklung durch mögliche Erstellung von Streaming-Anwendungen mit SQL und APIs nach Branchenstandard über REST-Endpunkte
  • erweiterte Fenstertechniken zum Erstellen fortschrittlicher ereignisgesteuerter Analysen
  • Unterstützung für Multi-Cloud- und Hybrid-Cloud-Modelle

Wichtigste Merkmale


Streaming-SQL und robuste Daten-APIs

Cloudera SQL Stream Builder ist eine umfassende, interaktive UI zum Erstellen von Aufträgen zustandsbehafteter Datenstromverarbeitung mit SQL, die in optimierte Flink-Aufträge konvertiert wird. SQL ermöglicht die unkomplizierte Deklaration von Ausdrücken, um Datenströme zu filtern, zu aggregieren, weiterzuleiten und anderweitig zu verändern. SQL Stream Builder ist eine Schnittstelle zur Auftragsverwaltung, mit der Sie SQL in Streams erstellen und ausführen sowie robuste Daten-APIs für die Ergebnisse erstellen können.

Exakt eine Verarbeitung

Stellen Sie sicher, dass Daten auch bei Fehlern und Wiederholungen immer exakt einmal verarbeitet werden. So kann etwa ein Finanzdienstleistungsunternehmen mithilfe der Verarbeitung von Datenströmen Hunderte von Backoffice-Transaktionssystemen koordinieren, wenn Verbraucher ihre Hypothek bezahlen.

Bearbeitung spät ankommender Daten

Erkennen und reagieren Sie auf Streaming-Ereignisse, die in falscher Reihenfolge auftreten. Beispielsweise müssen Dienste zur Echtzeit-Betrugsbekämpfung sicherstellen, dass Daten in der richtigen Reihenfolge verarbeitet werden, selbst wenn Daten verspätet ankommen.

Extrem niedrige Latenz

Erzielen Sie In‑Memory-Performance mit nacheinander verarbeiteten Datenströmen. Verarbeiten Sie beispielsweise Anfragen von 30 Millionen aktiven Benutzern, die Kreditkartenzahlungen, Überweisungen und Kontostandabfragen durchführen, mit einer Latenz von Millisekunden.

Zustandsbehaftete Ereignisauslöser

Lösen Sie Ereignisse aus, während Sie Hunderte von Streaming-Quellen und Millionen von Ereignissen pro Sekunde und Stream bearbeiten. Im Falle eines Patienten, der in die Notaufnahme kommt, greift das System beispielsweise auf externe Systeme zu und ruft patientenspezifische Daten aus Hunderten von Quellen ab, sodass sie in einem EMR-Datensatz verfügbar sind, sobald der Patient den Untersuchungsraum betritt.

Konvergenz von Streaming und Batch

Streaming-Daten entfalten erst dann ihren Wert, wenn diese Streams auch einfach in andere Data‑at‑Rest-Quellen wie Warehouses, relationale Datenbanken und Data Lakes integriert, mit ihnen verbunden und vernetzt werden können. Konfigurieren Sie Datenanbieter mit sofort einsatzbereiten Konnektoren oder Ihrem eigenen Konnektor für jede Datenquelle. Nach Erstellung der Datenanbieter kann der Benutzer mithilfe von DDL ganz einfach virtuelle Tabellen erstellen. Komplexe Integration zwischen mehreren Streams und Batch-Datenquellen wird mit bekannten SQL-Konstruktionen wie Joins und Aggregationen einfacher.

Streams Messaging

Cloudera Streams Messaging basiert auf Apache Kafka und bietet:

  • Streams Messaging Manager für Überwachung/Betrieb von Clustern
  • Streams Replication Manager für Bereitstellungen mit hoher Verfügbarkeit und Notfallwiederherstellung
  • Schema Registry für zentralisierte Schemaverwaltung
  • Kafka Connect für einfache Datenbewegung und Erfassung von Änderungsdaten sowie Cruise Control für intelligentes Rebalancing und Self-Healing
  • Unterstützung für Multi-Cloud- und Hybrid-Cloud-Modelle

Wichtigste Merkmale


Hochgradig skalierbare Stream-Pufferung

Unterstützt Millionen von Nachrichten pro Sekunde mit niedriger Latenz und hohem Durchsatz und skaliert elastisch und transparent ohne Ausfallzeiten. Unterstützt eine Vielzahl von Streaming-Daten-Initiativen, die es Unternehmen ermöglichen, mit der Kundennachfrage Schritt zu halten, bessere Dienstleistungen anzubieten und Risiken proaktiv zu steuern.

Zentrale Kafka-Überwachung und -Verwaltung

Der Streams Messaging Manager bietet durchgängige Transparenz und eine zentrale Sicht auf die Datenbewegungen in Kafka-Clustern – zwischen Herstellern, Brokern, Themen und Verbrauchern – und ermöglicht es Ihnen, die Datenherkunft und -steuerung von der Netzwerkperipherie bis in die Cloud zu verfolgen. Zudem vereinfacht er dank intelligenter Filterung und Sortierung die Fehlersuche in Kafka-Umgebungen.

Widerstandsfähigkeit und Replikation in Katastrophenfällen

Der Streams Replication Manager, der auf Mirrormaker 2 basiert, bietet eine fehlertolerante, skalierbare und robuste Cluster-übergreifende Kafka-Themenreplikation sowie eine Replikationsüberwachung und Metriken auf Cluster- und Themenebenen. Er bietet Hochverfügbarkeit, Disaster Recovery, Cloud-Migrationen, Geo-Proximity und vieles mehr.

Zentrale Schemaverwaltung

Mit Schema Registry können Sie alle Hersteller- und Kundenschemata in einem gemeinsam genutzten Schema-Repository verwalten, teilen und deren Weiterentwicklung unterstützen. So können Anwendungen in der gesamten Kafka-Landschaft flexibel miteinander interagieren. Mildern Sie Unterbrechungen, die aufgrund von Schema-Abweichungen auftreten, sicher ab.

Automatische Neujustierung und Self-Healing

Mit Cruise Control können Sie große Kafka-Installationen samt Lastausgleich verwalten. Darüber hinaus können Sie Anomalien automatisch erkennen und beheben. Gehen Sie schwierige Probleme wie häufige Ausfälle von Hardware oder virtuellen Maschinen, Cluster-Erweiterungen/-Reduzierungen und Lastdifferenzen zwischen Brokern an.

Einheitliche Sicherheit und Governance

Cloudera SDX bietet zentrale Sicherheit, Kontrollrichtlinien, Governance und Datenherkunftsnachweise über alle Komponenten hinweg. Sie werden einmal festgelegt, automatisch durchgesetzt und sind anbieterunabhängig, sodass Sie Multi-Cloud- und Hybrid-Cloud-Strategien bedenkenlos übernehmen können. Zudem unterstützt SDX die vier wichtigsten Grundpfeiler der Sicherheit: Identität, Zugriff, Datenschutz und Transparenz.

Alle Daten, überall, mit flexiblen Bereitstellungsoptionen.


Cloudera Streaming in der Cloud

Cloudera verfügt über einen vollständigen Satz integrierter Stream-Verarbeitungsfunktionen, die für eine effiziente Skalierung in der öffentlichen Cloud bereitgestellt werden können.

Cloudera Streaming basiert auf Apache Kafka- und Apache Flink-Engines mit Tools der Unternehmensklasse, um die Bereitstellung und Verwaltung zu vereinfachen.

Der Streams Messaging Manager erweitert Apache Kafka um eine Reihe von Funktionen für Schema-Governance und -überwachung, Disaster Recovery, intelligentes Rebalancing sowie robuste Zugriffskontrolle und -prüfung.

SQL Stream Builder erweitert Apache Flink um eine leistungsstarke SQL-Konsole, mit der SQL-Analysten Streaming-Daten abfragen und über die sie zusammenarbeiten können. Außerdem können sie die Verarbeitungslogik von Versionen für nachgelagerte Anwendungen steuern.


Cloudera Streaming on Premises

Cloudera kann vor Ort mit Streaming-Daten bereitgestellt werden, um die Kosten zu kontrollieren und die Latenz für Echtzeit-Pipelines und -Anwendungen zu minimieren. Cloudera Streaming integriert Apache Kafka und Apache Flink in die Unternehmenstools, die zur Verwaltung dieser Implementierungen erforderlich sind. 


Cloudera Streaming – Kubernetes-Operatoren

Cloudera-Streaming-Funktionen sind auch als Kubernetes-Operatoren verfügbar, die unabhängig über vorhandene Kubernetes-Cluster bereitgestellt werden können. Dies macht die Bereitstellung und Skalierung von Kafka im Unternehmen noch einfacher. Der Kubernetes-Operator wird mit Kafka, Cruise Control und Zookeeper ausgeliefert und ermöglicht Streaming-Anwendungsfälle in Kubernetes mit einem robusten Message-Broker-Dienst sowie Flink und SQL Stream Builder, die eine moderne verteilte Stream-Verarbeitungs-Engine zum Erstellen von Echtzeit-Streaming-Anwendungen bieten, die nativ auf Containern ausgeführt werden.

Sie möchten mehr erfahren?

Produkttour zu Cloudera Streaming ansehen

Cloudera Streaming Community Edition

Die Cloudera Streaming Community Edition erleichtert die Entwicklung von Streamprozessoren und kann direkt von Ihrem Desktop oder jedem anderen Entwicklungsknoten aus durchgeführt werden.

Analysten, Datenwissenschaftler und Entwickler können jetzt neue Funktionen evaluieren und SQL-basierte Streamprozessoren sowie Kafka Consumer/Producer und Kafka-Connect-Konnektoren vor dem Übergang in die produktive Nutzung lokal erstellen.

Mit der Streaming Community Edition können Sie in 5 Minuten loslegen.

Erfahren Sie mehr 

GigaOm Radar für Streaming-Datenplattformen

Cloudera wurde 2024 zum Marktführer für Streaming-Datenplattformen ernannt.

Laden sie den Bericht herunter

GigaOm Radar für Streaming-Datenplattformen | Cloudera
Webinar

Streaming-Pipeline-Implementierungen mit neuen Kubernetes-Operatoren beschleunigen

Datasheet

Datenblatt zu Cloudera Streaming

Whitepaper

Cloudera bietet heute das beste Kafka-Ökosystem

Whitepaper

Apache Kafka mit Cloudera verwalten, überwachen und replizieren

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.