Übersicht
Stellen Sie eine breite Palette von Analysen in der Public Cloud schnell und einfach bereit.
CDP Data Hub ist ein leistungsstarker Analysedienst auf der Cloudera Data Platform (CDP) Public Cloud, der es einfacher und schneller macht, hochwertige Analysen vom Edge zur KI in einem vertrauten Cluster-Modell in der Cloud zu erzielen. CDP Data Hub unterstützt die größte Bandbreite an analytischen Workloads – einschließlich Streaming-, ETL-, Data-Mart-, Datenbank- und ML-Workloads. So können Sie ganz einfach lokal verfügbare Workloads in die Cloud verschieben oder direkt in der Cloud erstellen.
Die umfassende Cloud-Lösung basiert auf Cloudera Runtime, einer Suite integrierter Open-Source-Technologien, und baut auf SDX auf. Sie bietet eine umfangreiche Auswahl an Cluster-Formen, Workload-Typen, vorgefertigten Vorlagen und Konfigurationsoptionen und bietet Benutzern, die mit traditionellen Architekturen vertraut sind, damit eine intuitive, anpassbare Erfahrung.
Data-Hub-Anwendungsfälle
Ihre Umstellung auf die Cloud erleichtern
Dank einer Plattform, die sowohl Public als auch Private Clouds bietet, können Sie lokale Cloudera-Workloads problemlos in die Public Cloud verlagern:
- Verbesserte Leistung, zuverlässige Governance und Verfügbarkeit der Public Cloud
- Die Flexibilität, Ihre Workloads in beiden Bereitstellungsmodellen zu optimieren
- Die Vorteile eines vertrauten Formfaktors mit einem herkömmlichen Cluster-Modell erleichtern Ihren Wechsel in die Cloud
- Ein nahtloser Migrationspfad zu den containerbasierten Erfahrungen der CDP
Komplexe Multi-Analyse-Workloads schnell bereitstellen
Beschleunigen Sie die Bereitstellung komplexer Workloads in der Public Cloud über den gesamten Datenlebenszyklus hinweg mit folgenden Aspekten:
- Einer Cloud-basierten Architektur, mit der Sie eine Vielzahl von flexiblen, benutzerdefinierten Analyse-Workloads einsetzen können
- Ein intuitives Erlebnis mit vertrauten knotenbasierten Clustern, unabhängig davon, ob Sie einen vorlagenbasierten Ansatz wählen oder Ihre eigenen Workloads erstellen
- Ein hohes Maß an Anpassungsmöglichkeiten, die es Ihnen ermöglichen, Workloads gemäß Ihren spezifischen Geschäftsanforderungen bereitzustellen
Workloads auswählen
Data Mart in Echtzeit
Data Engineering für komplexe Pipelines
Streaming in der Hybrid Cloud
Operative Datenbank
Data Mart in Echtzeit
Analysen großer Mengen schnell einströmender Daten ermöglichen
Mit der Echtzeit-Data-Mart-Vorlage im Data Hub können Sie Millionen von Datensätzen pro Sekunde aufnehmen – bei Bedarf direkt mit Aktualisierungen. Die Daten stehen sofort im optimalen Format für Abfragen zur Verfügung. Dieses Muster ist ideal für Zeitreihenanwendungen, Ereignisanalysen, CDC-Abgleiche und Echtzeit-Datenverarbeitungspipelines. Die Vorlage enthält die analytische Speicher-Engine Apache Kudu, Apache Impala für eine schnelle SQL-Ausführung, HUE für die SQL-Entwicklung und -Analyse und Apache Spark Streaming für die Verarbeitung und Analyse von Datenströmen.
Data Engineering für komplexe Pipelines
Daten anreichern, transformieren und laden
Mit Data Hub können Sie Daten anreichern, transformieren und bereinigen, um durchgängige Datenpipelines mit hoher Flexibilität und Anpassungsfähigkeit zu erstellen, auszuführen und zu verwalten. Die Vorlage für das Data Engineering ermöglicht es Ihnen, eine breite Palette von Datenverarbeitungs-Workloads auszuführen, einschließlich der Hintergrund- und Echtzeitverarbeitung von Datenströmen mit Apache Spark und Hive.
Streaming in der Hybrid Cloud
Echtzeitanalysen erfassen, verarbeiten und erstellen
DataFlow für CDP Data Hub ist eine umfassende Edge-to-Cloud-Streaming-Datenplattform, die einige der Herausforderungen von Streaming-Daten in hybriden Umgebungen mit Apache NiFi und Kafka bewältigt. Sie ermöglicht es Benutzern, das lokale Streaming-Erlebnis von Cloudera DataFlow auf die Cloud zu erweitern, ohne dass dafür umfangreiche Ressourcen für Entwicklung, Konfiguration und Wartung benötigt werden.
Operative Datenbank
Erstellen Sie hochgradig zuverlässige Anwendungen der Enterprise-Klasse.
Mit Data Hub können Sie hochleistungsfähige NoSQL-Datenbanken mit Unterstützung für ANSI-SQL betreiben. Dies bietet beispiellose Skalierbarkeit und Leistung für geschäftskritische operative Anwendungen mit Apache HBase. Die operative Datenbank bietet eine Schemaunterstützung, die weiterentwickelt werden kann. Sie ermöglicht es Entwicklern, die Leistungsstärke von Daten zu nutzen und gleichzeitig im Anwendungsdesign flexibel zu bleiben. Außerdem bietet sie eine automatische Skalierung auf Basis der Workload-Auslastung des Clusters, um Auslastung und Kosten der Infrastruktur zu optimieren.