Übersicht
Optimieren und operationalisieren Sie Datenpipelines sicher und in jeder Größenordnung.
CDP Data Engineering ist der einzige native Cloud-Service, der speziell für Enterprise-Data-Engineering-Teams entwickelt wurde. Data Engineering baut auf Apache Spark auf und ist ein umfassendes Data-Engineering-Toolset, das die Automatisierung der Koordinierung mit Apache Airflow, eine erweiterte Pipeline-Überwachung, visuelle Fehlerbehebung und umfassende Management-Tools zur Rationalisierung von ETL-Prozessen in unternehmensweiten Analyse-Teams ermöglicht.
Data Engineering ist vollständig in die Cloudera Data Platform integriert, was durchgängige Transparenz und Sicherheit mit SDX sowie nahtlose Integrationen in CDP-Dienste wie Data Warehouse und Machine Learning ermöglicht. Data Engineering on CDP ermöglicht konsistente, wiederholbare und automatisierte Daten-Engineering-Workflows auf einer hybriden Cloud-Plattform an jedem beliebigen Ort.
Anwendungsfälle
Datenpipelines überall automatisieren
Transparenz und Kontrolle über ETL gewinnen
Durchgängige Datenintegrität wahren
Datenpipelines überall automatisieren
Übermitteln Sie qualitativ hochwertige Datensätze sicher an CDP Data Warehouse, CDP Machine Learning oder jedes andere Analysewerkzeug.
Mit Data Engineering lassen sich Datenpipelines für Analyseteams optimieren – vom maschinellen Lernen bis zum Data Warehousing und darüber hinaus. Beschleunigen Sie die Wertschöpfung durch die Orchestrierung und Automatisierung von Pipelines, um überall übersichtliche, qualitativ hochwertige Datensätze sicher und transparent bereitzustellen.
Transparenz und Kontrolle über ETL gewinnen
Verwalten Sie Ihren Datenlebenszyklus ganzheitlich und transparent.
Das Verwalten des Datenlebenszyklus und die Kontrolle der Kosten werden immer komplexer, wenn Sie versuchen, Datenpipelines im gesamten Unternehmen in großem Umfang umzusetzen.
Data Engineering bietet eine Reihe von Funktionen für die operative Steuerung und Transparenz: für die Kapazitätsplanung, Pipeline-Automatisierung, automatische Erfassung der Datenherkunft und die Fehlerbehebung in allen Anwendungsfällen.

Durchgängige Datenintegrität wahren
Vollständige Transparenz in der Datenpipeline schützt Ihr Unternehmen.
Angesichts der zunehmenden Menge und Komplexität von Daten kann es schwierig sein, bei der Skalierung analytischer Workloads im gesamten Unternehmen stets Präzision und Zuverlässigkeit zu gewährleisten.
Data Engineering bietet eine native Überwachung und Warnungen für Datenpipelines, damit Sie Probleme frühzeitig erkennen. Zudem umfasst sie eine visuelle Fehlerbehebung, damit Sie Probleme schnell beheben können, bevor sie sich auf Ihr Unternehmen auswirken.

Koordinieren Sie komplexe Datentransformations-Workflows, die von Apache Airflow mit Hunderten von Operatoren unterstützt werden, um geschäftskritische Analyseanforderungen zu erfüllen.
Data Engineering ist containerisiert, skalierbar und portabel, mit isolierten Workload-Umgebungen und Sicherungen, die ein sicheres Pipeline-Management mit flexibler On-Demand-Berechnung ermöglichen, um geschäftliche SLA kosteneffizient zu erfüllen.
Visualisieren Sie Leistungsmetriken wie CPU, Arbeitsspeicher und E/A in allen Phasen Ihrer Spark-Aufträge, um Leistungsengpässe zu erkennen und bei der Fehlerbehebung die Nadel im Heuhaufen zu finden.
Nutzen Sie mit einer CLI und mit REST-APIs eine umfassende Benutzerschnittstelle für die Auftragsverwaltung für die einfache Automatisierung und Integration in bestehende Workflows wie CI/CD-Pipelines und Drittanbieter-Tools.
Data Engineering bietet einen vollständig integrierten Spark-Service, der auf Kubernetes ausgeführt wird, der die Artefaktverwaltung, Sicherheit und Ressourcenplanung automatisiert und optimiert. Dazu nutzt er Apache Yunikorn für die FIFO- und GANG-Planung.
Von einer zentralen Schnittstelle aus können Plattformadministratoren Zugriffs- und Sicherheitsaspekte verwalten und schnell neue Workloads bereitstellen. Gleichzeitig können sie die Kapazitäten einfach überwachen und die Ressourcennutzung im Zeitverlauf visualisieren. SDX ermöglicht außerdem die Verfolgung der Datenherkunft über den gesamten Lebenszyklus, damit Sie über den Ursprung und den Verbleib von Daten informiert sind.
Starten Sie jetzt
CDP-Demo
Sehen Sie sich eine On-Demand-Demo an, um zu erfahren, wie Sie Ihre unternehmensweiten Data-Engineering-Workflows überall beschleunigen können.
Die CDP per Videotour entdecken
Werfen Sie bei einer Videotour zur CDP einen Blick hinter die Kulissen und entdecken Sie, wie sichere und optimierte Data-Engineering-Workflows mehr Vorteile für Ihr Unternehmen bringen.
Technische Ressourcen der CDP
Sparen Sie Zeit mit einer zentralen Anlaufstelle für technische Informationen und Ressourcen, um Ihre Kenntnisse zu erweitern und sich Wissen über Cloudera Data Engineering anzueignen.
Kostenlose Schulung
Nutzen Sie On-Demand-Schulungen, um sich in Bezug auf Data Engineering auf den neuesten Stand zu bringen und eine schnelle und sichere Pipeline-Bereitstellung im gesamten Unternehmen zu ermöglichen.
Preise
Bewerten Sie Preise, Abrechnungsbedingungen, Lizenzierungsdetails und Stundensätze und schätzen Sie Kosten mit praktischen Rechnern.
Produktdokumentation
Finden Sie den richtigen Einstieg mit Best Practices für Ressourcenplanung, Produktkonfiguration und alles, was Sie für das Data Engineering brauchen.