Entdecken Sie die Cloudera Data Platform
CDP unterstützt eine datengesteuerte Entscheidungsfindung durch einfache, schnelle und sichere Verbindung und Sicherung des gesamten Datenlebenszyklus.
Verwalten und sichern Sie den Datenlebenszyklus in jeder Cloud und jedem Rechenzentrum
-
DataFlow
-
Daten-Engineering
-
Data Warehouse
-
OpDB
-
Maschinelles Lernen
-
SDX
-
Control Plane
DataFlow: Sammeln Sie Flows, Streams und Analysen für den Lebenszyklus
Einfaches Erfassen, Weiterleiten, Verwalten und Bereitstellen von Data at Rest (ruhende Daten) und Data in Motion (bewegte Daten) von der Edge, einer beliebigen Cloud oder dem Rechenzentrum an ein nachgeschaltetes System mit integrierter End-to-End-Sicherheit und Herkunft. CDP Data Hub verwendet Apache NiFi für das Flow-Management und Apache Kafka für Streams Messaging—beides ist Teil von Cloudera DataFlow, einer umfassenden Echtzeit-Streaming-Datenplattform, die wichtige Erkenntnisse und sofort verwertbare Informationen liefert.
Data Engineering: Bereichern, Verfeinern, Strukturieren und Aufbereiten von Daten für den Lebenszyklus
Cloudera Data Engineering unterstützt beim Anreichern, Transformieren und Bereinigen von Daten und erleichtert das Erstellen, Ausführen und Verwalten von End-to-End-Datenpipelines. Es führt eine Vielzahl von Datenverarbeitungs-Workloads mit höchster Leistungsfähigkeit aus, einschließlich Batch- und Echtzeit-Stream-Verarbeitung mit Apache Spark und Spark Streaming, unterstützt durch mehrere Speicheroptionen, wie etwa Apache HBase, Apache Kudu und Cloud-Objektspeicher.
Data Warehouse: Bieten Sie Self-Service-Zugriff für das Reporting für den Lebenszyklus
Bieten Sie Tausenden von Benutzern Geschäftsinformationen über riesige Mengen an verifizierten Daten mit extremer Geschwindigkeit und Skalierbarkeit, ohne die Compliance zu beeinträchtigen und das Budget zu sprengen. Cloudera Data Warehouse überträgt lokale Workloads nahtlos und sicher in jede Cloud und übertrifft die Schatten-IT, indem es mit den sich ändernden Geschäftsanforderungen Schritt hält und SLAs mit Self-Service-Zugriff auf Berichte, Dashboards und erweiterte Analysen erfüllt.
Operational Database: Stellen Sie alle Arten von Daten aus allen Quellen für den Lebenszyklus bereit
Die Cloudera Operational Database liefert strukturierte Daten neben unstrukturierten Daten innerhalb einer einheitlichen End-to-End-Open-Source-Plattform und stellt damit sicher, dass die Entscheidungsfindung durch Stream-Verarbeitung und Echtzeitanalysen bei sich ständig ändernden Daten gesteuert wird. Benutzer können Echtzeitdaten in großem Maßstab mit hoher Parallelität und geringer Latenz sowie Data Science in großem Maßstab bereitstellen, um Modelle für maschinelles Lernen mühelos zu erstellen, zu bewerten und in Produktion bereitzustellen.
Maschinelles Lernen: Operationalisieren Sie die Vorhersage für den Lebenszyklus
Beschleunigen Sie Data Science in Unternehmen von der Forschung bis zur Produktion in großem Maßstab mit kollaborativen Self-Service-Workflows für die Entwicklung und Operationalisierung von Modellen für maschinelles Lernen. Cloudera Machine Learning verwendet Python, R und Scala direkt im Webbrowser und bietet Data-Science-Teams ein leistungsstarkes Self-Service-Erlebnis, mit dem sie neue Funktionen für maschinelles Lernen entwickeln, prototypisieren und problemlos für die Produktion bereitstellen können.
SDX: Gewährleisten Sie Sicherheit, Governance und Herkunft über den gesamten Lebenszyklus
Cloudera SDX (Shared Data Experience) bietet eine unternehmensweite Datensicherheits- und Governance-Struktur, die den Datenlebenszyklus umfasst. Mit SDX können Sicherheits- und Governance-Richtlinien für Daten und Metadaten einmal festgelegt und automatisch über den gesamten Datenlebenszyklus in hybriden, privaten oder Multi-Cloud-Umgebungen durchgesetzt werden, um einen sicheren und konformen Datenzugriff im gesamten Unternehmen zu gewährleisten.
Control Plane: Verwalten Sie CDP-Dienste mit gängigen Tools über den gesamten Lebenszyklus
Verwalten, überwachen und orchestrieren Sie alle CDP-Dienste zentral auf einen Blick mit konsistenter Sicherheit und Governance. Control Plane besteht aus Workload Manager, Replication Manager, Data Catalog und Management Console und bietet leistungsstarke Tools, die Funktionen für Datenverwaltung, Workload-Analyse, Datenverschiebung und Datenerkennung bieten und überall multifunktionale Analysen ermöglichen.