5-Part Webinar Series   A Visionary Future with Enterprise GenAI | Nov 20

Jetzt registrieren
Übersicht

Data-Lake-Flexibilität und Data-Warehouse-Leistung auf einer einzigen Plattform.

Ein offenes Data Lakehouse hilft Unternehmen dabei, schnelle Analysen sowohl für strukturierte als auch für unstrukturierte Daten in großem Umfang durchzuführen. Es beseitigt Datensilos und ermöglicht Datenteams die Zusammenarbeit an denselben Daten mit den Tools ihrer Wahl in jeder öffentlichen und privaten Cloud.

Diese moderne Datenarchitektur ermöglicht zuverlässige Daten, die einfach verwaltet werden können.  Führen Sie BI-, KI-, ML- und Streaming-Analysen für dieselben Daten aus, ohne Ihre Daten je verschieben oder sperren zu müssen.

Diagramm: Cloudera-Plattform

Cloudera bietet das weltweit einzige offene Data Lakehouse, das folgende Vorteile bietet:

Offene Architektur

Das Data Lakehouse von Cloudera auf Basis von Apache Iceberg ist zu 100 % offen: Es verfügt über eine Open-Source-Architektur und offene Standards, die in der Community breite Akzeptanz finden. Es kann verschiedene Datenformate speichern und ermöglicht es, dass mehrere Engines an denselben Daten arbeiten.

Einfache Übernahme

Durch die Integration von Iceberg direkt in Shared Data Experience (SDX) bietet Cloudera die einfachste Möglichkeit zur Bereitstellung eines Lakehouse. Zusätzliche Funktionen wie etwa die Schemaweiterentwicklung oder verborgene Partitionierung erleichtern die Verwaltung von Daten in großen Datensätzen.

Multi-Cloud

Erstellen Sie ein Data Lakehouse an einem beliebigen Ort: in jeder Public Cloud oder in Ihrem eigenen Rechenzentrum. Erstellen Sie es einmal, und führen Sie es überall problemlos aus. Cloudera bietet dieselben Datenservices mit vollständiger Portabilität in alle Clouds.

Sicher und verwaltet

Die Iceberg-Tabellen in Cloudera sind in SDX integriert und ermöglichen einheitliche Sicherheit, fein abgestimmte Richtlinien, Governance sowie Herkunfts- und Metadatenmanagement über mehrere Clouds hinweg, sodass Sie sich auf die Analyse Ihrer Daten konzentrieren können, während wir uns um den Rest kümmern.

Das Open Data Lakehouse von Cloudera ist jetzt für Private Clouds verfügbar.
Wichtige Komponenten
 

Optimieren Sie Ihre Daten mit einem offenen Lakehouse

Multifunktionale Analysen

Cloudera bietet die gesamte Bandbreite von Datenservices, um KI-, ML-, BI- und Streaming-Analysen sowie Daten-Engineering in Ihrem Data Lakehouse auszuführen. Von Datenaufnahme und Streaming, über Verarbeitung und Persistenz, Orchestrierung und Erkennung bis hin zu Zugriffen bieten leistungsstarke und skalierbare Datenservices wichtige Analysefunktionen. Zudem können Sie auch Ihre eigenen Tools verwenden.

Multifunktionale Analysen

Cloudera bietet die gesamte Bandbreite von Datenservices, um KI-, ML-, BI- und Streaming-Analysen sowie Daten-Engineering in Ihrem Data Lakehouse auszuführen. Von Datenaufnahme und Streaming, über Verarbeitung und Persistenz, Orchestrierung und Erkennung bis hin zu Zugriffen bieten leistungsstarke und skalierbare Datenservices wichtige Analysefunktionen. Zudem können Sie auch Ihre eigenen Tools verwenden.

 

 

Offenes Tabellenformat, Apache Iceberg

Apache Iceberg ist der wichtigste Baustein eines offenen Data Lakehouse. Es ist ein leistungsstarkes offenes Tabellenformat für große Analysetabellen, das die Zuverlässigkeit von SQL-Tabellen in Big Data einbringt. Zudem ermöglicht es, dass mehrere Datenverarbeitungs-Engines gleichzeitig arbeiten. Es bietet umfangreiche Funktionen wie Time Travel, Snapshot-Isolation, Schemaweiterentwicklung, verborgene Partitionierung und mehr.

Offenes Tabellenformat, Apache Iceberg

Apache Iceberg ist der wichtigste Baustein eines offenen Data Lakehouse. Es ist ein leistungsstarkes offenes Tabellenformat für große Analysetabellen, das die Zuverlässigkeit von SQL-Tabellen in Big Data einbringt. Zudem ermöglicht es, dass mehrere Datenverarbeitungs-Engines gleichzeitig arbeiten. Es bietet umfangreiche Funktionen wie Time Travel, Snapshot-Isolation, Schemaweiterentwicklung, verborgene Partitionierung und mehr.

 

 

Shared Data Experience (SDX)

SDX ist ein grundlegender Bestandteil von Cloudera, der einheitliche Sicherheits- und Governance-Technologien umfasst, die auf Metadaten basieren. SDX bietet ein vollständiges Datenmanagement für Daten und Analysen ortsunabhängig in allen Infrastrukturen und reduziert Risiken sowie Betriebskosten. Die IT-Abteilung kann umfassend gesicherte und verwaltete Data Lakehouses schneller bereitstellen und mehr Benutzern uneingeschränkt Zugriff auf eine größere Menge von Daten gewähren.

Shared Data Experience (SDX)

SDX ist ein grundlegender Bestandteil von Cloudera, der einheitliche Sicherheits- und Governance-Technologien umfasst, die auf Metadaten basieren. SDX bietet ein vollständiges Datenmanagement für Daten und Analysen ortsunabhängig in allen Infrastrukturen und reduziert Risiken sowie Betriebskosten. Die IT-Abteilung kann umfassend gesicherte und verwaltete Data Lakehouses schneller bereitstellen und mehr Benutzern uneingeschränkt Zugriff auf eine größere Menge von Daten gewähren.

 

 

Robuster Data Catalog

Suchen, kuratieren und taggen Sie Daten über alle Infrastrukturen hinweg, und generieren Sie mit Cloudera Data Catalog relevante Informationen, um: 

  • Alle Ihre Daten von einem einzigen Ort aus zu durchsuchen, anzuzeigen und darauf zuzugreifen 

  • Daten und deren Verwendung zu verstehen, zu dokumentieren und zu überwachen.

  • zusammenzuarbeiten und Daten gemeinsam und verantwortungsbewusst mit vollständigem Einblick zu nutzen.

Robuster Data Catalog

Suchen, kuratieren und taggen Sie Daten über alle Infrastrukturen hinweg, und generieren Sie mit Cloudera Data Catalog relevante Informationen, um: 

  • Alle Ihre Daten von einem einzigen Ort aus zu durchsuchen, anzuzeigen und darauf zuzugreifen 

  • Daten und deren Verwendung zu verstehen, zu dokumentieren und zu überwachen.

  • zusammenzuarbeiten und Daten gemeinsam und verantwortungsbewusst mit vollständigem Einblick zu nutzen.

 

 

 

 

Logo von HelloFresh

NEW YORKER nutzt Daten, um Modetrends zu ermitteln und Fehlbestände zu verringern. Das Data Lakehouse hilft der global aufgestellten Einzelhandelskette NEW YORKER, die Bedürfnisse der Kunden vorherzusehen, um ihr Einkaufserlebnis in der Filiale zu verbessern.

 

„Ausschlaggebende Faktoren für unsere Entscheidung für die Cloudera Data Platform waren ihr Ruf, ihre Zuverlässigkeit, die Skalierbarkeit, die Geschwindigkeit und der hervorragende Support.“

– Steffen Minz, Head of Data Science, NEW YORKER

Logo von HelloFresh

NEW YORKER nutzt Daten, um Modetrends zu ermitteln und Fehlbestände zu verringern. Das Data Lakehouse hilft der global aufgestellten Einzelhandelskette NEW YORKER, die Bedürfnisse der Kunden vorherzusehen, um ihr Einkaufserlebnis in der Filiale zu verbessern.

 

„Ausschlaggebende Faktoren für unsere Entscheidung für die Cloudera Data Platform waren ihr Ruf, ihre Zuverlässigkeit, die Skalierbarkeit, die Geschwindigkeit und der hervorragende Support.“

– Steffen Minz, Head of Data Science, NEW YORKER

Miniaturansicht: Forrester-Report

Mit KI über ein durchgängiges Data Lakehouse die Effizienz des Datenlebenszyklus steigern

GigaOm Radar für Data Lakes und Lakehouses

Cloudera wurde 2024 als Marktführer für Data Lakehouses eingestuft.
 

Bericht herunterladen

Bericht von GigaOm Radar 2024 für Marktführer bei Data Lakes & Lakehouses
Ressourcen
 

Erfahren Sie mehr über die ortsunabhängige Verwaltung von Daten

Webinar

Wie das Open Data Lakehouse Unternehmens-KI ermöglicht

Whitepaper

Wir stellen vor: Apache Iceberg – die Vorteile eines Open Data Lakehouse auf Basis von Cloudera

Erstklassige Schulungen, Support & Services

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.