Übersicht
Warum Apache Iceberg?
Apache Iceberg ist ein offenes Tabellenformat, das speziell für Analysen im großen Maßstab entwickelt wurde. Es bietet die Zuverlässigkeit und Einfachheit von SQL-Tabellen und stellt ähnliche Funktionen wie die eines Data Warehouse direkt im Data-Lake-Speicher bereit.
Apache Iceberg ist kein Speicher, keine Datenbank und keine Rechenmaschine. Es handelt sich um eine Verwaltungsebene für Metadaten, die über Ihren Datendateien liegt und die an einem beliebigen Ort gespeichert wird. Iceberg macht Daten für mehrere Rechenmaschinen gleichzeitig zugänglich und garantiert dabei die Zuverlässigkeit und Konsistenz der Daten.
Gründe für die Einführung von Iceberg.
Offenheit
Iceberg ist vollständig offen und unabhängig von Herstellern und Engines. Es verfügt über die breiteste Unterstützung der Community, sowohl von Anbietern als auch von Nicht-Anbietern, was unvoreingenommene Innovationen beschleunigt.
Moderne Data-Warehouse-Funktionen
Iceberg-Funktionen wie Transaktionskonsistenz, versteckte Partitionierung, Schemaentwicklung und Zeitreise erleichtern Datenoperationen.
Analysen im Petabyte-Bereich
Iceberg wurde von Grund auf neu entwickelt und überwindet die Engpässe früherer Tabellenformate durch eine eigene Metadatenebene.
Apache Iceberg auf Cloudera.
Als wichtiger Akteur auf diesem Gebiet, haben wir Iceberg direkt in unser Data Lakehouse integriert.
Führen Sie Hochleistungsanalysen, Daten-Engineering, Datenwissenschaft und KI aus und integrieren Sie dabei die passende Engine zur jeweiligen Aufgabe für Ihre vorhandenen Daten, um Datenbewegungen und Datenkopien zu vermeiden.
Trennen Sie Speicher und Rechenleistung. Erhalten Sie einheitlichen Zugriff auf strukturierte, halbstrukturierte und unstrukturierte Daten im Data Lakehouse. Nutzen Sie integrierte KI-Chatbots, um all Ihre Daten zu erkunden und zu nutzen.
Gründe für Apache Iceberg auf Cloudera
Das einzige hybride offene Data Lakehouse mit Iceberg-Technologie
Stellen Sie es in beliebigen Clouds oder in Ihrem Rechenzentrum bereit, je nachdem, wo Sie Ihre Daten speichern.
Unterstützung mehrerer Engines
Erhalten Sie das umfangreichste Set an vorintegrierten Datenservices und -funktionen für Aufnahme, Verarbeitung, Analyse und KI, um Ihren gesamten Datenlebenszyklus zu unterstützen.
Senken Sie die Gesamtbetriebskosten um bis zu 75 %
Gängiger Standard für Daten mit einheitlicher Sicherheit und Governance, der ETL, Datensilos und Datenkopien überflüssig macht und die TCO um bis zu 75 % reduziert.
Vorteile des offenen Data Lakehouse von Cloudera, unterstützt von Apache Iceberg
Demokratisierung von Daten: Ermöglichen Sie allen den Zugriff auf datengesteuerte Erkenntnisse mithilfe natürlicher Sprache.
Beschleunigung von Analysen und KI: Setzen Sie generative KI-Anwendungen und Dashboards für Ihre Daten ein.
Offene und interoperable Daten: Behalten Sie die Eigentümerschaft an Ihren Daten und nutzen Sie die Tools Ihrer Wahl.
Kunden
Apache Iceberg garantiert die vollständige Eigentümerschaft an Ihren Daten
Erfahren Sie mehr
Blogs
Databricks Follows Cloudera by Adopting Iceberg, While Snowflake Mulls Open Source Approach
Getting Started With Cloudera Open Data Lakehouse on Private Cloud
From Hive Tables to Iceberg Tables: Hassle-Free
Dokumentation
Erste Schritte mit Apache Iceberg
Sie sind bereit?