Apache Druid
Druid ist ein Open-Source-Analysedatenspeicher, der für Business Intelligence-Abfragen (OLAP) von Ereignisdaten entwickelt wurde. Druid bietet eine Datenerfassung mit geringer Latenz (in Echtzeit), flexible Datenexploration und schnelle Datenaggregation.
So funktioniert Druid
Druid ist schnell, da die Daten in ein stark indiziertes Spaltenformat konvertiert werden, das für typische OLAP-Abfragemuster ideal ist. Druid wird über Hive SQL mit dem in HDP enthaltenen Druid-to-Hive-Connector oder über eine native REST-API abgefragt.

Was genau macht Druid
Feature | Description |
---|---|
Sub-Second Queries | Druid delivers sub-second queries, even when you have terabytes of data and dozens of dimensions. |
Real-Time Data Ingestion | Druid makes real-time a reality. Query data seconds after it arrives. Native integration with Apache Kafka makes it simple to enable real-time analytics. |
Integrated with Apache Hive | Build OLAP cubes and run sub-second SQL queries using any Hive-compatible tool. |
Apache Ambari Integration | Apache Ambari makes deploying, configuring and monitoring Druid a breeze.. |
Fokus auf Druid
Cloudera konzentriert sich darauf, schnelle, skalierbare Analysen zu ermöglichen, bei denen historische Daten und Echtzeitdaten nahtlos kombiniert werden.
- Echtzeitanalyse: Mit dem Druid/Hive-Connector können Sie OLAP-Cubes mit SQL erstellen oder vorhandene Druid-Cubes abrufen. Oder nutzen Sie die leistungsstarke SQL-Unterstützung von Hive, um detaillierte Analysen Ihrer Druid-Daten durchzuführen.
- Verwaltung: Apache Ambari erleichtert die Bereitstellung, Konfiguration, Überwachung und Verwaltung von Druiden-Clustern.
- Sicherheit: Druid unterstützt jetzt Kerberos und das sichere Hadoop in vollem Umfang, und Apache Ambari kümmert sich um die Sicherung Ihres Druiden-Clusters.
