Apache Zeppelin

Ein komplett offenes, webbasiertes Notizbuch, das interaktive Datenanalysen ermöglicht

Apache Zeppelin ist ein neues und innovatives webbasiertes Notebook, mit dem Hadoop und Spark Funktionen für die Datenerfassung, Datenexploration, Visualisierung, Freigabe und Zusammenarbeit nutzen können.

Was genau macht Zeppelin

Mit interaktiven browserbasierten Notebooks können Datentechniker, Datenanalysten und Data Scientists produktiver arbeiten, indem sie Datencode entwickeln, organisieren, ausführen und freigeben und die Ergebnisse visualisieren, ohne auf die Befehlszeile oder die Cluster-Details zugreifen zu müssen. Mit Notebooks können diese Benutzer nicht nur lange Workflows ausführen, sondern auch interaktiv arbeiten.  Es gibt eine Reihe von Notebooks mit Spark. iPython bleibt eine kluge Wahl und ein hervorragendes Beispiel für ein Data-Science-Notebook.  Die Hortonworks Gallery bietet eine Ambari-Stapeldefinition, die unseren Kunden hilft, im Handumdrehen iPython auf ihren Hadoop-Clustern einzurichten.  

Apache Zeppelin ist ein neues und in Kürze erscheinendes webbasiertes Notebook, das Spark Funktionen für Datenexploration, Visualisierung, Freigabe und Zusammenarbeit bietet.  Es unterstützt Python, aber auch eine wachsende Liste von Programmiersprachen wie Scala, Hive, SparkSQL, Shell und Markdown.

zeppelin_medical

Die verschiedenen Sprachen werden über Zeppelin-Sprachinterpreter unterstützt.  

Datenermittlung, -exploration, Reporting und Visualisierung sind Schlüsselkomponenten des Data-Science-Workflows.  Zeppelin bietet ein „Modern Data Science Studio“ an, das Spark und Hive schlüsselfertig unterstützt.   Tatsächlich unterstützt Zeppelin mehrere Sprach-Backends, die ein wachsendes Ökosystem von Datenquellen unterstützen.   Die Notebooks von Zeppelin bieten Data Scientists ein interaktives Snippet-at-Time-Erlebnis.  In der Hortonworks Gallery können Sie sich eine Sammlung von Zeppelin-Notizbüchern ansehen.


Auch wenn Sie das Thema Notebook abgeschlossen und Erkenntnisse gesammelt haben, die Sie teilen möchten, können Sie ganz einfach einen Bericht daraus erstellen und ihn entweder ausdrucken oder versenden.

zeppelinReport

Wir bei Cloudera sind der Meinung, dass Spark und Hadoop perfekt zusammenpassen.   Und dass Zeppelin eine Schlüsselkomponente für die Beschleunigung von Data-Science-Lösungen ist.

 

Jüngste Verbesserungen an webbasierten Notebooks

Auch bei Notebooks bleibt das Gerangel um Daten eine Herausforderung. Häufig haben Data Scientists Probleme mit der Entwicklung von Features, der Auswahl von Algorithmen, dem Optimieren, dem Freigeben ihrer Arbeit für Andere und dem Bereitstellen ihrer Arbeit in der Produktion.

Wir arbeiten daran, das Zeppelin-Notebook in der Community zu verbessern. Wir haben Zeppelin um Hive Interpreter ergänzt und arbeiten daran, den Editor zu verbessern, um ihn stabiler zu machen.  Wir vertiefen unser Engagement in der Zeppelin-Community, um Funktionen wie Sicherheit, zusammenfassende Statistiken und kontextsensitive Hilfe zur Verbesserung der Datenentwicklungserfahrung bereitzustellen.

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extension blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.