Your browser is out of date

Update your browser to view this website correctly. Update my browser now

×

CCA Spark- und Hadoop Developer-Prüfung (CCA175)

  • Anzahl der Fragen: 8–12 leistungsbasierte (praktische) Aufgaben auf einem Cloudera Enterprise Cluster.  Nachfolgend finden Sie eine vollständige Cluster-Konfiguration.
  • Zeitlimit: 120 Minuten
  • Notwendige Punktzahl: 70%
  • Sprache: Englisch
  • Preis: 295 USD

Fragenformat für die Prüfung

Bei jeder CCA-Frage müssen Sie ein bestimmtes Szenario lösen. In manchen Fällen kann ein Tool wie Impala oder Hive verwendet werden. In anderen Fällen ist Programmierung erforderlich. Um die Entwicklungszeit bei Spark-Fragen zu beschleunigen, wird oft eine Vorlage mit einem Lösungskonzept bereitgestellt, in welcher der Kandidat aufgefordert wird, die fehlenden Zeilen mit funktionalem Code auszufüllen. Diese Vorlage wird in Scala geschrieben oder geschrieben in Python, aber nicht beide.

Sie müssen die Vorlage nicht verwenden und können das Szenario in einer von Ihnen bevorzugten Sprache lösen. Beachten Sie jedoch, dass eine Programmierung aller Probleme von Grund auf mehr Zeit in Anspruch nehmen kann, als für die Prüfung zur Verfügung steht.

Bewertung, Score Reporting und Zertifikat

Ihre Prüfung wird sofort nach Übermittlung bewertet und Sie erhalten noch am selben Tag per E-Mail ein Ergebnis. Ihr Ergebnis zeigt die Problemnummer für jedes Problem, das Sie angegangen sind, und eine Bewertung zu diesem Problem. Wenn Sie bei einem Problem nicht bestehen, wird im Ergebnis das Kriterium Ihres Fehlers aufgeführt (z.B. „Datensätze enthalten falsche Daten“ oder „Falsches Dateiformat“). Wir werden zum Schutz der Prüfungsinhalte keine weiteren Informationen melden. Erfahren Sie mehr über die Durchsicht von Prüfungsinhalten in den Häufig gestellten Fragen (FAQ).

Wenn Sie die Prüfung bestehen, erhalten Sie innerhalb von wenigen Tagen nach Ihrer Prüfung eine zweite E-Mail mit Ihrem digitalen Zertifikat als PDF, Ihre Lizenznummer, ein LinkedIn-Profilupdate und einen Link zum Herunterladen Ihres CCA-Logos für die Nutzung in Ihren Marketingmaterialien und sozialen Netzwerkprofilen.

Zielgruppe und Voraussetzungen

Für die Zertifizierungsprüfungen sind keine Voraussetzungen erforderlich. Die CCA Spark und Hadoop Developer-Prüfung (CCA175) verfolgt dieselben Ziele wie die Cloudera Developer-Schulung für Spark und Hadoop und der Schulungskurs ist ein ausgezeichneter Teil der Vorbereitung auf die Prüfung. 

 

Für CCA175 registrieren

Erforderlichen Fähigkeiten

Datenübernahme

Die Fähigkeiten, Daten zwischen externen Systemen und Ihrem Cluster zu transferieren. Das umfasst Folgendes:

  • Importieren Sie Daten aus einer MySQL-Datenbank in HDFS mit Sqoop

  • Exportieren von Daten in einer MySQL-Datenbank von HDFS mit Sqoop

  • Sie ändern den Delimiter und das Dateiformat der Daten während des Imports mit Sqoop

  • Sie pflegen nahezu in Echtzeit Streaming-Daten in HDFS ein

  • Sie verarbeiten Streaming-Daten, als wären sie auf den Cluster geladen

  • Sie laden Daten in HDFS hoch und von HDFS herunter mittels der Hadoop-Dateisystembefehle

Transformieren, bereitstellen und speichern

Sie konvertieren Datenbestandswerte in einem in HDFS gespeicherten, vorgegeben Format in neue Datenwerte oder in ein neues Datenformat und schreiben diese in HDFS.

  • Sie laden RDD-Daten aus HDFS für die Verwendung in Spark-Applikationen

  • Sie schreiben die Ergebnisse aus RDD zurück in HDFS mittels Spark

  • Sie lesen und schreiben Dateien in vielen verschiedenen Dateiformaten

  • Sie führen eine Standard-ETL-Prozesse (Extract, Transform, Load) für Daten aus

Datenanalyse

Sie verwenden Spark SQL für eine programmatische Interaktion mit dem Metastore in Ihren Anwendungen. Sie generieren Berichte unter Verwendung von Abfragen für geladene Daten.

  • Sie verwenden Metastore-Tabellen als Eingabequelle oder Ausgabeort für Spark-Anwendungen

  • Sie kennen die Grundlagen einer Abfrage von Datensätze in Spark

  • Sie filtern Daten mittels Spark

  • Sie schreiben Abfragen, die zusammenfassende Statistiken berechnen

  • Sie führen unterschiedliche Datensätze mittels Spark zusammen

  • Sie produzieren klassifizierte oder sortierte Daten

Konfiguration

Dies ist eine praktische Übung und der Kandidat sollte sich mit allen Aspekten der Generierung eines Ergebnisses auskennen, und nicht nur im Verfassen von Code.

  • Sie liefern Befehlszeilenoptionen, um Ihre Anwendungskonfiguration zu ändern, wie etwa mehr Speicher zur Verfügung stellen

Lieferung und Cluster Prüfungsinformationen

CCA175 ist eine online beauftsichtigte Prüfung, die jederzeit und überall verfügbar ist. Unter  Häufig gestellte Fragen (FAQ) erhalten Sie weitere Informationen und Systemanforderungen.

CCA175 ist eine praktische Prüfung unter Verwendung von Cloudera-Technologien. Jeder Benutzer erhält sein eigenes CDH5 (aktuell 5.10.0) Cluster mit Spark 1.6, Impala, Crunch, Hive, Pig, Sqoop, Kafka, Flume, Kite, Hue, Oozie, DataFu und viele mehr vorinstalliert (Siehe eine vollständige Liste). Außerdem ist der Cluster mit Python (2.6, 2.7 und 3.4), Perl 5.10, Elephant Bird, Cascading 2.6, Brickhouse, Hive Swarm, Scala 2.11, Scalding, IDEA, Sublime, Eclipse und NetBeans ausgestattet.

Dokumentation online verfügbar, während der Prüfung

Cloudera Product Documentation
Apache Hadoop
Apache Hive
Apache Impala
Apache Sqoop
Spark 1.6
Spark 2
Apache Crunch
Apache Pig
Kite SDK
Apache Avro
Apache Parquet
Cloudera HUE
Apache Oozie
Apache Flume
DataFu
JDK 7 API Docs
Python 2.7 Documentation
Python 3.4 Documentation
Scala Documentation

Nur die Dokumentation, Links und oben aufgeführten Ressourcen sind während der Prüfung zugänglich. Alle anderen Webseiten, einschließlich Google-Suche-Funktionalität ist deaktiviert. Sie dürfen nicht Notizen oder andere Prüfung Hilfsmittel verwenden.

Your form submission has failed.

This may have been caused by one of the following:

  • Your request timed out
  • A plugin/browser extention blocked the submission. If you have an ad blocking plugin please disable it and close this message to reload the page.