• 75600683
  • contact@ifmed.net
Sleek & Beautiful

Institut de Formation de Medenine - IFMED

Big Data

Big Data

Objectifs de formation :

Dans cette formation, vous serez amenés à manipuler la distribution Cloudera (CDH 5.5+) En suivant des ateliers pratiques, vous serez en mesure de:

  • Big Data: Cas d’utilisation, et écosystème
  • Comprendre l’architecture et les services Hadoop: HDFS et YARN, innovations de la plateforme (TEZ,…)
  • Manipuler les fichiers et les utilisateurs sur Hadoop
  • Comprendre et écrire les Jobs Map/Reduce de Base
  • Manipuler les Big Data Grâce aux langages évolués: Pig et Hive
  • Ordonnancer et synchroniser les traitements, gérer et administrer les services hadoop

Utiliser des entrepôts NoSQL de l’écosystème HDP: HBase et Solr

Programme de la formation

1 jour

  • Introduction Aux Big Data: Cas d’utilisation
  • Hadoop : écosystème, algorithms, etc…
  • Hadoop : Architecture / HDFS & YARN
  • Atelier 1 : Configuration et installation de Hadoop Cloudera
  • Atelier 2 : HDFS : Utiliser les commandes Hadoop et la console web Hue pour explorer le HDFS sur le système Hadoop.

2 jour

  • MapReduce 2 YARN
  • Atelier 3 : MapReduce (Language – Java) :Créer, Compiler et déboguer votre programme MapReduce sous Eclipse ; Exécutez votre programme MapReduce, surveillez les travaux et visualisez la sortie dujournal sous Hadoop.
  • Langages de Scripting de Haut Niveau
  • Atelier 4 : Hive : assurer la persistance des données dans le HiveMegaStore, lancer des requêtes avec HiveQL, Faire des agrégations, jointures, trie avec HiveQL
  • Atelier 5 : Pig : Charger des données avec Pig, Création de schéma, de lecture et d’écriture de données, Accès aux champs d’un schéma avec Pig, Affichage des données

3 jour

  • HBase: Base de données orientée colonnes sur HDFS
  • TP : Manipulation HBaseshell
  • TP: stocker résultat de jobs Hive sur Table HBase
  • Solr: Le moteur d’indexation Apache
  • Intégration pour indexation HDFS
  • TP: indexer des données Hadoop via Apache Solr

4 jour

  • Formats de données sous HDFS : Avro
  • SQL Impala : SQL Interactif (requêtes SQL à faible latence)sous HBase et HDFS.
  • Sqoop : Importation des données relationnelles vers HDFS
  • Atelier 7 : Interrogation des données structurées et non structurées sur CLOUDERA : Cet atelier pemet d’exploiter les différents outils de Big data (Hive, SQL Impala, sqoop,HDFS, Avro) pour faire exactement la même chose que vous savez déjà faire (interrogation des BDR) mais avec CDH (Cloudera Distribution Including Apache Hadoop

5 jour

  • Cluster Hadoop : Architecture et Administration
  • Vagrant : auto administration d’un cluster Hadoop
  • Gestion des noeuds dans un cluster Hadoop
  • TP Ajout, dé/re-commissionnment, suppression noeuds.

ATTESTATION

attestation de formation agrée par l’état sous le N° attestation de formation agrée par l’etat sous le N° 82-097-16

    Prix

    Nous contacter sur le
    75 600 683 , 52 384 976

    Durée

    Durée : 5 jours

31 Vues