Formation Hbase
Découvrez Les Fonctionnement de HBase
Présentation de la formation
Apache HBase est un Data Store orienté colonnes utilisant des paires clé/valeur. Il est conçu pour s’exécuter sur le système de fichiers HDFS (Hadoop Distributed File System). Hadoop est une infrastructure qui permet de gérer des ensembles de données volumineux dans un environnement informatique distribué.
Elle offre un accès d’écriture et de lecture en temps réel, aléatoire et cohérent, à des tables contenant des milliards de lignes et des millions de colonnes. Elle permet aussi combiner des sources de données reposant sur différentes structures et différents schémas. Il s’agit donc d’un très bon choix pour le stockage de données multi-structurel. Il est aussi possible d’effectuer des requêtes pour un repère temporel spécifique, ce qui permet de réaliser des requêtes flashback.
Cette formation vous permettre de comprendre le fonctionnement d’HBase et identifier les cas et contextes d’utilisation pour la base de données, de savoir installer, monitorer HBase et optimiser ses principaux paramètres de performance et d’être en mesure de concevoir un schéma de données adapté et d’insérer et de manipuler des données dans la base à travers différentes interfaces.
Programme de la formation
Objectifs pédagogiques
- comprendre le fonctionnement d’HBase et identifier les cas et contextes d’utilisation pour la base de données
- savoir installer, monitorer HBase et optimiser ses principaux paramètres de performance
- être en mesure de concevoir un schéma de données adapté et d’insérer et de manipuler des données dans la base à travers différentes interfaces
Pré-requis
- Avoir certaines connaissance des principes de base Hadoop et des bases de données.
Contenu de la formation
Architecture
- HBase Master Node
- Region Master
- Liens avec les clients HBase
- Rôle de ZooKeeper
Installation
- Choix des packages
- Installation et configuration dans le fichier conf/hbase-site.xml
- Démarrage en mode Standalone start-hbase
- Test de connexion avec HBase Shell
- Installation en mode distribué
- Interrogations depuis le serveur HTTP intégré
Hbase Utlisation – Shell
- Présentation des différentes interfaces disponibles
- Travaux pratiques avec HBase Shell
- Commandes de base
- Syntaxe
- Variables
- Manipulation des données : create, list, put, scan, get
- Désactiver une table ou l’effacer
- *Disable (enable)
- *Drop…
- Programmation de scripts
- Gestion des tables : principe des filtres
- Mise en oeuvre de filtres de recherche
- Paramètres des tables
- Présentation des espaces de nommage
Cluster Hbase
- Fonctionnement en mode distribué
- Fonctionnement indépendant des démons
- *HMaster
- *HRegionServer
- *ZooKeeper
- Mise en oeuvre avec HDFS dans un environnement distribué
- Tables réparties : mise en oeuvre des splits
Programmation
- Introduction
- Les APIs
- *REST
- *Avro
- *Thrift
- *Java
- *Ruby…
- Utilisation d’un client Java
- Gestion des tables
- Lien avec MapReduce
- Principes des accès JMX
- Exemple d’un client JMX
Méthodes & moyens
Explications théoriques suivies de pratiques guidées puis mises en autonomie
- 1 vidéoprojecteur par salle
- 1 ordinateur par stagiaire
Profil du formateur
Support de cours
- Support papier ou électronique (dématérialisé)
- Les exercices d’accompagnement peuvent être récupérés sur clef USB