Formation Cassandra
Découvrez le contenu de la formation Cassandra.
Présentation de la formation
Apache Cassandra est un système de gestion de base de données (SGBD) de type NoSQL conçu pour gérer des quantités massives de données sur un grand nombre de serveurs, assurant une haute disponibilité en éliminant les points individuels de défaillance. Il permet une répartition robuste sur plusieurs centres de données, avec une réplication asynchrone sans master et une faible latence pour les opérations de tous les clients.
Cassandra est très rapide pour manipuler un volume important de données. Elle permet d’avoir des schémas de données flexible grâce à sa représentation en colonnes. De plus son achitecture lui permet d’évoluer sans problème dans un environnement distribué, elle intégre des mécanismes de réplication de données et la possibilité de mettre en cluster plusieurs serveurs Cassandra.
Cette formation Apache Cassandra vous familiarisera avec tous les aspects de l’utilisation du SGBD Cassandra, son architecture, son installation et sa configuration.
Programme de la formation
Objectifs pédagogiques
- Démarrer un projet de Recherche d’information.
- Développer des services de recherches
- Analyser les performances.
Pré-requis
- Avoir des connaissances générales en bases de données et notions en programmation objet.
Contenu de la formation
Introduction au Big Data et à Cassandra
- Comprendre le Big Data
- Vue d’ensemble des fonctionnalités d’Apache Cassandra
- Scénarii d’utilisation de Cassandra
- Etude de l’architecture de Cassandra
Installation, configuration et mise en œuvre locale de Cassandra
- Préparation du système d’exploitation
- Choisir et installer la différente version de Cassandra
- Configurer Cassandra pour un seul nœud
- Démarrer/arrêter une instance de Cassandra
- Introduction au modèle de données et au CQL (Cassandra Query Language)
- Description du modèle de données
- Utilisation de l’outil cqlsh
- Langage de définition de données de CQL
- DevCenter de Cassandra
- Langage de manipulation de données de CQL
- Comprendre les bases de la modélisation de données pour Cassandra
Introduction aux différents outils proposés par Cassandra
- Configuration des nœuds et des clusters en utilisant CCM (Cassandra Cluster Manager)
- Présentation et utilisation des commandes shell avec cqlsh
- Introduction et utilisation de nodetool
- Enrichir et tester des nœuds avec Cassandra-stress
- Autres outils proposés par Cassandra
Architecture interne de Cassandra
- Coordination des requêtes
- Comprendre la réplication des données
- Maintenir la cohérence des données
- Comprendre la communication entre les nœuds
- Comprendre le système des keyspaces
Travailler avec le Write Path de Cassandra
- Ecriture des données dans le moteur de stockage
- Comprendre le fonctionnement des annuaires de données
Travailler avec le Read Path de Cassandra
- Lecture des données situées dans le moteur de stockage
- Choisir et implémenter les stratégies de compilation de données
Installation du matériel et résolution de problèmes
- Bonnes pratiques quant à l’installation de matériel
- Problèmes rencontrés et résolution
Méthodes & moyens
Explications théoriques suivies de pratiques guidées puis mises en autonomie
- 1 vidéoprojecteur par salle
- 1 ordinateur par stagiaire
Profil du formateur
Support de cours
- Support papier ou électronique (dématérialisé)
- Les exercices d’accompagnement peuvent être récupérés sur clef USB