U.E.F 9.1

Bases de données avancées 2

Département
Second cycle
Année d étude
3éme Année SIW
Semestre
5
Crédit
5
Coefficient
5
Enseignants du module
MALKI ABDELHAMID

Pré requis :

Bases de données avancées 1 + Administration des bases de données

OBJECTIFS :

• Fournir les notions essentielles des bases de données standard et présenter les bases de type NoSQL et les concepts associés.
• Fournir les outils informatiques pour la mise en œuvre d’une architecture dédiée aux traitements des données massives (Big Data).
• Sélectionner des outils de haut niveau comme Pig et Hive pour transformer et interroger le Big Data
• Intégrer des composants appropriés de l’écosystème Hadoop pour une solution de Big Data

CONTENU DU MODULE :

  • Partie 1: Big Data et NoSQL (10h)

1. Introduction aux Systèmes NoSQL et Aspects méthodologiques
     a. Modèles d’agrégats
     b. Modèles de données spécifiques (relations, graphes, base de données sans schéma)
     c. Modèles distribués, Tables et fonctions de hachage, Consistance
2. Les différents types de bases de données NoSQL
     a. Orienté clé/valeur (Redis)
     b. Orienté document (MongoDB)
     c. Orienté colonne (HBase, Cassandra)
     d. Orienté graph (Neo4j)
3. Traitement massivement parallèle
     a. Concepts
     b. Modèle de programmation MapReduce
4. Outils de traitement et stockage des Big Data
     a. Ecosystème Hadoop
     b. Formalisme de stockage distribué (HDFS, Avro, Parquet, Hive)
     c. Extraction de données (SQOOP, ETL (Talend) ou Pig)
     d. Traitement distribué Batch
     e. Outils pour le traitement distribué SQL (Impala, Spark SQL)
     f. Traitementdistribué Machine learning (Spark MLlib, Spark R )
     g. Traitementdistribué Streaming (Spark Streaming, Apache Storm)

  • Partie2: Advanced Topics in DATABASES (5h)

a. Intégration des bases de données
b. Optimisation des requêtes : Top-k, parallèles, etc
c. DataBases as a service (DaaS)
d. Bases de données spatiales
e. Bases de données probabilistes
f. Bases de données temporaires
g. Bases de données stream
h. data quality, data privacy, crowdsourcing.

course

Consultez les ressources disponibles concernant ce module sur le moteur de recherche de la bibliothèque, ou accédez directement au cours de vos enseignants via la plateforme de téléenseignement de l’école « e-learn ».