Veuillez utiliser cette adresse pour citer ce document : https://di.univ-blida.dz/jspui/handle/123456789/11762
Titre: Distribution/ Parallélisation des fonctionnalités d'ETL pour l'intégration des données massives.
Auteur(s): Ferkoun., Asma.
Issad, Chaïma.
Mots-clés: Systèmes d'Informations Décisionnels.
Entrepôt de Données.
Extraction -Transformation-chargement.
Big Data.
Processus parallèle/distribué.
Niveau de granularité.
MapReduce.
Apache Spark.
Date de publication: 10-oct-2016
Editeur: Université Blida 1
Résumé: Ce travail s'inscrit dans le cadre des Systèmes d'Informations Décisionnels (SID) et plus particulièrement dans la phase d'intégration basée sur un processus d'extraction, de transformation et de chargement (ETL: Extracting-Transforming-Loading) des données dans un entrepôt de données (ED). Notre objectif est de proposer une technique pour que l'ETL peut faire face au gros volumes des données connues sous le nom (Big Data). Dans ce contexte, nous proposons une distribution et une parallélisation de processus ETL à un niveau de granularité fin grâce à un ensemble de ses fonctionnalités de base. Chacune de ces fonctions est implémentée en se basant sur une architecture et un algorithme proposés selon le paradigme de traitement intensif des données massives MapReduce (MR). Pour la mise en oeuvre, nous avons retenu l'environnement Apache Spark sur une infrastructure de type cluster, ce qui permet d'améliorer les performances d'ETL. Mots-clés: Systèmes d'Informations DécisionnelsEntrepôt de Données, ExtractionTransformation-chargement, Big Data, Processus parallèle/distribué, Niveau de granularité, MapReduce, Apache Spark.
Description: ill.,Bibliogr.
URI/URL: http://di.univ-blida.dz:8080/jspui/handle/123456789/11762
Collection(s) :Mémoires de Master

Fichier(s) constituant ce document :
Fichier Description TailleFormat 
ferkoun asma.pdf35,13 MBAdobe PDFVoir/Ouvrir


Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.