Distribution/ Parallélisation des fonctionnalités d'ETL pour l'intégration des données massives.

Ferkoun., Asma.; Issad, Chaïma.

Please use this identifier to cite or link to this item: http://localhost:8080/xmlui/handle/123456789/11762

Title:	Distribution/ Parallélisation des fonctionnalités d'ETL pour l'intégration des données massives.
Authors:	Ferkoun., Asma. Issad, Chaïma.
Keywords:	Systèmes d'Informations Décisionnels. Entrepôt de Données. Extraction -Transformation-chargement. Big Data. Processus parallèle/distribué. Niveau de granularité. MapReduce. Apache Spark.
Issue Date:	10-Oct-2016
Publisher:	Université Blida 1
Abstract:	Ce travail s'inscrit dans le cadre des Systèmes d'Informations Décisionnels (SID) et plus particulièrement dans la phase d'intégration basée sur un processus d'extraction, de transformation et de chargement (ETL: Extracting-Transforming-Loading) des données dans un entrepôt de données (ED). Notre objectif est de proposer une technique pour que l'ETL peut faire face au gros volumes des données connues sous le nom (Big Data). Dans ce contexte, nous proposons une distribution et une parallélisation de processus ETL à un niveau de granularité fin grâce à un ensemble de ses fonctionnalités de base. Chacune de ces fonctions est implémentée en se basant sur une architecture et un algorithme proposés selon le paradigme de traitement intensif des données massives MapReduce (MR). Pour la mise en oeuvre, nous avons retenu l'environnement Apache Spark sur une infrastructure de type cluster, ce qui permet d'améliorer les performances d'ETL. Mots-clés: Systèmes d'Informations DécisionnelsEntrepôt de Données, ExtractionTransformation-chargement, Big Data, Processus parallèle/distribué, Niveau de granularité, MapReduce, Apache Spark.
Description:	ill.,Bibliogr.
URI:	http://di.univ-blida.dz:8080/jspui/handle/123456789/11762
Appears in Collections:	Mémoires de Master

Files in This Item:

File	Description	Size	Format
ferkoun asma.pdf		35,13 MB	Adobe PDF	View/Open

Show full item record

DSpace JSPUI

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets