Veuillez utiliser cette adresse pour citer ce document : https://di.univ-blida.dz/jspui/handle/123456789/10048
Titre: Mise en æuvre d'un processus ETL dans un environnement Disco de MapReduce
Auteur(s): Morsli, Mohammed
Bala, M. ( Promoteur)
Mots-clés: Systèmes d'information décisionnels
ETL
Données intensives
MapReduce
ETLMR
Performance
Parallélisation des données
Partitionnement et Distribution
Parallélisation des tâches
Disco
Date de publication: 30-jui-2013
Editeur: Université Blida 1
Résumé: Notre travail s'inscrit dans le cadre des systèmes d'information décisionnels (SID), plus particulièrement dans la phase d'intégration basée sur un processus ETL Plus précisément, notre objectif est de propose et d'implementer des techniques et des stratégies pour permettre à ce processos de faire face au nouveau phénomène des données massives connues sous le nom de Big Data: Des données de cette dimension (PetaBytes, HexaBytes, ...) mettent l'ETL en difficulté et celui-ci risque de s'exécuter pendant des heures voire des jours ou plutôt risque de ne pas aboutir. En parallèle, de nouveaux environnements et paradigmes se développent tels que l'informatique dans les nuages (cloud computing) et MapReduce. Le modèle MapReduce est un modèle qui présente une grande cohérence avec le processus ETL et est destiné justement pour le traitement intensif à grande échelle des données massives sur un cluster d'ordinateurs. Nous avons retenu de mettre en cuvre un framework ETL basé sur le paradigme MapReduce sous l'environnement Disco en partant des limites d'une approche existante (prototype ETLMR, 2011). Notre approche consiste en l'implémentation des stratégies et des techniques pour la parallélisation des données (partitionnement et distribution des données) et la parallélisation des tâches ETL sur un cluster grâce au Framework Disco et ce pour l'amélioration des performances. Mots clés Systèmes d'information décisionnels, ETL, Données intensives, MapReduce, ETLMR, Performance, Parallélisation des données, Partitionnement et Distribution, Parallélisation des tâches, Disco
Description: ill., Bibliogr. Cote:ma-004-134
URI/URL: http://di.univ-blida.dz:8080/jspui/handle/123456789/10048
Collection(s) :Mémoires de Master

Fichier(s) constituant ce document :
Fichier Description TailleFormat 
Morsli Mohammed.pdf57,8 MBAdobe PDFVoir/Ouvrir


Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.