Université Blida 1

Mise en æuvre d'un processus ETL dans un environnement Disco de MapReduce

Afficher la notice abrégée

dc.contributor.advisor Morsli, Mohammed
dc.contributor.author Bala, M. ( Promoteur)
dc.date.accessioned 2021-02-17T09:19:42Z
dc.date.available 2021-02-17T09:19:42Z
dc.date.issued 2013-06-30
dc.identifier.uri http://di.univ-blida.dz:8080/jspui/handle/123456789/10048
dc.description ill., Bibliogr. Cote:ma-004-134 fr_FR
dc.description.abstract Notre travail s'inscrit dans le cadre des systèmes d'information décisionnels (SID), plus particulièrement dans la phase d'intégration basée sur un processus ETL Plus précisément, notre objectif est de propose et d'implementer des techniques et des stratégies pour permettre à ce processos de faire face au nouveau phénomène des données massives connues sous le nom de Big Data: Des données de cette dimension (PetaBytes, HexaBytes, ...) mettent l'ETL en difficulté et celui-ci risque de s'exécuter pendant des heures voire des jours ou plutôt risque de ne pas aboutir. En parallèle, de nouveaux environnements et paradigmes se développent tels que l'informatique dans les nuages (cloud computing) et MapReduce. Le modèle MapReduce est un modèle qui présente une grande cohérence avec le processus ETL et est destiné justement pour le traitement intensif à grande échelle des données massives sur un cluster d'ordinateurs. Nous avons retenu de mettre en cuvre un framework ETL basé sur le paradigme MapReduce sous l'environnement Disco en partant des limites d'une approche existante (prototype ETLMR, 2011). Notre approche consiste en l'implémentation des stratégies et des techniques pour la parallélisation des données (partitionnement et distribution des données) et la parallélisation des tâches ETL sur un cluster grâce au Framework Disco et ce pour l'amélioration des performances. Mots clés Systèmes d'information décisionnels, ETL, Données intensives, MapReduce, ETLMR, Performance, Parallélisation des données, Partitionnement et Distribution, Parallélisation des tâches, Disco fr_FR
dc.language.iso fr fr_FR
dc.publisher Université Blida 1 fr_FR
dc.subject Systèmes d'information décisionnels fr_FR
dc.subject ETL fr_FR
dc.subject Données intensives fr_FR
dc.subject MapReduce fr_FR
dc.subject ETLMR fr_FR
dc.subject Performance fr_FR
dc.subject Parallélisation des données fr_FR
dc.subject Partitionnement et Distribution fr_FR
dc.subject Parallélisation des tâches fr_FR
dc.subject Disco fr_FR
dc.title Mise en æuvre d'un processus ETL dans un environnement Disco de MapReduce fr_FR
dc.type Thesis fr_FR


Fichier(s) constituant ce document

Ce document figure dans la(les) collection(s) suivante(s)

Afficher la notice abrégée

Chercher dans le dépôt


Recherche avancée

Parcourir

Mon compte