Mise en æuvre d'un processus ETL dans un environnement Disco de MapReduce

Bala, M. ( Promoteur)

dc.contributor.advisor	Morsli, Mohammed
dc.contributor.author	Bala, M. ( Promoteur)
dc.date.accessioned	2021-02-17T09:19:42Z
dc.date.available	2021-02-17T09:19:42Z
dc.date.issued	2013-06-30
dc.identifier.uri	http://di.univ-blida.dz:8080/jspui/handle/123456789/10048
dc.description	ill., Bibliogr. Cote:ma-004-134	fr_FR
dc.description.abstract	Notre travail s'inscrit dans le cadre des systèmes d'information décisionnels (SID), plus particulièrement dans la phase d'intégration basée sur un processus ETL Plus précisément, notre objectif est de propose et d'implementer des techniques et des stratégies pour permettre à ce processos de faire face au nouveau phénomène des données massives connues sous le nom de Big Data: Des données de cette dimension (PetaBytes, HexaBytes, ...) mettent l'ETL en difficulté et celui-ci risque de s'exécuter pendant des heures voire des jours ou plutôt risque de ne pas aboutir. En parallèle, de nouveaux environnements et paradigmes se développent tels que l'informatique dans les nuages (cloud computing) et MapReduce. Le modèle MapReduce est un modèle qui présente une grande cohérence avec le processus ETL et est destiné justement pour le traitement intensif à grande échelle des données massives sur un cluster d'ordinateurs. Nous avons retenu de mettre en cuvre un framework ETL basé sur le paradigme MapReduce sous l'environnement Disco en partant des limites d'une approche existante (prototype ETLMR, 2011). Notre approche consiste en l'implémentation des stratégies et des techniques pour la parallélisation des données (partitionnement et distribution des données) et la parallélisation des tâches ETL sur un cluster grâce au Framework Disco et ce pour l'amélioration des performances. Mots clés Systèmes d'information décisionnels, ETL, Données intensives, MapReduce, ETLMR, Performance, Parallélisation des données, Partitionnement et Distribution, Parallélisation des tâches, Disco	fr_FR
dc.language.iso	fr	fr_FR
dc.publisher	Université Blida 1	fr_FR
dc.subject	Systèmes d'information décisionnels	fr_FR
dc.subject	ETL	fr_FR
dc.subject	Données intensives	fr_FR
dc.subject	MapReduce	fr_FR
dc.subject	ETLMR	fr_FR
dc.subject	Performance	fr_FR
dc.subject	Parallélisation des données	fr_FR
dc.subject	Partitionnement et Distribution	fr_FR
dc.subject	Parallélisation des tâches	fr_FR
dc.subject	Disco	fr_FR
dc.title	Mise en æuvre d'un processus ETL dans un environnement Disco de MapReduce	fr_FR
dc.type	Thesis	fr_FR