Afficher la notice abrégée
dc.contributor.author |
Mokeddem., Oussama. |
|
dc.contributor.author |
Mami., Mohamed Nadjib. |
|
dc.date.accessioned |
2021-03-11T12:10:44Z |
|
dc.date.available |
2021-03-11T12:10:44Z |
|
dc.date.issued |
2013-06-29 |
|
dc.identifier.uri |
http://di.univ-blida.dz:8080/jspui/handle/123456789/10623 |
|
dc.description |
ill.,Bibliogr. |
fr_FR |
dc.description.abstract |
ETL, acronyme de Extracting-Transforming-Loading (ou parfois datapumping), est un système de chargement de données depuis les différentes sources d'information de l'entreprise (hétérogènes) vers l'entrepôt de données (Base de données multidimensionnelle). Au fait, ce système ne se contente pas de charger les données, il doit les préparer et les normaliser (les filtrer, les nettoyer, les mettre dans un format approprié, les contextualiser, les homogénéiser, les agréger) et enfin les charger dans leur destination finale qu'est l'entrepôt de données. Un des défis majeurs pour le domaine de l’ETL est le traitement de très grandes quantités de données connues aujourd'hui sous le nom de Big Data. Déjà que ce processus est complexe vu la diversité et l'hétérogénéité des sources ainsi que la complexité des tâches ETL, il devra faire face à des données massives caractérisées par une volumétrie importante (PetaBytes, HexaBytes, ZettaBytes, ...), de nouvelles structures et une exigence en termes de temps de traitement. Nous nous proposons de mettre en æuvre une plateforme d'intégration de données (ETL) pour l'entreposage et l'analyse en ligne destinée pour le Big Data dans un environnement basé sur le paradigme MapReduce destiné pour le traitement parallèle à grande échelle de données intensives sur un cluster d'ordinateurs. Le projet Hadoop de la fondation Apache étant une référence pour les frameworks MapReduce open source.
Mots clés : Entreposage de données, ETL, Traitement parallèle, Performance, MapReduce, Hadoop, Big Data |
fr_FR |
dc.language.iso |
fr |
fr_FR |
dc.publisher |
Université Blida 1 |
fr_FR |
dc.subject |
Entreposage de données. |
fr_FR |
dc.subject |
ETL. |
fr_FR |
dc.subject |
Traitement parallèle. |
fr_FR |
dc.subject |
performance. |
fr_FR |
dc.subject |
MapReduce. |
fr_FR |
dc.subject |
Hadoop. |
fr_FR |
dc.subject |
Big Data. |
fr_FR |
dc.title |
Mise en quvre d'une plateforme d'intégration (ETL) pour le big data, |
fr_FR |
dc.type |
Thesis |
fr_FR |
Fichier(s) constituant ce document
Ce document figure dans la(les) collection(s) suivante(s)
Afficher la notice abrégée