Université Blida 1

Mise en quvre d'une plateforme d'intégration (ETL) pour le big data,

Afficher la notice abrégée

dc.contributor.author Mokeddem., Oussama.
dc.contributor.author Mami., Mohamed Nadjib.
dc.date.accessioned 2021-03-11T12:10:44Z
dc.date.available 2021-03-11T12:10:44Z
dc.date.issued 2013-06-29
dc.identifier.uri http://di.univ-blida.dz:8080/jspui/handle/123456789/10623
dc.description ill.,Bibliogr. fr_FR
dc.description.abstract ETL, acronyme de Extracting-Transforming-Loading (ou parfois datapumping), est un système de chargement de données depuis les différentes sources d'information de l'entreprise (hétérogènes) vers l'entrepôt de données (Base de données multidimensionnelle). Au fait, ce système ne se contente pas de charger les données, il doit les préparer et les normaliser (les filtrer, les nettoyer, les mettre dans un format approprié, les contextualiser, les homogénéiser, les agréger) et enfin les charger dans leur destination finale qu'est l'entrepôt de données. Un des défis majeurs pour le domaine de l’ETL est le traitement de très grandes quantités de données connues aujourd'hui sous le nom de Big Data. Déjà que ce processus est complexe vu la diversité et l'hétérogénéité des sources ainsi que la complexité des tâches ETL, il devra faire face à des données massives caractérisées par une volumétrie importante (PetaBytes, HexaBytes, ZettaBytes, ...), de nouvelles structures et une exigence en termes de temps de traitement. Nous nous proposons de mettre en æuvre une plateforme d'intégration de données (ETL) pour l'entreposage et l'analyse en ligne destinée pour le Big Data dans un environnement basé sur le paradigme MapReduce destiné pour le traitement parallèle à grande échelle de données intensives sur un cluster d'ordinateurs. Le projet Hadoop de la fondation Apache étant une référence pour les frameworks MapReduce open source. Mots clés : Entreposage de données, ETL, Traitement parallèle, Performance, MapReduce, Hadoop, Big Data fr_FR
dc.language.iso fr fr_FR
dc.publisher Université Blida 1 fr_FR
dc.subject Entreposage de données. fr_FR
dc.subject ETL. fr_FR
dc.subject Traitement parallèle. fr_FR
dc.subject performance. fr_FR
dc.subject MapReduce. fr_FR
dc.subject Hadoop. fr_FR
dc.subject Big Data. fr_FR
dc.title Mise en quvre d'une plateforme d'intégration (ETL) pour le big data, fr_FR
dc.type Thesis fr_FR


Fichier(s) constituant ce document

Ce document figure dans la(les) collection(s) suivante(s)

Afficher la notice abrégée

Chercher dans le dépôt


Recherche avancée

Parcourir

Mon compte