Veuillez utiliser cette adresse pour citer ce document : https://di.univ-blida.dz/jspui/handle/123456789/10623
Affichage complet
Élément Dublin CoreValeurLangue
dc.contributor.authorMokeddem., Oussama.-
dc.contributor.authorMami., Mohamed Nadjib.-
dc.date.accessioned2021-03-11T12:10:44Z-
dc.date.available2021-03-11T12:10:44Z-
dc.date.issued2013-06-29-
dc.identifier.urihttp://di.univ-blida.dz:8080/jspui/handle/123456789/10623-
dc.descriptionill.,Bibliogr.fr_FR
dc.description.abstractETL, acronyme de Extracting-Transforming-Loading (ou parfois datapumping), est un système de chargement de données depuis les différentes sources d'information de l'entreprise (hétérogènes) vers l'entrepôt de données (Base de données multidimensionnelle). Au fait, ce système ne se contente pas de charger les données, il doit les préparer et les normaliser (les filtrer, les nettoyer, les mettre dans un format approprié, les contextualiser, les homogénéiser, les agréger) et enfin les charger dans leur destination finale qu'est l'entrepôt de données. Un des défis majeurs pour le domaine de l’ETL est le traitement de très grandes quantités de données connues aujourd'hui sous le nom de Big Data. Déjà que ce processus est complexe vu la diversité et l'hétérogénéité des sources ainsi que la complexité des tâches ETL, il devra faire face à des données massives caractérisées par une volumétrie importante (PetaBytes, HexaBytes, ZettaBytes, ...), de nouvelles structures et une exigence en termes de temps de traitement. Nous nous proposons de mettre en æuvre une plateforme d'intégration de données (ETL) pour l'entreposage et l'analyse en ligne destinée pour le Big Data dans un environnement basé sur le paradigme MapReduce destiné pour le traitement parallèle à grande échelle de données intensives sur un cluster d'ordinateurs. Le projet Hadoop de la fondation Apache étant une référence pour les frameworks MapReduce open source. Mots clés : Entreposage de données, ETL, Traitement parallèle, Performance, MapReduce, Hadoop, Big Datafr_FR
dc.language.isofrfr_FR
dc.publisherUniversité Blida 1fr_FR
dc.subjectEntreposage de données.fr_FR
dc.subjectETL.fr_FR
dc.subjectTraitement parallèle.fr_FR
dc.subjectperformance.fr_FR
dc.subjectMapReduce.fr_FR
dc.subjectHadoop.fr_FR
dc.subjectBig Data.fr_FR
dc.titleMise en quvre d'une plateforme d'intégration (ETL) pour le big data,fr_FR
dc.typeThesisfr_FR
Collection(s) :Mémoires de Master

Fichier(s) constituant ce document :
Fichier Description TailleFormat 
mokeddam oussama.pdf56,47 MBAdobe PDFVoir/Ouvrir


Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.