Mise en quvre d'une plateforme d'intégration (ETL) pour le big data,

Mokeddem., Oussama.; Mami., Mohamed Nadjib.

Please use this identifier to cite or link to this item: http://localhost:8080/xmlui/handle/123456789/10623

Full metadata record

DC Field	Value	Language
dc.contributor.author	Mokeddem., Oussama.	-
dc.contributor.author	Mami., Mohamed Nadjib.	-
dc.date.accessioned	2021-03-11T12:10:44Z	-
dc.date.available	2021-03-11T12:10:44Z	-
dc.date.issued	2013-06-29	-
dc.identifier.uri	http://di.univ-blida.dz:8080/jspui/handle/123456789/10623	-
dc.description	ill.,Bibliogr.	fr_FR
dc.description.abstract	ETL, acronyme de Extracting-Transforming-Loading (ou parfois datapumping), est un système de chargement de données depuis les différentes sources d'information de l'entreprise (hétérogènes) vers l'entrepôt de données (Base de données multidimensionnelle). Au fait, ce système ne se contente pas de charger les données, il doit les préparer et les normaliser (les filtrer, les nettoyer, les mettre dans un format approprié, les contextualiser, les homogénéiser, les agréger) et enfin les charger dans leur destination finale qu'est l'entrepôt de données. Un des défis majeurs pour le domaine de l’ETL est le traitement de très grandes quantités de données connues aujourd'hui sous le nom de Big Data. Déjà que ce processus est complexe vu la diversité et l'hétérogénéité des sources ainsi que la complexité des tâches ETL, il devra faire face à des données massives caractérisées par une volumétrie importante (PetaBytes, HexaBytes, ZettaBytes, ...), de nouvelles structures et une exigence en termes de temps de traitement. Nous nous proposons de mettre en æuvre une plateforme d'intégration de données (ETL) pour l'entreposage et l'analyse en ligne destinée pour le Big Data dans un environnement basé sur le paradigme MapReduce destiné pour le traitement parallèle à grande échelle de données intensives sur un cluster d'ordinateurs. Le projet Hadoop de la fondation Apache étant une référence pour les frameworks MapReduce open source. Mots clés : Entreposage de données, ETL, Traitement parallèle, Performance, MapReduce, Hadoop, Big Data	fr_FR
dc.language.iso	fr	fr_FR
dc.publisher	Université Blida 1	fr_FR
dc.subject	Entreposage de données.	fr_FR
dc.subject	ETL.	fr_FR
dc.subject	Traitement parallèle.	fr_FR
dc.subject	performance.	fr_FR
dc.subject	MapReduce.	fr_FR
dc.subject	Hadoop.	fr_FR
dc.subject	Big Data.	fr_FR
dc.title	Mise en quvre d'une plateforme d'intégration (ETL) pour le big data,	fr_FR
dc.type	Thesis	fr_FR
Appears in Collections:	Mémoires de Master

Files in This Item:

File	Description	Size	Format
mokeddam oussama.pdf		56,47 MB	Adobe PDF	View/Open

Show simple item record

DSpace JSPUI

DSpace preserves and enables easy and open access to all types of digital content including text, images, moving images, mpegs and data sets