Université Blida 1

Data Provenance et Data Lineage dans un environnement Data Lake

Afficher la notice abrégée

dc.contributor.author Amrouche, Manel
dc.contributor.author Boukrou, Lina
dc.contributor.author Bala, M. ( promoteur)
dc.date.accessioned 2023-10-03T12:52:14Z
dc.date.available 2023-10-03T12:52:14Z
dc.date.issued 2023-06
dc.identifier.uri https://di.univ-blida.dz/jspui/handle/123456789/25160
dc.description ill., Bibliogr. Cote:ma-004-932 fr_FR
dc.description.abstract La vulgarisation des données à grande échelle, tout particulièrement les données non structurées et les environnements Big Data, a donné naissance à une nouvelle technologie de stockage appelée Lac de données (Data Lake en anglais). Les lacs de données permettent de stocker d'énormes quantités de données, qu'elles soient structurées, semi-structurées ou non structurées, en les publiant à des fins d'analyse de données, de statistiques, de fouille de données, etc. Pour s’assurer que cette technologie de stockage ne se transforme en marécages, la gouvernance du Data Lake basée sur un catalogue de métadonnées est considérée comme la clé de voûte d’un environnement Data Lake. Le catalogue des métadonnées permet de créer des passerelles sémantiques entres les différentes sources de données et de prendre en charge les différentes opérations de base à savoir l’ingestion des données, faciliter l’accès aux différentes sources quel que soit leur format, etc. La " Data Provenance " ou " Data Lineage " étant l'un des éléments importants du catalogue des métadonnées du système Data Lake, elle permet de définir le contenu des sources de données, de décrire les liens entre les sources ainsi que l'historique des changements effectués sur celles-ci. L'objectif de ce travail est la capture, le stockage, l'interrogation et la visualisation des métadonnées décrivant le cycle de vie des sources de données dans un environnement Data Lake. Mots-clés: Data Provenance, Data Lineage, Métadonnées, Data Lake, Big Data, NoSQL. fr_FR
dc.language.iso fr fr_FR
dc.publisher Université Blida 1 fr_FR
dc.subject Data Provenance fr_FR
dc.subject Data Lineage fr_FR
dc.subject Métadonnées fr_FR
dc.subject Data Lake fr_FR
dc.subject Big Data fr_FR
dc.subject NoSQL fr_FR
dc.title Data Provenance et Data Lineage dans un environnement Data Lake fr_FR
dc.type Thesis fr_FR


Fichier(s) constituant ce document

Ce document figure dans la(les) collection(s) suivante(s)

Afficher la notice abrégée

Chercher dans le dépôt


Recherche avancée

Parcourir

Mon compte