Université Blida 1

Les entrepôts de textes (text warehousing)

Afficher la notice abrégée

dc.contributor.author Sarah, Attafi
dc.date.accessioned 2021-02-09T07:45:59Z
dc.date.available 2021-02-09T07:45:59Z
dc.date.issued 2018
dc.identifier.uri http://di.univ-blida.dz:8080/jspui/handle/123456789/9795
dc.description Bibliogr. ill. 120 p. fr_FR
dc.description.abstract L'analyse des données textuelles connaît un intérêt grandissant depuis plusieurs années. Le développement des moyens de communications a engendré une utilisation croissante du texte comme support de l'information. Les données textuelles numérisées constituent ainsi jusqu'à 80% des flux d'informations stockées quotidiennement dans les entreprises. Dés lors, un besoin d'outils capables d'analyser en profondeur cette masse de données s'impose. Les systèmes décisionnels classiques ont déjà fait leurs preuves dans le domaine de l'analyse des données simples. Or ces systèmes ne sont pas adaptés à l'analyse des données textuelles. Dans le cadre de notre thèse, nous proposons une solution pour l'entreposage des données textuelles. Notre démarche couvre les principales phases d'un processus classique d'entreposage de données, et utilise de nouvelles méthodes adaptées aux données textuelles. Pour offrir une solution aux problèmes d'alimentation des entrepôts de textes, nous introduisons une nouvelle technique d'intégration des données textuelles sous la forme d'un processus adapté d'ETL (Extract-Transform-Load) basé sur la technique de fouille de données LDA (Latent Dirichlet Allocation) et la taxonomie ODP (Open Directory Projet). D'autre part, nous proposons un nouveau modèle baptisé : le Modèle Multidimensionnel Sémantique d'Objet Texte (MSMTO) comme une solution de structuration de données textuelles en vue de leur analyse. Afin de pouvoir spécifier des analyses sur les données issues des entrepôts de textes, nous introduisons des opérations permettant la manipulation des concepts du modèle MSMTO. Ainsi nous proposons un opérateur de construction de cube textuel sémantique (ST-Cube). Notre opérateur permet de donner aux décideurs la possibilité de définir le fait lors de l'analyse, ce qui offre plus de flexibilité. Pour répondre au problème d'agrégation de données textuelles, nous proposons un opérateur d'agrégation : le Top_KRanked Topics qui permet d'obtenir une vision synthétique des informations. Il agrège un ensemble de n sujets dans un sous-ensemble de k sujets les plus pertinents, puis génère pour chaque sujet une liste de documents classés. Pour valider nos différentes contributions, nous avons réalisé, en plus des travaux d'implémentation, une étude expérimentale pour chacune de nos propositions. Les résultats retournés montrent l'efficacité de notre solution pour l'entreposage et l'analyse en ligne des données textuelles. fr_FR
dc.language.iso fr fr_FR
dc.publisher univ- blida 1 fr_FR
dc.subject Contexte fr_FR
dc.subject Enrichissement de requétes fr_FR
dc.title Les entrepôts de textes (text warehousing) fr_FR
dc.title.alternative Construction et analyse en ligne des cubes textes fr_FR
dc.type Thesis fr_FR


Fichier(s) constituant ce document

Ce document figure dans la(les) collection(s) suivante(s)

Afficher la notice abrégée

Chercher dans le dépôt


Recherche avancée

Parcourir

Mon compte