Veuillez utiliser cette adresse pour citer ce document : https://di.univ-blida.dz/jspui/handle/123456789/9795
Titre: Les entrepôts de textes (text warehousing)
Autre(s) titre(s): Construction et analyse en ligne des cubes textes
Auteur(s): Sarah, Attafi
Mots-clés: Contexte
Enrichissement de requétes
Date de publication: 2018
Editeur: univ- blida 1
Résumé: L'analyse des données textuelles connaît un intérêt grandissant depuis plusieurs années. Le développement des moyens de communications a engendré une utilisation croissante du texte comme support de l'information. Les données textuelles numérisées constituent ainsi jusqu'à 80% des flux d'informations stockées quotidiennement dans les entreprises. Dés lors, un besoin d'outils capables d'analyser en profondeur cette masse de données s'impose. Les systèmes décisionnels classiques ont déjà fait leurs preuves dans le domaine de l'analyse des données simples. Or ces systèmes ne sont pas adaptés à l'analyse des données textuelles. Dans le cadre de notre thèse, nous proposons une solution pour l'entreposage des données textuelles. Notre démarche couvre les principales phases d'un processus classique d'entreposage de données, et utilise de nouvelles méthodes adaptées aux données textuelles. Pour offrir une solution aux problèmes d'alimentation des entrepôts de textes, nous introduisons une nouvelle technique d'intégration des données textuelles sous la forme d'un processus adapté d'ETL (Extract-Transform-Load) basé sur la technique de fouille de données LDA (Latent Dirichlet Allocation) et la taxonomie ODP (Open Directory Projet). D'autre part, nous proposons un nouveau modèle baptisé : le Modèle Multidimensionnel Sémantique d'Objet Texte (MSMTO) comme une solution de structuration de données textuelles en vue de leur analyse. Afin de pouvoir spécifier des analyses sur les données issues des entrepôts de textes, nous introduisons des opérations permettant la manipulation des concepts du modèle MSMTO. Ainsi nous proposons un opérateur de construction de cube textuel sémantique (ST-Cube). Notre opérateur permet de donner aux décideurs la possibilité de définir le fait lors de l'analyse, ce qui offre plus de flexibilité. Pour répondre au problème d'agrégation de données textuelles, nous proposons un opérateur d'agrégation : le Top_KRanked Topics qui permet d'obtenir une vision synthétique des informations. Il agrège un ensemble de n sujets dans un sous-ensemble de k sujets les plus pertinents, puis génère pour chaque sujet une liste de documents classés. Pour valider nos différentes contributions, nous avons réalisé, en plus des travaux d'implémentation, une étude expérimentale pour chacune de nos propositions. Les résultats retournés montrent l'efficacité de notre solution pour l'entreposage et l'analyse en ligne des données textuelles.
Description: Bibliogr. ill. 120 p.
URI/URL: http://di.univ-blida.dz:8080/jspui/handle/123456789/9795
Collection(s) :Thèse de Doctorat

Fichier(s) constituant ce document :
Fichier Description TailleFormat 
32-004-68-1.pdf2,2 MBAdobe PDFVoir/Ouvrir


Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.