Les entrepôts de textes (text warehousing)

Sarah, Attafi

dc.contributor.author	Sarah, Attafi
dc.date.accessioned	2021-02-09T07:45:59Z
dc.date.available	2021-02-09T07:45:59Z
dc.date.issued	2018
dc.identifier.uri	http://di.univ-blida.dz:8080/jspui/handle/123456789/9795
dc.description	Bibliogr. ill. 120 p.	fr_FR
dc.description.abstract	L'analyse des données textuelles connaît un intérêt grandissant depuis plusieurs années. Le développement des moyens de communications a engendré une utilisation croissante du texte comme support de l'information. Les données textuelles numérisées constituent ainsi jusqu'à 80% des flux d'informations stockées quotidiennement dans les entreprises. Dés lors, un besoin d'outils capables d'analyser en profondeur cette masse de données s'impose. Les systèmes décisionnels classiques ont déjà fait leurs preuves dans le domaine de l'analyse des données simples. Or ces systèmes ne sont pas adaptés à l'analyse des données textuelles. Dans le cadre de notre thèse, nous proposons une solution pour l'entreposage des données textuelles. Notre démarche couvre les principales phases d'un processus classique d'entreposage de données, et utilise de nouvelles méthodes adaptées aux données textuelles. Pour offrir une solution aux problèmes d'alimentation des entrepôts de textes, nous introduisons une nouvelle technique d'intégration des données textuelles sous la forme d'un processus adapté d'ETL (Extract-Transform-Load) basé sur la technique de fouille de données LDA (Latent Dirichlet Allocation) et la taxonomie ODP (Open Directory Projet). D'autre part, nous proposons un nouveau modèle baptisé : le Modèle Multidimensionnel Sémantique d'Objet Texte (MSMTO) comme une solution de structuration de données textuelles en vue de leur analyse. Afin de pouvoir spécifier des analyses sur les données issues des entrepôts de textes, nous introduisons des opérations permettant la manipulation des concepts du modèle MSMTO. Ainsi nous proposons un opérateur de construction de cube textuel sémantique (ST-Cube). Notre opérateur permet de donner aux décideurs la possibilité de définir le fait lors de l'analyse, ce qui offre plus de flexibilité. Pour répondre au problème d'agrégation de données textuelles, nous proposons un opérateur d'agrégation : le Top_KRanked Topics qui permet d'obtenir une vision synthétique des informations. Il agrège un ensemble de n sujets dans un sous-ensemble de k sujets les plus pertinents, puis génère pour chaque sujet une liste de documents classés. Pour valider nos différentes contributions, nous avons réalisé, en plus des travaux d'implémentation, une étude expérimentale pour chacune de nos propositions. Les résultats retournés montrent l'efficacité de notre solution pour l'entreposage et l'analyse en ligne des données textuelles.	fr_FR
dc.language.iso	fr	fr_FR
dc.publisher	univ- blida 1	fr_FR
dc.subject	Contexte	fr_FR
dc.subject	Enrichissement de requétes	fr_FR
dc.title	Les entrepôts de textes (text warehousing)	fr_FR
dc.title.alternative	Construction et analyse en ligne des cubes textes	fr_FR
dc.type	Thesis	fr_FR