Université Blida 1

Mise en œuvre d'un outil d'analyse de données textuelles.

Afficher la notice abrégée

dc.contributor.author Boukhers., Rachid .
dc.contributor.author Meraga., Omar.
dc.date.accessioned 2021-10-20T08:46:17Z
dc.date.available 2021-10-20T08:46:17Z
dc.date.issued 2014-10-27
dc.identifier.uri http://di.univ-blida.dz:8080/jspui/handle/123456789/12412
dc.description ill.,Bibliogr. fr_FR
dc.description.abstract Ce projet s'inscrit dans le cadre de mise en oeuvre d'un outil d'analyse de données textuelles. Ce travail a été fait durant un stage pratique au niveau du département d'informatique à l'université SAAD DAHLAB Blida. Administrer des données texte, afin de pouvoir prendre profit des informations qu'elles contiennent, est devenu très essentiel, à cause de leurs volumes importants et la quantité d'information qu'elles puissent contenir. Afin de permettre l'analyse de ce type de données, il est devenu plus que nécessaire d'adapter un modèle de représentation de données, permettant de décrire ces données textuelles de façon suffisamment formelle, pour qu'elles puissent être prêtes à l'analyse. plusieurs modèles ont été proposes, ils servent à la représentation multidimensionnelle des données textuelles, on peut les classer en deux familles de modèles : modèles extensifs, et modèles à nouveaux concepts. Un nouveau modèle appelé MSMTO a été proposé, c'est un modèle à nouveaux concepts, il est puissant puisque il prend en compte la sémantique des données textuelles, il offre aussi la flexibilité, en tenant compte du contenu sémantique de données textuelles comme une mesure, un fait ou même une dimension. Notre choix s'est porté sur l'implémentation d'un outil d'analyse de données texte, basé sur le modèle MSMTO. Pour extraire des sujets (Topics) à partir d'un corpus de documents, on a opté l'approche statistique LDA (Latent Dirichlet Allocation). En ce qui concerne la sémantique, on a utilisé l'API puissant de TextWise. On a choisi aussi le format XML pour stocker les informations extraites (Les hiérarchies sémantiques). Pour le développement on a utilisé le langage Java (Java SE), et concernant le SGBD Natif, on a choisi le logiciel eXist-db. fr_FR
dc.language.iso fr fr_FR
dc.publisher Université Blida 1 fr_FR
dc.subject Mise en œuvre. fr_FR
dc.subject données textuelles. fr_FR
dc.subject outil d'analyse. fr_FR
dc.title Mise en œuvre d'un outil d'analyse de données textuelles. fr_FR
dc.type Thesis fr_FR


Fichier(s) constituant ce document

Ce document figure dans la(les) collection(s) suivante(s)

Afficher la notice abrégée

Chercher dans le dépôt


Recherche avancée

Parcourir

Mon compte