dc.description.abstract |
Habituellement, les Systèmes de recherche d’Information (SRI) n’effectuent
pas la recherche directement sur les collections de données (datasets)car ce
traitement est contraignant en terme de temps et d’espace mémoire, mais
font plutôt recours à ce que l’on appelle des indexes, du genre que nous
trouvons dans la fin des livres. De ce fait, à travers les années, l’indexation
est devenue sans conteste, la tâche la plus onéreuse parmi toutes les autres
tâches de RI. Le but principal de l’indexation est de créer une représentation
des documents présents dans le corpus de documents global de façon à
automatiser les traitements de ces derniers et faciliter leur appariement avec
les requêtes des utilisateurs. Cette représentation, plus allégée, est alors,
enregistrée sous une structure appropriée pour faciliter l’accès à
l’informat ion et le renvoi de documents pertinents en un minimum de temps.
Dans ce projet, nous nous intéressons à l’étude de l’utilisation des
Floksonomies comme moyen rapide et personnalisé de représenter et
d’indexer l’information car considérées comme l’alternative moderne aux
Ontologies et ressources lexicales traditionnellement utilisées dans la RI.
D’autres part, le but est d’analyser si cette pratique peut améliorer
l'efficacité d'un système de RI en permettant aux documents d’être indexés
et donc retrouvés en temps réel (c.-à-d. : dès leur mise en ligne), et ce en se
basant sur le contexte social.
Mots clés : Système de Recherche d’Information, Indexation, Sensibilité au
contexte, Folksonomies, Ontologies et web sémantique, Traitement
Automatique de la Langue. Usually, Information Search Systems (IRS) do not search directly on data
collections (datasets) because this processing is constraining in terms of time
and memory space, but use what are called indexes, of the kind we find at
the end of books. As a result, over the years, indexation has undoubtedly
become the most expensive of all other IR tasks. The main purpose of
indexing is to create a representation of the documents present in the global
corpus of documents in order to automate their processing and facilitate their
matching with users' requests. This lighter representation is then recorded
under an appropriate structure to facilitate access to information and the
return of relevant documents in a minimum of time.
In this project, we are interested in studying the use of Floksonomies as a
fast and personalized way to represent and index information as considered
as the modern alternative to Ontologies and lexical resources traditionally
used in IR. On the other hand, the aim is to analyse whether this practice can
improve the effectiveness of an IR system by allowing documents to be
indexed and therefore retrieved in real time (i. e. as soon as they are put
online), based on the social context.
Keywords: Information Retrieval, Semantic web, Stemming, Contextmodelling,
Social-bookmarking, Folksonomies, Natural Language
Processing. |
fr_FR |