Résumé:
Le travail présenté dans le cadre de ce mémoire s'intéresse à la recherche d'information adaptée au média image, l'objectif étant de permettre la recherche de documents images par des utilisateurs. De manière similaire aux travaux de recherche d'information sur des documents textuels, définir un modele de recherche d'information pour les images nécessite la mise en place d'un certain nombre d'éléments : modele de documents et de requêtes, modele de correspondance exacte.
Le cadre de ce travail se focalise sur une base d'images généraliste, sur des utilisateurs quelconques, et sur l'utilisation de descriptions textuelles du contenu des images ct des requêtes tout en vérifiant la sémantique.
Au cours de l'état de l'art que nous avons réalisé, nous avons étudié la modélisation des systèmes de recherche d'information et nous avons détaillé le modèle boolóen classique de recherche d'information sur des textes. Notre travail portant sur les images, nous avons également exposé des travaux existants sur la recherche d'images, en mettant en relief la difficulté d'appliquer aux images les techniques classiques de recherche d'information. Cette difficulté provient du fossé sémantique, qui sépare les pixels constituant une image de l'interprétation du sens associé à ces pixels. Nous avons en particulier distingué les approches existentes en Rim selon qu'elles considèrent ou non le sens associé aux pixels. Nous avons cité aussi les différents langages utilisés pour la recherche d'images qui sont : les langages textuels simples et les langages complexes (graphiques, visuels et hypennedia). Et enfin, nous avons parlé sur les différentes présentations utilisées pour la visualisation des résultats dans les SR Im ainsi que les mesures d'évaluation de ces systèmes.
Nous proposons un système qui applique le modèle booléen de recherche d'information pour les images. Ce système comprend un modèle de représentation de documents basé sur un modèle d'image physique. Notre définition repose sur le fichier inverse. Un fichier inverse est une génération logique du modèle d'images physique. Les documents - et les requêtes - sont représentés par des mots clés, les opérateurs booléens sont utilisés aussi pour la représentation des requêtes. Cela permet de vérifier la sémantique qui se trouve dans les images. Ce système comprend une fonction de correspondance basée sur la comparaison des mots clés des requêtes et ceux du fichier inverse.
Cette utilisation de mots clés comme descripteurs d'images dans le cadre d'un modéle booléon de recherche d'information donne à notre travail un avantage qui est d'un coté : la simplicité du système et d'un autre coté : la vérification de la sémantique des images qui rend les résultats plus ou moins exactes.
Perspectives :
Ce travail, comme tout travail de mémoire, pose de nombreuses questions et donne lieu à de nombreuses perspectives, parmi lesquelles :
Il est important de modéliser un modèle de connaissances qui prend en compte les connaissances externes qui peuvent enrichir le nombre de réponses du système, par exemple en incluant un thésaurus composé des termes apparaissant dans l'ensemble des images, reliés entre eux par des liens de généricité/spécificité ou de synonymie. Par exemple, une requête portant sur "voiture" pourra retourner des images contenant le termc "automobile". L'utilisation d'un thésaurus permet d'augmenter le nombre de réponses du système, en incluant dans le résultat des images contenant des mots reliés aux mots de la requête.
On peut par exemple proposer à l'utilisateur de lui indiquer parmi les résultats les images qu'il estime pertinentes et ceux qu'il estime non pertinentes, afin de retourner de nouveaux résultats en fonction des indications et choix de l'utilisateur. Ce processus interactif, appelé bouclage de pertinence, a pour but d'affiner la recherche, d'améliorer la qualité des résultats et de diminuer le temps d'extraction des résultats
Au niveau de la normalisation des mots clés extraits de la requête, on a utilise l'algorithme de Porter. Cette phase de passage à la forme canonique présente le principal avantage de représenter par exemple le mot "cuts" et le mot "cut" de la même façon ("cut"), ce qui évite à l'utilisateur de devoir entrer les formes de pluriel des noms ou les formes conjuguées des verbes lors de sa recherche. Cependant, dans certains cas, le passage à la forme canonique supprime la sémantique originale du mot. Par exemple, "iteration" produit "iter" et "general produit "gener". Ainsi, lorsque l'utilisateur formulera une requête avec le mot "iteration", il aura très certainement, parmi la liste des images résultats, des images non pertinentes relatives au mot "iter"... Si la lemmatisation a pour but d'augmenter le rappel, le précision (c'est-'a-dire la proportion d'images pertinentes par rapport au nombre d'images renvoyés par le système) en fait souvent les frais ...
Pour solutionner ce problème, CJ. Crouch Cro02) propose une méthode en deux temps, dont les résultats s'avèrent encourageants : - Une première recherche est effectuée, en utilisant une lemmatisation des mots ; - Les documents sont ensuite riordonnés en fonction de la présence des termes nonlemmatisés de la requête dans leur contenu.