Résumé:
La publication croissante de données liées sur le web présente un défi majeur en raison de
leur hétérogénéité et de leur volume en constante augmentation. La découverte de liens entre
les ressources web consiste à identifier les correspondances sémantiques entre des éléments
similaires dans les données du web. Cependant, avec la quantité toujours croissante de données
disponibles sur le web, il devient essentiel de disposer d’outils automatiques pour la découverte
de ces liens. Néanmoins, l’identification automatique de correspondances sémantiques entre les
données reste très difficile, notamment en ce qui concerne la qualité des liens extraits.
Pour contribuer à résoudre ce problème, nous proposons une solution pour effectuer la découverte
des liens entre deux ensembles de données liées en utilisant la théorie de la fonction de
croyance. Après l’extraction des différentes ressources des ensembles de données, nous lançons
le processus de découverte des liens pour trouver les ressources équivalentes. Nous utilisons
un mécanisme de filtrage pour regrouper les données en catégories, réduisant ainsi l’ensemble
de recherche des données similaires. Ensuite, nous combinons les mesures terminologiques,
extensionnelles et structurelles en utilisant la théorie de la fonction de croyance, afin de définir
une mesure de similarité globale sémantique. Cette mesure combinée est calculée en utilisant les
degrés de croyance des différentes mesures de similarité. Enfin, nous validons les liens trouvés
pour démontrer l’efficacité de notre système.
Mots clés : Données liées, découverte de liens, Web sémantique, hétérogénéité des données, correspondance
sémantique, filtrage, mesure de similarité, théorie de la fonction de croyance.