Université Blida 1

Un outil pour améliorer la recherche d'information dans le corpus des tweets à base temporelle , sémantique et lexicale.

Afficher la notice abrégée

dc.contributor.author Abdellaoui., Aicha.
dc.contributor.author Belkacem., Khadidja.
dc.date.accessioned 2021-10-27T10:35:14Z
dc.date.available 2021-10-27T10:35:14Z
dc.date.issued 2017
dc.identifier.uri http://di.univ-blida.dz:8080/jspui/handle/123456789/12528
dc.description ill.,Bibliogr. fr_FR
dc.description.abstract De nos jours, les plates-formes de microblogging sont les réseaux sociaux les plus récents et les plus utilisés du Web 2.0. Elles présentent une masse volumineuse d'informations. Aujourd'hui Twitter est parmi les services de microblogging le plus populaire avec 320 millions d'utilisateurs actif par mois et plus de 500 millions de tweets envoyés par jour. Ce volume de publications complique l'opération d'accès à l'information par les Microblogeurs. Le tweet est un document court dont la longueur ne dépasse pas 140 caractères. Souvent écrit avec un langage mal orthographier, contenant des abréviations et des argots à fin de transcrire l'information avec un nombre de caractères minimum. La recherche d'informations dans le corpus des tweets présente un véritable défi pour les modèles de recherche d'informations actuelles, cela est dû au volume du corpus d'une part et aux caractéristiques des tweets d'autre part. En effet, quand l'utilisateur soumet une requête, le modèle de recherche sera confronté à deux problèmes : d'abord l'absence des termes de la requête dans le tweet, et le fait que chaque terme apparaît au plus une seule fois dans le texte. La sélection des meilleurs tweets se base sur un appariement lexical entre la requête et les tweets. De ce fait, il y a une grande probabilité que dans le Top de liste figure des tweets non pertinents. Pour améliorer le classement des tweets pertinents beaucoup de travaux ont introduit les évidences temporelles dans leurs propositions en les combinant avec l'évidence lexicale pour le reclassement des tweets résultats de la première recherche. De notre tour, nous avons proposé un système qui se base sur un nouveau mécanisme pour générer des nouveaux classements des résultats à base temporelle, sémantique et leur combinaison avec la pertinence lexicale (le score de Lucene). Mots clés : Twitter , microblogging, le corpus des tweets, requête, modèle de recherche, le reclassement des tweets, recherche sémantique, recherche temporelle, recherche lexicale. fr_FR
dc.language.iso fr fr_FR
dc.publisher Université Blida 1 fr_FR
dc.subject Twitter. fr_FR
dc.subject microblogging. fr_FR
dc.subject le corpus des tweets. fr_FR
dc.subject requête. fr_FR
dc.subject modèle de recherche. fr_FR
dc.subject le reclassement des tweets. fr_FR
dc.subject recherche sémantique. fr_FR
dc.subject recherche temporelle, fr_FR
dc.subject recherche lexicale. fr_FR
dc.title Un outil pour améliorer la recherche d'information dans le corpus des tweets à base temporelle , sémantique et lexicale. fr_FR
dc.type Thesis fr_FR


Fichier(s) constituant ce document

Ce document figure dans la(les) collection(s) suivante(s)

Afficher la notice abrégée

Chercher dans le dépôt


Recherche avancée

Parcourir

Mon compte