Veuillez utiliser cette adresse pour citer ce document : https://di.univ-blida.dz/jspui/handle/123456789/13097
Titre: Vers un corpus monolingue parallèle de paraphrases pour la langue Arabe à partir de connaissances Web
Auteur(s): Boukhatem, Fatima Zahra
Mots-clés: connaissances web
TAL
paraphrases
paraphrases
Dataset
Date de publication: 3-oct-2021
Editeur: Université Blida 1
Résumé: De nos jours, la langue arabe est de plus en plus utilisée sur le Web. On peut y trouver de nombreux articles dans tous les domaines. Cependant, il existe peu de travaux exploitant les connaissances Web comme ressources de données pour réaliser les différentes tâches du TAL. La réalisation de nouvelles applications en traitement automatique de la langue (TAL) pour l'arabe nécessite en premier lieu de développer une approche performante et robuste. Dans notre travail, nous abordons le problème de création automatique de corpus monolingues de paraphrases pour la langue Arabe afin de les utiliser pour entrainer un modèle de génération automatique de paraphrases dédiée à cette langue. Une évaluation qualitative humaine sur un échantillon de couples de phrases générées par notre approche, confirme que la qualité des paraphrases construites est bonne sémantiquement et syntaxiquement. L’utilisat ion de notre dataset pour entrainer un modèle de génération de paraphrases montre des résultats considérables nous permet de faire un grand pas pour palier le problème de manque ressources arabe. Mots clés : connaissances web, TAL, paraphrases, paraphrases, Dataset.
Description: ill., Bibliogr.
URI/URL: http://di.univ-blida.dz:8080/jspui/handle/123456789/13097
Collection(s) :Mémoires de Master



Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.