Afficher la notice abrégée
dc.contributor.author |
Feknous, Hind |
|
dc.contributor.author |
Selhani, Imène |
|
dc.date.accessioned |
2022-01-30T10:14:25Z |
|
dc.date.available |
2022-01-30T10:14:25Z |
|
dc.date.issued |
2021-10-03 |
|
dc.identifier.uri |
http://di.univ-blida.dz:8080/jspui/handle/123456789/14022 |
|
dc.description |
ill., Bibliogr. |
fr_FR |
dc.description.abstract |
La génération d’un corpus parallèle monolingue -dit corpus de paraphrases- en langue
arabe peut remédier le problème de manque de données arabes et facilite beaucoup
de tâches de TAL (Traitement Automatique de langage) tels que la traduction des
textes, les systèmes de question-réponses …
Dans notre travail nous abordons les techniques de génération des corpus de
paraphrases, nous nous intéressons beaucoup plus aux approches guidées par les
données, plus précisément une approche basée sur l’extraction de données à partir
des corpus parallèles bilingues.
Notre corpus a été généré en traduisant des couples de phrases extraits des corpus
parallèles bilingues de différentes langues en langue arabe, ces couples ont été
prétraités, alignés et évalués en impliquant différentes techniques y compris
l’intervention d’une expertise humaine.
Un modèle de génération de paraphrases nommé -EDAM- (conçu dans un travail
précédent) a été utilisé pour entrainer un nombre considérable des couples considérés
comme couples candidats-, et pour tester et enfin générer des
paraphrases.
Mots clés : corpus, paraphrase, corpus parallèle, Traitement Automatique de langage. |
fr_FR |
dc.language.iso |
fr |
fr_FR |
dc.publisher |
Université Blida 1 |
fr_FR |
dc.subject |
corpus |
fr_FR |
dc.subject |
paraphrase |
fr_FR |
dc.subject |
corpus parallèle |
fr_FR |
dc.subject |
Traitement Automatique de langage |
fr_FR |
dc.title |
Vers un corpus parallèle monolingue pour la langue arabe a partir de corpus parallèle bilingues |
fr_FR |
dc.type |
Thesis |
fr_FR |
Fichier(s) constituant ce document
Ce document figure dans la(les) collection(s) suivante(s)
Afficher la notice abrégée