Vers un corpus parallèle monolingue pour la langue arabe a partir de corpus parallèle bilingues

Feknous, Hind; Selhani, Imène

dc.contributor.author	Feknous, Hind
dc.contributor.author	Selhani, Imène
dc.date.accessioned	2022-01-30T10:14:25Z
dc.date.available	2022-01-30T10:14:25Z
dc.date.issued	2021-10-03
dc.identifier.uri	http://di.univ-blida.dz:8080/jspui/handle/123456789/14022
dc.description	ill., Bibliogr.	fr_FR
dc.description.abstract	La génération d’un corpus parallèle monolingue -dit corpus de paraphrases- en langue arabe peut remédier le problème de manque de données arabes et facilite beaucoup de tâches de TAL (Traitement Automatique de langage) tels que la traduction des textes, les systèmes de question-réponses … Dans notre travail nous abordons les techniques de génération des corpus de paraphrases, nous nous intéressons beaucoup plus aux approches guidées par les données, plus précisément une approche basée sur l’extraction de données à partir des corpus parallèles bilingues. Notre corpus a été généré en traduisant des couples de phrases extraits des corpus parallèles bilingues de différentes langues en langue arabe, ces couples ont été prétraités, alignés et évalués en impliquant différentes techniques y compris l’intervention d’une expertise humaine. Un modèle de génération de paraphrases nommé -EDAM- (conçu dans un travail précédent) a été utilisé pour entrainer un nombre considérable des couples considérés comme couples candidats-, et pour tester et enfin générer des paraphrases. Mots clés : corpus, paraphrase, corpus parallèle, Traitement Automatique de langage.	fr_FR
dc.language.iso	fr	fr_FR
dc.publisher	Université Blida 1	fr_FR
dc.subject	corpus	fr_FR
dc.subject	paraphrase	fr_FR
dc.subject	corpus parallèle	fr_FR
dc.subject	Traitement Automatique de langage	fr_FR
dc.title	Vers un corpus parallèle monolingue pour la langue arabe a partir de corpus parallèle bilingues	fr_FR
dc.type	Thesis	fr_FR