Résumé:
A travers ce projet, nous présentons une approche hybride pour l’extraction automatique
des mots clés dans les textes écrits en langue arabe. La méthode que nous proposons
combine des critères statistiques tels que la fréquence avec d’autres linguistiques liés à la
catégorie grammaticale.
L’expérience menée sur un corpus formé d’une collection de documents économiques,
scientifiques et technologiques à montrer l’intérêt de combiner plusieurs critères pour
améliorer le processus d’extraction des mots clés dans les textes arabes et en particulier
l’intérêt de la catégorie grammaticale dans tel processus.
Mots clés
Traitement automatique de la langue arabe, Analyse morphologique, Mots pertinents,
Pondération de termes, Catégorie grammaticale.
Through this project, we present a hybrid approach for the automatic extraction of
keywords in texts written in Arabic. The proposed method combines statistical criteria
such as frequency of words with linguistic criteria related to the grammatical category.
The experiment conducted on a corpus formed of a collection of economic , technologic
and scientific articles showed interest to combine several criteria to improve the process
of extracting key words in Arabic texts and in particular the interest of the grammatical
category in such process.
Keywords
Arabic language processing, Morpho-syntactic analysis, Relevant words, terms weighting,
Grammatical category.