Résumé:
Les plateformes de traitement statistique des langues permettent d’offrir les fonctionnalitésles plus courantes pour un traitement automatique de corpus de données volumineuximpraticable à une manipulation manuelle et ouvrant ainsi la voie à l’analyse de millions detextes à la fois. Plusieurs plateformes existent en ligne mais elles restent limitées pour la languearabe. Notre travail a pour objet de concevoir une plateforme permettant de fournir destraitements sur des corpus en langue arabe. Dans ce mémoire nous proposons une plateformefournissant plusieurs fonctionnalités : extraction des principales caractéristiques devocabulaires de corpus décrites à partir du tableau lexical, des index hiérarchiques, desconcordances, le calcul des distances entre textes et leur classification, collocation et extractionde groupe de formes …etc., ces outils sont réalisés par le prétraitement classique ou parlexicométrie (une discipline relativement récente). Nous avons finalement développé et mis enœuvre une plateforme réunissant ces différentes fonctionnalités qui concordent aux besoins del’académie de la langue arabe.
Mots-clés : Langue arabe, plateforme, statistique, concordances , lexicométrie