Résumé:
Dans le cadre de notre projet de master, nous proposons un système de QA comparatif
spécifique à la langue arabe basé sur le modèle AraBERT, en utilisant le modèle
pré-entraîné BERT pour affiner les tâches NLP ultérieures telles que la QA, le NER et
la classification. Notre système se compose de quatre modules : (1) un module de classification
des questions, (2) un module d’extraction des éléments de comparaison, (3) un
module de RI et de QA, et (4) un module de comparaison. Chaque module du système
proposé a entraîné des modèles de réseaux neuronaux à l’aide de différents ensembles de
données, notamment Arabic-SQuAD, ARCD, une traduction automatique de HotpotQA
et un ensemble de données de questions de comparaison générées automatiquement.
Le module de classification a fait preuve d’une précision de 99%, et les résultats de l’extracteur
se sont avérés très positifs avec un taux de précision de 79% .De même les résultats
du retriever du module de recherche d’information se sont révélés satisfaisante avec un F1
score de 69.46% . Et puis finalement le module de comparaison qui était bien réussi avec
un score de précision très satisfaisant qui s’élève a 92%
Mots clés : Recherche d’information, Traitement automatique du langage, Système de questions-réponses, Questions comparatifs, Langue Arabe.