Résumé:
La Génération Automatique des Questions (AQG) à partir d’une phrase ou d’un
paragraphe est une tâche difficile dans le Traitement Automatique de Langage (NLP). Cette
tâche a des implications importantes dans le domaine de l’éducation par les possibilités offertes
dans la génération automatique des questions à partir d’un contenu éducatif sans recourir à un
effort manuel de la part des éducateurs.
Dans ce contexte, plusieurs études ont été menées sur la génération des questions basées
sur des approches d’apprentissage en profondeur. À notre connaissance, les travaux réalisés à
ce jour ne disposent pas de modèle de génération de questions en langue arabe et qui ne
s'appuient que sur des approches traditionnelles reposant sur des règles érigées manuellement,
ces approches sont limitées en termes de diversité linguistique exigeant un effort humain
considérable.
Récemment, de nombreux modèles de langage pré-entraînés ont fourni des
performances élevées dans plusieurs tâches de NLP pour étudier la génération de questions en
langue arabe. Dans ce présent travail, nous avons affiné un modèle pré-entraîné Ara-T5 (Textto-Text
Transformers
for
Arabic
Language)
à
l’aide
d'un
Dataset
Question-Réponse
arabe.
Les résultats d'évaluation ont montré que l’approche proposée permet de générer des
questions excellentes en termes de fluidité et grammaticalité et bonnes en pertinence.
Mots Clés : Génération automatique de questions ; Transformers ; Apprentissage profond ;
Modèle pré-entraîné.