Résumé:
Plusieurs travaux et études se sont intéressés à la détection automatique d’opinions dans
les textes en utilisant différentes techniques et méthodes. La majorité des travaux actuels dans
la détection d’opinions utilisant l’apprentissage profond traitent des langues indo-européennes
et en particulier la langue anglaise. Il serait donc intéressant de développer un modèle de
détection d’opinions dans des textes en langue arabe.
De ce fait, nous avons proposé dans ce travail d’explorer quelques algorithmes
d’apprentissage profond comme les réseaux de neurones convolutifs (CNNs) et les réseaux de
neurones récurrents (RNNs) pour la détection d’opinions dans des textes en langue arabe. Nous
avons examiné l'impact de l’utilisation de stemming sur les données d’entrer, et l’impact
d’utiliser différentes techniques de représentation des mots tels que le Tf idf,Bag of
words,Aravec et AraBERT sur la performance des modèles. On a également réalisé plusieurs
expérimentations sur plusieurs autre dataset. Une analyse comparative a été effectuée sur les
résultats obtenus. Finalement ces résultats indiquent que le modèle CNN nous donne une
meilleure exactitude avec 95.32% sur le dataset HARD, De plus, nous avons constaté que la
technique de representation des données AraBERT ne necissite pas une étape de stemming et
qu’elle donne les meilleures performances comparant avec les autres techniques de
representations sur tous les ensembles de données de test.
Mots clés : Détection d’opinions, analyse des sentiments, langue arabe, apprentissage profond,
représentation des documents textuel.