Résumé:
L’évolution des technologies numériques a transformé le monde avec de
nouveaux moyens de communications tels que les réseaux sociaux. Les plateformes
des réseaux sociaux reposent sur des données textuelles produites et consommées par
les utilisateurs et l’analyse de ces données est dantesque par des moyens traditionnels
qui ne peuvent s’adapter au volume grandissant et à la variété. Les nouvelles
innovations telles que l'apprentissage automatique sont conçues pour aider en
transformant des données textuelles en information et profit. L’analyse des
sentiments est l’une de ces applications les plus intéressantes notamment quand il
s’agit de l’extraction et analyse des opinions des utilisateurs.
Notre ressource de donnée dans ce travail est Twitter, l’objectif principal est de
définir et de mettre en œuvre des moyens pour l’analyse des sentiments de données
textuelles, nous avons choisi pour cette tâche un dataset lié au Covid19. Notre travail
est basé sur des techniques de traitement automatique du langage et des techniques
d’apprentissage automatique comme : SVM,Random Forest,Logistic Regression,
XGBoost. Les tests effectués ont montré que la combinaison Random Forest avec la
représentation Bag of words a donné les meilleurs résultats avec un F1-score de 79%.
A partir de là, nous avons réalisé une application web qui implémente cette
combinaison pour atteindre nos objectifs initiaux.
Mots clés : Analyse des Sentiments, Analyse d’Opinion, Apprentissage automatique.