Résumé:
Aujourd’hui les réseaux sociaux représentent un moyen de communication
indispensable, ils permettent la diffusion des différentes informations et nouvelles
dans le monde dans différentes langues.
L’objectif de notre travail est l’analyse des publications sur les réseaux sociaux en
utilisant des techniques de classification de données textuelle selon deux classes :
statuts violents et statuts non violents et cela dans le but de détecter les statuts
violents, de propos raciste et menaçants.
Afin d’atteindre notre objectif, nous proposons deux combinaisons entre les
algorithmes d’apprentissage profond CNN-LSTM et CNN-BILSTM. Ainsi, Pour
régler le problème de déséquilibrage du dataset, nous utilisons une technique de
sur-échantillonnage « Oversampling » dite SMOTE. Une étude expérimentale est
effectuée. Les résultats obtenus montrent l’intérêt des combinaisons proposées.
Mots clé : Apprentissage profond, Classification supervisée, Réseaux sociaux,
Réseaux de neurones, BiLstm, Détection de langage agressive, Corpus
déséquilibré, Oversampling.