Résumé:
Plusieurs études dans la littérature ont montré que les mots dont les gens utilisent sont
indicatifs de leurs états psychologiques. En particulier, des spécialistes en psychologie ont
constaté que la dépression était associée à des modèles linguistiques distinctifs. La dépression
est une maladie grave qui déstabilise l’organisme humain, elle peut conduire jusqu’au suicide.
Une estimation précoce de la dépression peut aider à réduire et atténuer les risques sanitaires
associés. Les réseaux sociaux comme Twitter, Reddit, Facebook, attirent les gens à faire part
de leurs expériences et leurs opinions. Ces plateformes peuvent fournir des données massives,
réelles et disponibles. Notre étude est orientée vers l’estimation du niveau de dépression à
partir des publications Reddit en essayant de réponde sur le questionnaire de l’Inventaire de
dépression de Beck (BDI). Nous avons développé trois modèles différents (CNN, Bi-LSTM et la
combinaison des deux) issus de l’apprentissage profond avec des techniques statistiques
infaillibles pour estimer la sévérité de la dépression. Nos résultats concluons ont été évalué à
la fin de ce mémoire.
Mots clé : Sévérité de dépression, Reddit, l’Inventaire de dépression de Beck, apprentissage
profond, CNN, biLSTM, traitement du langage naturel.