Résumé:
Tout le monde veut trouver les bonnes informations rapidement et efficacement maintenant qu'ils vivent à l'ère de l'information. Cependant, en raison de la quantité
massive de données déjà disponibles, la tâche est devenue de plus en plus difficile au fil
du temps ! En conséquence, les scientifiques ont conçu la technique de résumé multidocuments,
qui
utilise
des
innovations
récemment
développées
telles
que
l'apprentissage
automatique
et
les
réseaux
neuronaux.
Afin de mettre en évidence seulement les événements pertinents, le résumé
automatique de texte revêt une grande importance car il permet d’extraire
automatiquement les informations considérées comme essentielles pour former un
résumé automatique bref et informatif.
Les études précédentes se focalisent sur la génération d’un résumé automatique
mono-document. Dernièrement plus d’études ont commencé à se centraliser sur les
problèmes de construction d’un résumé automatique multi-documents à cause des
différentes contraintes et éléments qui s’imposent, tel que la redondance des mêmes
phrases et paragraphe dans différents documents.
Dans notre travail, nous proposons une solution qui consiste à développer une
application pour la génération de résumé automatique multi-documents basés sur
l’apprentissage profond en utilisant différentes variantes d’architectures neuronales à
base de Transformers appelé Pegasus et BART. Nous avons construit et mis au point un
modèle de Pegasus. En utilisant des algorithmes de clustering, nous avons prétraité nos
ensembles de données et obtenu des résultats pertinents. L’évaluation a été faite
automatiquement en utilisant les scores ROUGE (est une mesure d’evaluation utilisée pour
évaluer les résumés).
Mots clés : Résumé automatique, Multi-documents, Apprentissage profond, Abstractif, Transformers, Pegasus, BART, ROUGE (ROUGE-N, ROUGE-L).