Résumé:
La forte augmentation des textes au format numérique met en évidence la nécessité de concevoir
et de développer des outils de résumé efficaces pour localiser et extraire les informations
pertinentes sous forme abrégée. Le résumé de texte dans le traitement du langage naturel est principalement
traité par les méthodes d'extraction, qui consistent à sélectionner une partie du document
original pour capturer l'idée principale du sujet. Contrairement à la méthode d'extraction, la méthode
d'abstraction cela dépend de l'étude du sujet et de la formulation d'un résumé pour celui-ci .
Dans notre travail, nous appliquons le type d’extraction.
Dans notre travail, nous avons utilisé Word2Vec qu’est un ensemble de modèles d'intégration
lexicale
de
type
Word
Embedding.
Word2Vec
convertit
le
mot
en
un
vecteur,
dans
notre
cas
un
vecteur
de
50
segments,
ces
segments
sont
des
dérivés
du
mot.
Nous
avons
également
utilisé
Autoencoder
et Multi-layer perceptron ensuite BLEU score pour l’aprent issage. Nous appliquons notre
modèle sur l’ensemble de données Amazon Food_Reviews, et nous utilisons des métriques standard
(telles que ROUGE) pour évaluer les paragraphes reconstruits.
● L'objectif de cette étude est d’Améliorer le résumé automatique extractif du texte à l'aide des
nouvelles méthodologies.
Mots-clés: Résumé automatique, Extractive, Word Embidding, Word2Vec, Auto-Encoder, Multilayer
perceptron,
BLEU
score,
Amazon
Food_Reviews.