Résumé:
Ce mémoire propose une exploration approfondie des solutions de classification
de documents pour le stockage basé sur le cloud, en utilisant des modèles affinés
pour la classification zero-shot et la classification de textes. Sur la base de
l'architecture du Transformers, les encoder de Transformers et les architectures
encodeur-décodeur sont utilisés pour améliorer les techniques de classification. À la
lumière des limites existantes des méthodes actuelles de classification des
documents, cette recherche s'efforce de faire progresser le développement de
techniques plus efficaces et efficientes, en particulier dans le contexte des
mégadonnées. L'enquête se concentre sur la résolution des problèmes liés aux
étiquettes dynamiques lors de la classification, la gestion de documents volumineux
et la réalisation d'une classification précise des documents structurés. De plus, cette
recherche apporte de précieuses contributions au domaine de la classification des
documents en générant des collections des données qui peuvent servir de ressources
inestimables pour de futurs projets. Ces ressources facilitent l'évaluation et la
comparaison de diverses techniques, favorisant davantage les progrès dans le
domaine.
Mots-clés : Classification de documents, Classification des textes, Classification Zero-shot, Transformers, Collection de documents d'entreprise.