Résumé:
Les documents électroniques sont souples en matière de stockage et de recherche d’information, pour cela il est nécessaire de passer du format papier vers un format électronique, cette conversion est souvent réalisée par un système d’analyse de documents. Ce dernier est composé de plusieurs parties : la numérisation, le prétraitement (élimination du bruit, la détection et la correction de l’inclinaison,…), l’analyse de la structure physique Notre travail consiste à détecter l’inclinaison en utilisant la transformée de Hough, et à analyser la structure physique en utilisant la transformée en ondelettes qui se base sur la texture particulière du texte, ainsi que sur l’utilisation de l’analyse multi-échelle, pour rendre compte de l’information statique. Nous affinons notre travail avec un post traitement afin d’améliorer le résultat de la segmentation. (segmentation et classification) et l’analyse de la structure logique.