Résumé:
Dans ce projet, nous proposons une méthode de segmentation d’images de document
latin imprimé basée sur une approche ascendante ‘‘ Bottom-Up’’. Cette analyse est
appliquée à des images de document papier de format A4 scanné sous 300 dpi. Ces
documents sont de différents types tels que; les articles scientifiques, les revues et les séries
d'exercices.
Cette méthode consiste à répartir l'image numérique du document en différents
blocs cohérents en passant par deux étapes de segmentations, notamment, la segmentation en
ligne et la segmentation en blocs. Ces deux segmentations nécessitent l'estimation de
l'espace inter caractères et l'espace interligne.