Résumé:
La reconnaissance de l'écriture a pris un grand intérêt de la part des chercheurs, mais malgré cela, la réalisation d'une machine capable de convertir des documents du format papier vers un format électronique reste encore un problème ouvert.
Avant de reconnaître les caractères, il faut d'abord les isoler. Pour les caractères imprimés latins, cette tâche est plutôt facile, puisqu'ils sont déjà séparés par des vides pour la plupart des polices. Ce n'est pas le cas en ce qui concerne les caractères arabes imprimés qui sont eux collés les uns aux autres et ont des formes cursives. La segmentation sert d'abord à isoler les lignes puis les lignes en mots, et ensuite les mots en caractères isolés avant d'être
reconnus.
L'objectif de notre travail est de concevoir un système de segmentation des mots arabes imprimés quelque soit leur forme. Le système développé s'articule autour de deux modules distincts, un module de prétraitement, un module de segmentation.
Mots clés: OCR, reconnaissance optique des caractères, mot arabe imprimé, histogrammes, segmentation.