Veuillez utiliser cette adresse pour citer ce document :
https://di.univ-blida.dz/jspui/handle/123456789/6594
Titre: | Reconnaissance des formes phonémiques en Arabe |
Auteur(s): | Ferrouga, Mohamed |
Mots-clés: | Reconnaissance De Formes Traitement automatique de la parole Arabe Standard Visème |
Date de publication: | 2010 |
Editeur: | البليدة1 |
Résumé: | La reconnaissance audiovisuelle de la parole fait l’objet de plusieurs travaux de recherche, cependant peu de recherches ont été faites pour la langue Arabe. De ce fait, nous avons opté pour réaliser un système de reconnaissance audiovisuelle de 12 phonèmes en Arabe Standard (AS) constituant un corpus audio de 2160 échantillons à 11025 Hz. La segmentation a été faite manuellement. Le travail est divisé en trois grandes parties, la reconnaissance: acoustique où les paramètres acoustiques MFCC ont été extraits. Les Réseaux de Neurones Artificiels à délai et multicouches ou Time Delay Neural Network et Multi Layer Perceptron (TDNN-MLP) ont été utilisés pour la reconnaissance; visuelle où nous avons d’abord défini les visèmes de l’AS. Cette partie est aussi faite par les RNA de type MLP et Auto associateur, et ceci sur un corpus de 4853 échantillons de visèmes arabes; audiovisuelle où nous avons fait appel à une technique d’intégration précoce dite intégration directe au niveau des paramètres acoustiques et visuels. La reconnaissanceaudiovisuelle est basée sur les RNA de type TDNN-MLP. Le taux de reconnaissance pour l’acoustique seul est de 76,69% d’un corpus de 2076 échantillons. Pour la reconnaissance visuelle, le taux de reconnaissance est de 84,98% et 84,69% pour MLP et Auto associateur respectivement. Quant au taux pour la reconnaissance audiovisuelle est de 85,83%. |
Description: | Bibliogr. ill. 4 cd-rom. 99 p. |
URI/URL: | http://di.univ-blida.dz:8080/jspui/handle/123456789/6594 |
Collection(s) : | Thèse de Magister |
Fichier(s) constituant ce document :
Fichier | Description | Taille | Format | |
---|---|---|---|---|
32-530-397-1.pdf | Thèse de Magister | 7,14 MB | Adobe PDF | Voir/Ouvrir |
Tous les documents dans DSpace sont protégés par copyright, avec tous droits réservés.