Résumé:
De nos jours, un grand nombre d'applications nécessitent une phase d'authentification de l'utilisateur. Cette authentification peut être réalisée au moyen d'une carte à puce et d'un code confidentiel (retrait à un guichet automatique), au travers d'empreintes digitales (accès sécurisé à des locaux) ou d'empreintes génétiques (domaine juridique) ou encore grâce à la voix (serrure vocale). Dès lors qu'une application est accessible à distance (par le réseau téléphonique par exemple), la voix reste le seul élément disponible pour authentifier une personne. Cette thèse s'inscrit dans le cadre de la Reconnaissance Automatique du Locuteur RAL.
La reconnaissance du locuteur a connu ces dernières années une avancée significative avec un nouveau concept de représentation de l'énoncé de voix, désigné sous le terme de i-vector (Vecteur d'Identité). Ce type de représentation présente la particularité de se réduire numériquement à un vecteur de dimension faible, au regard
des représentations précédentes, et pourtant très discriminant vis à vis du locuteur. Les travaux présentés dans ce mémoire s'inscrivent dans ce nouveau contexte.
Nous avons réalisé une plateforme logicielle de reconnaissance du locuteur englobant deux approches à savoir GMM-UBM (Gaussian Mixture Model/ Universal Background Model) et I-vector. Nous avons effectué une étude sur l'effet de variations des canaux de transmission sur les performances du système de vérification du locuteur en utilisant un corpus d'un dialecte algérien de 39 locuteurs. Les résultats trouvés ont montré que l'approche l-vecteur est plus robuste par rapport au GMM-UBM.
Mots-clés : Biométrie, GMM-UBM, I-Vecteur, Reconnaissance Automatique du Locuteur, Identification automatique de locuteur(IAL), vérification automatique de locuteur (VAL), multisession.