Résumé:
Ce travail de fin d’étude porte sur la reconnaissance automatique du locuteur à l’aide des réseaux de
neurones récurrents (RNN) combinés aux coefficients cepstraux Gammatone (GTCC) pour l’extraction
des caractéristiques audio. L’objectif est de développer un système capable d’identifier efficacement un
individu à partir de sa voix, en exploitant les capacités de modélisation temporelle des RNN. Le modèle
a été entraîné et évalué sur un corpus vocal prétraité avec les GTCC, montrant des performances
prometteuses en termes de classification des locuteurs. Cette approche ouvre la voie à des applications
dans la sécurité biométrique, la personnalisation vocale et les systèmes intelligents.