Résumé:
La reconnaissance automatique du locuteur, ou biométrie vocale, est un domaine en pleine évolution
grâce aux avancées de l’interaction homme-machine. Dans ce travail, nous explorons une approche
d’identification du locuteur basée sur l’apprentissage profond à partir de la voix. Les coefficients
cepstraux en fréquences de Mel (MFCC) sont utilisés pour représenter les caractéristiques
acoustiques. Nous exploitons les réseaux de neurones récurrents (RNN), et leurs variantes LSTM et
GRU, adaptés au traitement des séquences temporelles. Ces architectures permettent de mieux
modéliser la dynamique vocale. Enfin, nous comparons l eurs performances pour identifier les
systèmes les plus efficaces