Résumé:
Les dialectes sont un sujet qui intéresse plusieurs disciplines comme la
linguistique, la phonétique, et même l’informatique, pour leurs
caractéristiques qui ne se conforment pas toujours aux règles linguistiques.
L’Algérie offre un cas d’étude assez intéressant avec sa richesse
linguistique.
Le but de cette étude était de proposer une approche phonétique pour
l’identification automatique des dialectes, basée sur les caractéristiques
acoustiques et spectrales en utilisant des séquences d’audios récoltées à
partir de YouTube.
Nous avons exploré deux méthodes : la première était l’extraction des
paramètres acoustiques et la deuxième a consisté en la classification des
spectrogrammes. Les expériences ont été menées sur 23 dialectes algériens
en utilisant des modèles d’apprentissage automatique, profond et par
transfert.
Nous avons obtenu des résultats de 90% d’identifications correctes avec les
fichiers de 20s. Ces résultats peuvent être améliorés en utilisant d’autres
modèles d’apprentissage automatique, profond ou une approche prosodique
qui aura de meilleure performance.
Mots Clés : Identification, acoustique, spectrogramme, apprentissage
automatique, apprentissage profond.