Résumé:
Ce projet vise à intégrer un module de reconnaissance de six commandes
vocales en Dialecte Algérien (DA) à une plateforme existante de gestion des parcs de
stationnement. Nous utilisons un modèle réseau de neurones (CNN) préentraîné sur la
mini Speech Commands dataset et affiné (Fine-tuning) sur une base de données de
6000 fichiers audio. Cette base de données est en DA et a été enregistrée par un seul
locuteur féminin. Nous proposons d'affiner le modèle initial et d'utiliser des techniques
d'augmentation de données pour créer un modèle spécifique à d'autres locuteurs
(agents) à partir de peu de données vocales. Notre méthode a atteint un taux de
reconnaissance de 99.22%. En outre, nous proposons d'améliorer le module matériel
de communication avec les équipements du parking, tels que la barrière et l'alarme, en
proposant une connexion sans fil basée sur le circuit ESP32.