Résumé:
Ce projet a été proposé dans le cadre d’une collaboration entre le Centre de Développement
des Technologies Avancées (CDTA) et le Centre National de Recherche et de
Développement de la Pêche et de l’Aquaculture (CNRDPA). Disposant d’une base de
données relationnelle contenant des informations sur l’aquaculture marine, le CNRDPA
souhaite intégrer ses données sur l’aquaculture continentale en Algérie. Cependant, les
différences structurelles entre les deux types d’activités ne permettent pas sa réalisation.
Ils souhaitent également introduire des données hétérogènes (Excel, Word, PDF, etc.)
provenant de différentes sources à l’échelle nationale (14 DPA (Directions de la Pêche et
de l’Aquaculture) parmi lesquelles figure le CNRDPA).
Comme réponse à cette problématique, une approche basée sur un Data Lake a été
proposée. Une architecture fonctionnelle ainsi qu’une architecture technique a été conçue
pour répondre à leurs besoins. Notre approche comprend un nouveau schéma d’ingestion,
un processus d’ingestion en temps réel, une modélisation orientée objet des données brutes
et leur migration vers un modèle orienté document. Un processus de capture et de transformation
des données a également été développé, ainsi qu’une solution de visualisation
et de restitution des données. Autrement dit, tout un système d’aide à la décision basé
sur un Data Lake pour l’exploitation et l’analyse des données brutes et hétérogènes.
Mots Clés : Lac de données, Système d’Aide à la Décision, Aquaculture.