Résumé:
L'analyse des données a prouvé son importance dans la découverte des connaissances, les prévisions et dans l'aide à la décision. À l'ère du Big Data, la question se pose souvent de savoir quelles sont les technologies et les architectures les mieux adaptées pour soutenir des processus analytiques à grande échelle. En raison de cette grande taille des données, il devient très difficile d'effectuer une analyse efficace en utilisant les techniques et les architectures traditionnelles. A cet effet, il ya eu, l'apparition des applications d'analyse de données ou Big Data Analytics Applications (BDA Apps) qui constitue un nouveau type d'applications logicielles qui analysent de grandes quantités de données à l'aide de Framework de traitement parallèle (par exemple, Hadoop). Ce travail s'insère dans une vision à long terme qui débute par une approche légère, qui consiste tout d'abord par le développement d'une application pour la prévision et l'analyse des départs, à partir de données de type Big data (structuré et semi structuré) exploitant de grande quantité de données et qui s'effectuera dans une Distribution Hadoop Cloudera(CDH)
L'objectif de ce travail consiste à concevoir une architecture Big data et l'implémenter, qui à partir des données collectées au sein de l'organisme d'accueil pour tout enregistrer sur un cluster de stockage. Ces données seront sauvegardées, prétraitées et analysées afin par la suite de créer des rapports et des tendances.
Mots clés: Applications d'analyse Big data, analyse, prevision, stockage, Hadoop, Distribution Hadoop Cloudera.