Résumé:
Les bases de données de séquences incertaines sont largement utilisées pour modéliser des données horodatées inexactes ou imprécises dans de nombreuses applications réelles, où les algorithmes de l'extraction de motifs séquentiels traditionnels sont inapplicables en raison de l'incertitude des données et d'évolutivité.
Notre travail consiste à développer un algorithme d'extraction de motifs séquentiels fréquents à partir de données incertaines de masse. En effet, inspiré par le célèbre algorithme d'une méta-heuristique très connue, nous proposons un algorithme basé sur la méthode d'optimisation par essaims des abeilles (Bees Swarm Optimization BSO). En se basant aussi, sur le modèle de programmation MapReduce pour, notre algorithme procède d'une façon distribuée et parallèle pour qu'il soit adapté au contexte de Big Data.
Nous avons mené plusieurs expérimentations sur des ensembles de données incertaines synthétiques, et les résultats expérimentaux montrent que notre algorithme est efficace et évolutive
Mot clé: motifs séquentiels, données incertaines, Big data, BSO, hadoop, MapReduce.