Résumé:
Dans ce travail, nous proposons une extraction distribuées des itemsets
fréquents à partir de données évidentielles. La solution est basée sur le modèle
de programmation MapReduce afin de palier au problème de passage à
l’échelle inhérent au Big Data.
La démarche utilisée se repose sur le calcul du support évidentiel précis, ensuite
nous conservons que ceux qui sont fréquents (c’est-à-dire ceux qui ont
des fréquences d’apparition appelées supports précis dont les valeurs sont supérieures
ou égales à un seuil minimal fixé. L’algorithme proposé a été testé
sur des données synthétiques et a montré son efficacité.
MOTS-CLéS : Itemsets fréquents, Données imparfaites, Supports précis, Big data, Hadoop, MapReduce.