Résumé:
Dans l'ère du Big Data, l'extraction d'itemsets fréquents devient un défi crucial en raison
de la taille énorme des ensembles de données et du nombre gigantesque des attributs
nécessaire à la représentation des objets dans plusieurs domaines. Les approches
traditionnelles, y compris les versions parallèles et distribuées des algorithmes classiques,
restent souvent inefficaces, ce qui met en lumière la nécessité d'approches alternatives plus
efficaces.
On propose dans ce travail une méthode basée sur l'Optimisation du Loup Gris (Grey
Wolf Optimization, GWO) pour l'extraction d'itemsets fréquents à partir de grandes bases de
données. En exploitant la hiérarchie et le comportement social des loups gris, nous
développons une version distribuée et parallèle de GWO, capable de gérer efficacement des
volumes de données massifs. Notre approche est adaptée aux paradigmes du Big Data, offrant
une solution prometteuse à la problématique de l'extraction d'itemsets à grande échelle.
L'approche proposée a été capable d'obtenir des résultats satisfaisants en termes de
qualité de motifs extraits, tout en maintenant un temps d'exécution acceptable, ce qui en fait
une solution prometteuse pour l'extraction de motifs dans un contexte du big data.
Mots clés : Extraction d’Itemsets Fréquents, Big Data, Parallèle et distribuée, GWO, Spark.