Résumé:
L’extraction de motifs est une technique des techniques importante dans le domaine de la
fouille de données. Elle a de nombreuses applications telles que l’analyse du comportement des
consommateurs, bio-informatique, sécurité, etc.
Il existe de nombreux algorithmes permettant l’extraction des motifs. Ces algorithmes
présentent plusieurs problèmes tels que la pertinence des motifs extraits. En effet, dans ce travail,
nous utilisant la technique de word2vec pour l'extraction de motifs à partir de données
réelles.Afin d’évaluer de trouver les motifs nous avons utilisé les mesures de similarité cosinus et
la distance euclidienne. Le premier algorithme se base sur skip gram, le deuxième se base sur le
principe de négative sampling et le troisième utilise une fonction de probabilité jointe afin de
trouver les motifs de toutes les tailles.
Mots-clés : word2vec, extraction des motifs, motifs fréquents, skip gram, négative
sampling, wordembeddings.