Résumé:
Avec l'accroissement des données sur internet et dans les entreprises, la quantité des documents devient très importante et difficile à gérer par les décideurs. D'où la nécessité d'outils d'aide à la décision pour l'analyse de ce type de données. Les méthodes et les outils qu'offrent les technologies d'entreposage et d'analyse en ligne de données sont efficaces uniquement pour l'analyse de données numériques. Dans le même contexte, l'agrégation de données numériques s'effectue à l'aide d'opérateurs d'agrégation classiques : somme, moyenne, max, min, etc. Or ces opérateurs ne sont pas adaptés pour l'agrégation de données texte. Le but de ce travail est de définir un opérateur d'agrégation adapté à la nature des données texte (non structurées). Cela, en s'inspirant des techniques issues de la fouille de données.
Mots-clés : Analyse en ligne, Entrepôt de données, Cube OLAP, agrégation de données textuelles, fouille de données.