dc.description.abstract |
Dans de nombreuses applications modernes (issues des domaines scientifiques, du transport, de Energie, de l’environnement, etc.), les données représentent une matière première et des produits à forte
valeur ajoutée pour la prise de décision. Les déluges des données générées par ces applications font que certains paradigmes classiques de traitement ne répondent plus, d’une manière complètement pertinente, à certaines situations de prise de décision. Ainsi, un regain d’intérêt (des chercheurs) pour certaines approches de traitement de données est observée. Récemment, l’approche utilisant le principe de réduction de données a suscité un réel engouement. Le principe de cette approche est
de réduire le volume de données en entrée du processus de traitement. Cette approche permet, notamment, de garantir une exploitation de données moins coûteuse (en termes de calcul et de temps) et d’obtenir des réponses approximatives ou juste certaines tendances des données. Ce qui est, particulièrement, désirable dans des contextes o`u une réponse approximative est plutôt souhaitable et apporte suffisamment d’informations pour être acceptable.
Il existe de nombreuses techniques de réduction du volume des données, dont les structures de résumé de données (ou synopsis) font partie. Dans le cadre de cette thèse, nous nous sommes intéressés à une famille de structures de résumé issues du domaine de l’intelligence computationnelle. Ces structures (comme les quantificateurs mathématiques non classiques, la typicité, les labels/motifs linguistiques, etc.) se distinguent par deux particularités: (i) l’intelligibilité des résumés construits et ; (ii) la génération
des résumés qui décrivent les données `a des niveaux d’abstraction différents. Les données cibles sont des données réelles provenant de multi-capteurs concernant (i) des vols d’aéronefs collectées dans le cadre du projet ADSB et (ii) des Smart Cities dans le contexte du projet neOCampus.
Dans la première contribution de la thèse, nous avons propos´e une méthode d’extraction de résumé de données en utilisant (i) les quantificateurs non classiques et (ii) la notion de typicité. Des mesures
pour caractériser les propriétés des résumés construits (véracité, représentativité, imprécision, etc.) sont également définies sachant que ces propriétés évoluent d’une manière contradictoire. Puis, nous avons analysé les différentes manières d’exploiter chacun des résumés à des fins de prise de décision.
Dans un second temps, nous nous sommes intéressés à l’étude de certaines caractéristiques des tendances des données (issues de capteurs ou de séries temporelles) comme le changement dynamique, la durée et la variabilité. Cette étude nous a permis de sélectionner le meilleur résumé parmi les résumés construits sur la base des quantificateurs non classiques. Cette sélection est formalisé sous forme d’un problème d’optimisation multi-objectif. L’approche de résolution proposée utilise un
algorithme génétique convenablement choisi. Enfin, une série d’expérimentations ont été menées, sur des données réelles, pour valider et comparer toutes nos propositions. |
fr_FR |