«

»

Déc 08

Analyse exploratoire des données

Démarche et ensemble des méthodes et outils visant à étudier et à interpréter la variabilité de
variables appréhendées par des données.

On y distingue :

  1. la conception de l’analyse,
  2. le traitement proprement dit,
  3. l’interprétation des résultats.

1 Conception

La conception est une étape méthodologique qui repose sur une bonne connaissance :

  • des variables à étudier,
  • des méthodes et des outils d’analyse.

La connaissance des variables s’entend d’un point de vue pratique, elle exige une expérience du domaine concerné. La conception des traitements peut (doit ?) donc être menée avec le spécialiste. Elle exige cependant une connaissance de toute la panoplie de méthodes et d’outils de plus en plus large et qui est à la base de la compétence même attendue du daticien.

2 Traitement

Le traitement est une étape assez technique le plus souvent réalisée avec un logiciel. Il demande donc peu de compétences méthodologiques mais beaucoup plus des compétences informatiques en terme d’utilisation du logiciel. C’est un travail qui peut-être sous-traité à un « technicien ». Tous les traitements préconisés doivent être réalisés et il faut, au XXIème siècle ne pas tomber dans l’argumentaire historique : « le logiciel utilisé ne permet pas ce type d’analyse ». En d’autres termes, la conception prime sur le traitement.

3 Interprétation

L’interprétation est une phase assez délicate de l’analyse exploratoire car elle dépend beaucoup de l’expérience et du savoir faire. Il convient d’être assez ambitieux sur l’interprétation et de ne pas rester trop descriptif quant à la variabilité étudié. Le minimum que l’on puisse exiger est une vision générative des données, c’est-à-dire des propositions précises concernant les mécanismes (biologiques, économiques,…) sous-jacents au phénomène étudié. D’un point de vue théorique, ceci est souvent équivalent à proposer un modèle probabiliste susceptible de rendre compte d ela variabilité observée.