«

»

Déc 02

Histogramme : la confusion !

Si vous cherchez avec votre moteur de recherche favori des images d’ « histogramme », vous risquez fort de tomber sur tout et n’importe quoi, car personne ne sait vraiment très bien ce qu’est un histogramme ni surtout à quoi cet outil peut bien servir.

La définition française de Wikipédia fin 2013 est cependant assez claire sur le sujet : « un histogramme est un graphique permettant de représenter la répartition d’une variable continue », merci à Wikipédia.

Un histogramme est certes un graphique et c’est probablement de là que vient la confusion, car beaucoup de graphiques ressemblent à des histogrammes mais n’en sont pas. la spécificité tient aux deux autres termes fondamentaux : « répartition » et « variable continue ».

Commençons par le dernier terme : variable continue pour insister de manière un peu ferme sur le fait que pour les spécialiste, l’histogramme n’est utilisé que dans l’étude des variables continues. Et plus précisément qu’il a pour objectif d’aider à l’analyse de la répartition de ce type de variables.

La notion de répartition est une notion cependant ambiguë, car elle n’est pas immédiatement compréhensible pour le non spécialiste et qu’elle représente un concept légèrement différent pour le spécialiste (des probabilités). Nous dirons au risque de ne pas être mieux compris que l’histogramme est un outil graphique permettant d’étudier la distribution des valeurs d’une variable continue, c’est-à-dire la fréquence de ces différentes valeurs.

Notre définition se distingue de celle de Wikipédia en insistant sur le fait qu’il ne s’agit pas simplement de représenter mais surtout d’étudier. L’histogramme est en effet un outil de spécialiste et ne devrait pas être (trop souvent) utilisé dans la restitution des informations.

Un histogramme peut être obtenu à partir des données des tailles des joueurs de football africains.

histo

Il faut insister sur le fait que les barres de l’histogramme doivent être jointives pour représenter le caractère continu de la variable étudiée. On peut remarquer sur cet histogramme que les valeurs de la taille des footballeurs s’étalent de 1.55 m à 2.00 m environ avec une fréquence plus élevée de 1.70 m à 1.90 m environ. Une étude beaucoup plus fine de l’histogramme est fournie à une autre leçon, l’objectif étant ici de (bien) fixer les idées.

Par opposition nous présentons dans la suite, quelques graphiques qui sont incorrectement nommés histogrammes.

Document fourni sur le site d’une grande université française :

INSEESalaires2005HistFemmesCe diagramme en barres ne peut être un histogramme, contrairement à ce qui est indiqué sur le site sur lequel nous l’avons trouvé car la variable étudiée est une variable catégorielle (profession).

Document fourni sur le portail du gouvernement :

Histogramme_taux_de_chomageCe graphique n’est pas plus un histogramme car la variable en ordonnée n’est pas la fréquence de la variable en abscisse mais une autre variable : le taux de chômage. Il s’agit donc d’une série chronologique qui ne se représente habituellement pas avec ce type de graphique.

Il y a malheureusement beaucoup d’autres emplois erronés du mot histogramme dont certains sont, semble-t-il, dus au logiciel Excel qui utilise ce terme de manière tout à fait impropre pour n’importe quel  diagramme en barres.