Premier billet sur une série de 2 sur les erreurs en représentation graphique de données
Il existe une série d’erreurs en visualisation de données à ne pas commettre au risque d’induire en erreur le lecteur et par la même engendrer de mauvaises décisions. Il est par conséquent important d’avoir connaissance de ces erreurs pour éviter de les reproduire.
1ère erreur : Présenter différemment plusieurs éléments sans existence de différences réelles dans les données
S’il existe une différence visuelle dans la représentation d’éléments, le lecteur va traduire cette différence comme une différence de sens.
Un changement dans la couleur, le format, la forme ou la taille est interprété comme une différence d’état des éléments. Il ne faut par conséquent pas inclure des différences visuelles dans un graphique qui ne correspondent pas à des différences réelles dans les données.
| Graphique erroné | Graphique correct |
![]() | ![]() |
2ème erreur : Ne pas faire débuter l’échelle à 0 pour des histogrammes
Le lecteur perçoit les différences dans les longueurs des barres ou les positions dans l’espace des objets de manière assez précise.
Il les interprète comme des différences dans les valeurs réelles qu'ils représentent. La hauteur d’un histogramme vertical est immédiatement interprétée comme la représentation de la valeur totale de l’élément mesuré.
Pour comprendre qu’il ne s’agit pas de la représentation de la valeur totale, il faut se rendre compte que l’abscisse des ordonnées ne débute pas à 0. Or, peu de personnes font attention à l'échelle, cela signifie que beaucoup de lecteurs peuvent être induits en erreur. Ils vont effectuer des interprétations sur la base de la comparaison de la taille des barres, taille qui seront pas représentatives de la valeur totale des éléments.
Les différences dans les propriétés visuelles qui représentent des valeurs (différences dans leur longueur ou position dans l’espace) doivent absolument correspondre de manière précise aux réelles différences dans les valeurs qu'ils représentent.
| Graphique erroné | Graphique correct |
![]() | ![]() |
3ème erreur : Afficher des liens entre des variables indépendantes
Une liaison entre deux variables va être interprétée comme une preuve de leur appartenance à un même ensemble.
En reliant deux variables discrètes c’est-à-dire indépendantes, le graphique perturbe l’interprétation du graphique. Le lecteur s’interroge sur l’existence de cette liaison et en quoi elle consiste. Il ne faut par conséquent pas connecter visuellement des valeurs qui sont discrètes car cela suggère une relation qui n'existe pas dans les données.
| Graphique erroné | Graphique correct |
![]() | ![]() |











Commentaires
Donc pour des histogrammes doit-on ou non débuter l'échelle par 0?
Cordialement, Citer
Vous devez bien faire débuter les histogrammes à 0.
L'erreur est de les faire débuter par une autre valeur, ce qui fausse le sens des proportions. Citer