Quartiles et médiane : pourquoi ma calculatrice se trompe ?

Le recours à la calculatrice pour calculer la médiane et les quartiles peut dérouter plus d'un élève car la machine ne rend pas toujours les bons résultats. Explications.

Dans certaines circonstances, il est plus sage d'effectuer un calcul sans calculatrice. (Photo : DR)

C'est une étrangeté à laquelle nombre d'enseignants sont confrontés lorsqu'ils abordent le chapitre des statistiques. Quand les élèves calculent les quartiles d'un ensemble de valeurs pair avec leur calculatrice, celle-ci ne leur rend jamais les bons résultats. Pour mieux comprendre les origines de ce problème, il convient de revenir brièvement sur les notions de médiane et de quartile. La médiane, c'est cette valeur qui permet de séparer en deux blocs égaux un ensemble de valeurs de valeurs données : on retrouvera ainsi dans le premier bloc la moitié des valeurs qui sont toutes inférieures ou égales à la médiane, et dans le second l'autre moitié des valeurs qui lui sont toutes supérieures ou égales. Si la série comprend un nombre de valeurs impair, aucun problème : c'est la valeur centrale qui permettra de couper l'ensemble en deux. Dans cet exemple, la médiane est donc 16 :
Toutefois, si la série comprend un nombre de valeurs pair, la médiane n'apparaît pas clairement. Il faut alors calculer la demi-somme des deux valeurs qui encadrent la médiane. Dans l'exemple, la médiane est donc (16 + 21) / 2 = 18,5.
La notion de quartile repose sur la même logique que la médiane, sauf qu'il ne s'agit plus ici de diviser l'ensemble en deux blocs égaux, mais en deux blocs représentant 25% et 75%. Dans l'exemple, le premier quartile est donc (5+11) / 2 = 8. Le second quartile est (26+28) / 2 = 27.
Les élèves qui entreraient cette série statistique dans leur calculatrice pour connaître les quartiles obtiendraient donc comme résultats Q1 = 8 et Q3 = 27. “Pratique”, pourrait-on s'exclamer. Sauf qu'à l'aune du programme scolaire, ces résultats sont faux… En effet, les standards français divergent des standards internationaux lorsqu'il s'agit du calcul des quartiles. « Le 1er quartile est la plus petite valeur de la série telle qu'au moins 25% des valeurs soient inférieures, peut-on lire dans le programme scolaire de Troisième. Le 3ème quartile est la plus petite valeur de la série telle qu'au moins 75% des valeurs soient inférieures. » En d'autres termes, le programme scolaire impose que les 1er et 3ème quartiles appartiennent à la série statistique qu'ils doivent séquencer. Dans l'exemple, les bons résultats sont donc Q1 = 5 et Q3 = 26.
Ce choix du Conseil national des programmes ressemble beaucoup à une aberration puisqu'il donne une définition différente entre les quartiles et la médiane – cette dernière n'étant, au fond, rien d'autre que le 2ème quartile… Quant à savoir pourquoi les calculatrices ne parviennent pas à fournir les bons résultats, l'explication est très simple. Les trois grands constructeurs de calculatrices (Texas Instrument, Casio et Hewlett-Packard) qui produisent les machines avec lesquelles travaillent les élèves français sont des sociétés américaines. Et les programmes de ces machines sont essentiellement élaborés selon les standards internationaux, faisant ainsi fi de cette exception française. 

Reste à savoir pourquoi ces deux standards coexistent, et lequel est le plus proche de la réalité. Autant le dire d'emblée, les deux manières d'identifier la médiane sont correctes. Pour comprendre ce qu'est la médiane, il convient de prendre un petit peu de recul, et de s'intéresser d'abord à la moyenne. La moyenne, c'est le nombre qui permet d'évoquer une série de valeurs le plus simplement possible. Par exemple, dans une classe de 30 élèves, il est est difficile de dire si la classe a réussi le devoir en observant une à une les 30 notes. En revanche, si la moyenne est de 10, on peut dire que la classe a plutôt raté ce devoir ; si la moyenne est de 15, alors le devoir a été réussi par les élèves.

Prenons l'exemple d'une série de 4 notes : 8 ; 10 ; 12 ; 14. La définition classique qu'on voit en cours est celle-ci :

moyenne = (8 + 10 + 12 + 14) / 4 = 11

Mais il existe un autre moyen de la calculer, plus général, qui permet mieux de comprendre ce qu'est la médiane. Cette autre définition est :

moyenne = minimum* de (x - 8)² + (x - 10)² + (x - 12)² + (x - 14)² = 11


Certes, c'est plus difficile et plus long à calculer, mais le résultat final est identique. En effet, (x - y)² est bel et bien une façon de calculer la distance entre deux points x et y. C'est la distance la plus classique en mathématiques. C'est celle qui, grâce au théorème de Pythagore, permet de calculer la distance entre 2 points d'un plan.

Et la médiane dans tout ça ? Eh bien, elle répond exactement à la même logique : on peut elle aussi l'écrire d'une autre manière :

médiane = le minimum de |x - 8|  + |x - 10|  + |x - 12| + |x - 14|
où |x| est la valeur absolue** du nombre x

On voit bien que cette autre définition ressemble très fortement à celle de la moyenne. Et cela veut dire que |x - y| est aussi une façon de calculer la distance entre x et y. C'est celle qu'on utilise plus naturellement pour déterminer la distance entre deux nombres.

Mais alors qu'est-ce qui pose problème avec la médiane ? En fait, avec notre définition de la médiane, il n'y pas qu'un seul minimum. Avec notre exemple :

médiane = le minimum de |x - 8| + |x - 10| + |x - 12| + |x - 14|

Si on prend x = 11, on trouve :

|11 - 8|  + |11 - 10|  + |11 - 12|  + |11 - 14|
= |3| + |1| + |-1| + |-3|
= 3  + 1 + 1 + 3
= 8.

Si on prend x = 10, on trouve :

|10 - 8| + |10 - 10| + |10 - 12| + |10 - 14|
= |2| + |0| + |-2| + |-4|
= 2 + 0 + 2 + 4
= 8.


En fait, n'importe quelle valeur entre 10 et 12 fonctionnerait et serait le minimum de la valeur proposée. La raison est simple : la médiane n'est pas unique. C'est là que se niche le cœur du problème. Il n'y pas de raison de choisir 10 plutôt que 11 ou 12. Malgré tout, il faut bien adopter une définition. Les anglo-saxons ont choisi la leur tandis qu'en France, c'est une autre définition qui a été retenue. Pour autant, elles sont toutes aussi valables l'une que l'autre. CQFD.


* on cherche x tel que (x - 8)² + (x - 10)² + (x - 12)² + (x - 14)² soit le plus petit possible
** c'est ce nombre si x est positif, et c'est l'opposé du nombre si x est négatif.
     Exemple : |-2| = 2, et |2| = 2.

Commentaires