Prendre en compte le hasard (et mobiliser les outils statistiques appropriés)

Le hasard est un concept assez difficile à définir car il recouvre plusieurs acceptions. Mais nous en avons tous fait l’expérience : quand on lance un dé, par exemple, et qu’on ne peut pas annoncer à l’avance le résultat qu’on obtiendra ; ou bien, encore, lorsqu’il nous arrive de rencontrer inopinément un ami à l’autre bout du pays. Parfois, nous sommes troublés par une étonnante série d’événements (ex. : deux joueurs de votre équipe préférée qui se blessent en même temps), une coïncidence qui nous perturbe (ex. : on apprend que la veille d’un événement grave, telle personne était présente sur les lieux…).

Faites-le vous-même

On a lancé 20 fois deux pièces de monnaie et on a noté F les fois où on a obtenu le résultat « face », et P les fois où on a obtenu le résultat « pile ».

  • Pièce 1 : PPPPFPFFFFFFPPPFPPPF
  • Pièce 2 : FPFFPPFPPFPFFPFPFFPP

Laquelle de ces deux séries vous semble le plus résulter d’un phénomène aléatoire ? Laquelle vous paraît au contraire plus anormale pour un lancer de pièces supposées non truquées ?

Débriefing

Nous avons une attente de ce qu’est le hasard et de ses effets : dans notre esprit, le hasard est supposé créer des structures banales, quelconques, avec des événements répartis de manière homogène. En réalité, il est tout aussi probable d’obtenir une suite de cinq « pile » consécutifs (PPPPP) qu’une série qui nous semble plus banale comme PFPFF. Aussi, les deux pièces ont présenté une suite tout à fait possible pour des pièces non truquées, qui donnent des tirages aléatoires.

Toute la difficulté, lorsque nous détectons (ou croyons détecter) des régularités, consiste à se poser la question suivante : « Cela pourrait-il être le simple fait du hasard ? »

Oublier que le simple hasard peut provoquer des « séries » ou des « coïncidences » qui nous paraissent étranges nous pousse à chercher des explications à un phénomène qui n’existe tout simplement pas.

Ce que font les scientifiques

Les scientifiques ont recours à des outils statistiques pour tester l’hypothèse selon laquelle ce qu’ils observent relève ou non du hasard. Tout comme la description des objets basée sur des critères objectifs et des mesures garantit une interprétation plus fiable, la description d’un ensemble d’observations sera plus solide si on utilise des outils qui la rendent plus objective. Dans la boîte à outils du scientifique, nous retrouverons ainsi la moyenne, le mode, la médiane, l’écart-type, les quartiles…

Ces techniques et méthodes encadrent le processus de collecte des données et de leur analyse, et préparent la phase d’interprétation. Attention, cependant : cette dernière repose sur une expertise complémentaire, liée aux connaissances du domaine en question que le scientifique possède. Les statistiques sont indispensables, mais pas suffisantes pour donner du sens aux phénomènes que l’on observe.

Une histoire de science

Regardez cette image

Feller, 1957

Que voyez-vous ? Sachez qu’il s’agit d’impacts de bombes ayant frappé Londres au cours du grand Blitz allemand de 1940, alors que la Seconde Guerre mondiale faisait rage. Il est tentant de noter, comme les londoniens de l’époque, que les bombes sont dirigées vers les zones les plus habitées, aux abords de la Tamise. La technologie ne permettait pourtant pas une telle précision en ce temps-là. Mais comment résister à cette intuition devant une telle évidence ? À l’époque, l’intelligence britannique se demandait, par exemple, si des espions allemands n’avaient pas habité les zones moins touchées… Dans la période d’après-guerre, le mathématicien William Feller étudie les données d’impacts des bombes et arrive à la conclusion que la distribution des attaques de 1940 est parfaitement compatible avec une répartition aléatoire des impacts au sol.

Ce type d’investigation repose sur l’étude de la distribution statistique des impacts. Des impacts très regroupés sur une cible, par exemple, montreraient une répartition agrégée des points. En divisant la zone d’étude en patchs, on observerait, d’un patch à l’autre, de grandes différences dans le nombre d’impacts (la variance serait largement supérieure à la moyenne). Au contraire, si la distribution est aléatoire, la moyenne du nombre d’impacts par patch serait de l’ordre de grandeur de la variance. Il suffit donc de comparer la distribution observée à celle attendue, en cas de répartition aléatoire : si le jeu de données ne permet pas de rejeter l’hypothèse du hasard, on pourra conclure, avec un certain degré de confiance, que les Allemands ne dirigeaient pas leurs missiles.

Pour éduquer l’esprit critique

La découverte des outils statistiques en mathématiques est bien sûr l’occasion d’aborder la différence entre les intuitions que l’on a des choses et les conclusions que ces instruments nous permettent d’obtenir.

Plus généralement, la même approche pourra être faite dans n’importe quelle discipline. On peut avoir l’impression qu’il a fait plus chaud pendant une période de l’année parce qu’on enregistre des températures élevées durant trois ou quatre jours d’affilée. Toutefois, une telle série est-elle vraiment « anormale »? L’enseignant pourra insister sur le fait que les scientifiques de toutes disciplines vérifient qu’il y a bien quelque chose d’atypique avant de chercher à l’expliquer. Autrement, il serait facile de proposer des interprétations séduisantes de phénomènes… qui n’existent pas en réalité ! Beaucoup de mythes ou de théories du complot proposent ainsi des explications à des séries d’événements qui semblent étrangement connectés, mais dont la survenue n’est que le fruit du hasard. Il faut s’assurer du bien-fondé du phénomène avant de chercher à l’expliquer.

Activités pour la classe