Ne pas confondre cause et corrélation (le recours au protocole expérimental pour isoler la cause)

Deux phénomènes sont corrélés si leurs variations se font dans le même sens ou dans des sens opposés. Par exemple, il existe une corrélation positive entre la masse et la taille d’un individu, mais négative entre les dépenses que l’on fait et l’argent qu’il nous reste sur notre compte.

Faites-le vous-même

Observez quelques minutes le graphique suivant, qui présente le nombre de prix Nobel par pays (rapporté au nombre d’habitants) et la consommation de chocolat par habitant de chaque pays.

Après avoir observé ce graphique, répondez à la question suivante :

Reconnaissez-vous avoir pensé à l’une des idées suivantes, même quelques secondes ?

  1. 1) Le nombre de prix Nobel augmente quand la consommation de chocolat augmente.
  2. 2) Le chocolat est plus consommé dans les pays où il y a plus de prix Nobel.
  3. 3) Avoir plus de prix Nobel favoriserait la consommation de chocolat.
  4. 4) Consommer du chocolat favoriserait l’obtention de prix Nobel.
  5. 5) Consommer du chocolat rendrait plus intelligent.
Débriefing

Dans un article paru en 2012 dans la revue scientifique The New England Journal of Medicine, l’auteur, le médecin Franz Messerli, étudie la corrélation entre la consommation de chocolat d’un certain nombre de pays et le nombre de lauréats du prix Nobel de ces mêmes pays, par rapport au nombre total d’habitants. Les données extraites par Franz Messerli à partir de différentes sources sont celles que vous avez découvertes dans le graphique. L’auteur de l’étude souligne que corrélation n’implique pas causalité, mais en même temps cherche à identifier des mécanismes qui pourraient justifier l’existence de ce lien causal. Il suggère par exemple que des substances présentes dans le chocolat pourraient avoir un effet positif sur les performances cognitives et, de là… Cependant, les pays où on consomme plus de chocolat sont aussi des pays occidentaux et riches… Ce qui pourrait représenter une variable cachée, susceptible d’expliquer un plus grand investissement dans la recherche scientifique et, par là, plus de chances d’avoir des citoyens lauréats du prix Nobel.

Il est très difficile de résister à la tentation de voir dans ce graphique un lien de cause à effet. C’est bien la manière de représenter les données et notre cognition naturelle qui nous poussent à interpréter les choses ainsi. Un graphique analogue qui présenterait une corrélation entre le nombre d’attaques de requins sur des plages données et les ventes de glaces sur ces mêmes plages aboutirait au même effet… et l’on commencerait à se demander si les mangeurs de glaces ne sont pas moins prudents ou moins rapides dans l’eau ! Attention, donc, la corrélation est un bon indice de la causalité, mais elle ne l’implique pas tout le temps !

Ce que font les scientifiques

Bien conscients du fait que la corrélation n’implique pas forcément une causalité, les scientifiques ont recours à des méthodes qui leur permettent d’identifier les causes d’un phénomène avec le plus grand degré de certitude et, notamment, d’exclure que l’effet observé (dans notre exemple : la distribution de prix Nobel à travers les pays) ne soit à attribuer à d’autres causes possibles.

L’une de ces méthodes est le test expérimental. Prenons le cas suivant : on veut savoir si un médicament est efficace. Un protocole expérimental classique suit plusieurs règles :

  • Il faut constituer au moins deux lots : un lot test et un lot témoin, qui ne sont distincts que par une seule variable, le médicament dont on veut tester l’effet.
  • Il faut multiplier les observations : les lots doivent contenir suffisamment d’individus pour que les conclusions soient robustes.
  • Il faut répartir les individus dans ces différents lots de manière non biaisées, si possible sur la base du hasard. (Si tous les individus à qui on administre des antibiotiques sont aussi ceux qui, au départ, étaient en meilleure santé, alors on pourrait penser que les antibiotiques aident à guérir, alors qu’il ne s’agit que d’un biais de sélection.)
  • On peut ainsi observer – au bout d’un intervalle de temps défini – combien d’individus présentent une amélioration de leur condition suite à la prise du médicament (individus du lot test) et combien d’individus présentent une amélioration même sans médicament (individus du lot témoin).

Par la suite, les scientifiques chercheront à compléter ces observations avec de nombreuses observations complémentaires – et notamment la répétition de la même expérience par d’autres chercheurs, dans d’autres laboratoires – aussi bien que par la recherche d’un mécanisme permettant de rendre compte du lien entre la variable et l’effet, et donc, à préciser le lien causal à travers des causes de plus en plus précises et non ambiguës. Toute cette procédure garantit au mieux d’exclure les variables confondantes : on augmente fortement notre confiance dans le lien causal que l’on cherche à établir entre le facteur observé et la variable suspectée. Déterminer un lien causal est l’une des étapes qui permettent aux scientifiques de parvenir à établir des connaissances scientifiques. Une expérience bien réalisée constitue une preuve de qualité assez élevée, car elle contrôle bon nombre de biais.

Une histoire de science
James Lind : une figure importante dans l’histoire de la médecine.

James Lind est un médecin écossais du XIXe siècle, considéré parfois comme l’auteur du premier essai clinique. Un fléau touche les marins de l’époque : il s’agit du scorbut. Cette maladie grave, liée à une carence en vitamine C, se traduit par divers symptômes, dont un déchaussement des dents et, dans ses formes les plus graves, elle peut être mortelle. Au point que Lind considère que le scorbut cause plus de morts chez les marins que les guerres auxquelles sont confrontés les navires militaires. Pour tester l’efficacité de plusieurs remèdes, Lind a l’idée de choisir 12 marins vivant dans des conditions similaires et de donner à chacune des six paires un traitement différent (du vinaigre, du cidre, deux oranges et un citron…). Au bout de quelques jours, les deux hommes ayant reçu les oranges et le citron montrent une amélioration des signes cliniques. Bien que fondamentale rétrospectivement, cette expérience n’a pas suffi à convaincre la communauté scientifique, ni Lind lui-même, et ce, pour différentes raisons que nous ne présenterons pas ici. Mais l’intérêt épistémologique de la démarche est évident : en choisissant un échantillon (certes réduit) de marins soumis aux mêmes conditions, Lind s’est assuré de ne faire varier qu’un seul et unique facteur (le traitement), afin de pouvoir lui attribuer la responsabilité des effets observés.

Une autre histoire de science
Austin Bradford Hill

Il n’est pas toujours possible d’avoir recours à des tests expérimentaux, pour des raisons pratiques ou éthiques. Considérez la question suivante : est-ce que le tabac peut jouer un rôle causal dans le déclenchement du cancer du poumon ? Inutile de souligner qu’il ne serait pas éthiquement acceptable de demander à des sujets de fumer pour contrôler s’ils ont plus de risques de développer un cancer par rapport à d’autres sujets non-fumeurs. Dans ces circonstances, un test expérimental à proprement parler n’est pas envisageable. Comment établir la cause, alors qu’on ne peut pas véritablement manipuler les conditions initiales et isoler les facteurs les uns des autres ? On peut avoir recours à une étude « longitudinale » ou « de cohorte », qui suppose de suivre, pendant une longue période, un groupe (une cohorte) de sujets.

Ce genre d’étude permet d’estimer le risque associé à un comportement donné (fumer, être exposé à un certain polluant ou hasard environnemental, mais aussi se vacciner – ou pas – contre une maladie infectieuse). Ses résultats sont souvent exprimés sous forme de proportions et indiquent le risque relatif de développer la condition étudiée, en association avec l’exposition (au tabac, à l’agent polluant, à la maladie sans couverture vaccinale), par comparaison avec le groupe témoin sans exposition. Naturellement, dans ce cas, l’assignation à un groupe plutôt qu’à un autre ne peut pas être faite aléatoirement. Elle dépend en effet des choix que chaque groupe a fait pour lui-même (fumer ou ne pas fumer) et ce choix peut à son tour être déterminé par des conditions, ou impliquer des conséquences qui vont rendre difficile d’exclure avec certitude des facteurs autres que celui étudié, et ainsi déterminer la causalité (du tabac par rapport au cancer du poumon, par exemple), avec un haut degré de fiabilité. Des outils statistiques et des modèles informatiques seront alors mobilisés pour analyser comment interagissent les différents facteurs. Mais on continuera à manquer des conditions propres au test expérimental et le degré de certitude de la preuve ainsi obtenue sera moins élevé, pour la simple raison que le risque d’erreur dans les conclusions – de biais introduit par la sélection de l’échantillon ou d’autres conditions de l’étude, de facteurs tiers qui influencent l’association entre les deux conditions étudiées – est plus important.

Dans les années 1960, confronté à la question (brûlante) du rôle du tabac dans l’étiologie du cancer du poumon, le médecin épidémiologiste Austin Bradford Hill (qui travaille alors avec son collègue Richard Doll) introduit un outil d’évaluation des preuves à l’appui d’une hypothèse causale, encore largement utilisé aujourd’hui et connu comme « les critères de causalité probable de Bradford Hill ». Il s’agit, dans la version originale, de neuf critères à utiliser comme balises pour délivrer un jugement expert et raisonné sur la plausibilité d’une relation causale dans le cas d’une étude épidémiologique. Aucun des critères n’est nécessaire ni suffisant. Voyons comment l’outil fonctionne. Admettons que notre hypothèse est la suivante : fumer est un facteur de risque pour le carcinome du poumon. Premièrement, on vérifie que les deux phénomènes (« fumer » et « tomber malade ») sont associés. On déroule donc l’une de ces études observationnelles décrites ci-dessus, permettant de suivre une cohorte de sujets (fumeurs) sur un laps de temps conséquent. On vérifie leur état de santé et on le compare avec celui d’une autre cohorte de non-fumeurs – autant que possible semblable à la première. Puis on se pose une série de questions.

  • Est-ce que l’association est forte (c’est-à-dire que beaucoup plus de fumeurs que de non-fumeurs développent un cancer du poumon) ?
  • Est-ce que cette association est reproductible (à savoir confirmée par de nouvelles observations, des tests de différente nature…) ?
  • Est-ce que l’association est spécifique (c’est-à-dire qu’elle concerne plus spécifiquement une certaine population – les fumeurs –, notamment, et pas d’autres catégories) ?
  • Est-ce que la temporalité est respectée ? Y a-t-il une relation dose-effet (plus on fume, plus on a de risques de tomber malade) ?
  • Est-ce qu’il existe un mécanisme explicatif plausible permettant de comprendre comment le facteur causal induit l’effet observé ?
  • Est-ce que les résultats obtenus par les études épidémiologiques concordent avec ceux obtenus par les tests en laboratoire – tests sur animaux, sur cultures cellulaires, mais aussi preuves expérimentales proprement collectées par des RCT ?
  • Et, enfin, est-ce qu’on connaît des cas analogues où des facteurs semblables ont produit des effets proches de ceux observés ?

Il n’est pas nécessaire, pour parler de causalité probable, que tous les critères soient remplis. Dans certains cas, le chercheur manquera de tests expérimentaux rigoureux ; dans d’autres, il pourra être difficile de démontrer une temporalité claire ou d’identifier le mécanisme explicatif, encore inconnu. C’est pour cela que ces critères sont utilisés comme un outil, pour rendre plus objective l’évaluation d’un lien de causalité, et non pas comme une grille à remplir machinalement pour obtenir un verdict. Au cours du temps, l’utilisation de ces critères a évolué, certains s’étant révélés plus discriminants que d’autres. Cependant, les critères de Bradford Hill sont là pour nous rappeler qu’en plus d’évaluer la qualité des preuves, les scientifiques cherchent à estimer la cohérence de celles-ci, ainsi que leur complémentarité, afin d’évaluer la cause probable d’un phénomène étudié.

Pour éduquer l’esprit critique

En cours de sciences, d’histoire-géographie ou d’éducation physique, on s’appuie souvent sur des corrélations pour établir une causalité. Ainsi, on observe deux courbes qui varient dans le même sens et on déduit qu’une variation entraîne l’autre. Pensez à préciser aux élèves que si une corrélation est une piste intéressante pour envisager une explication causale, elle n’en constitue pas pour autant une preuve définitive. Il sera notamment important de pouvoir invalider une hypothèse causale si l’on dispose de connaissances qui la rendent peu plausible ou de preuves en faveur d’autres hypothèses.

Voici un site où il est possible de s’amuser avec des exemples loufoques de corrélations apparentes qui ne sont soutenues par aucun mécanisme causal :

La notion de protocole expérimental est régulièrement abordée en cours de sciences. Le protocole est présenté comme un ensemble de règles à respecter, mais il pourrait être utile de montrer l’intérêt associé à chaque règle (pourquoi créer un groupe témoin, pourquoi multiplier les observations, pourquoi ne faire varier qu’un facteur à la fois…). À l’issue de ces cours, il est facile de prendre des exemples de notre vie quotidienne où, au contraire, nous nous basons sur des observations limitées, sans contrôle, qui confrontent des situations où de très nombreux facteurs varient… Quand l’enjeu n’est pas trop important (améliorer sa recette de cuisine favorite), on peut s’amuser à optimiser le protocole par soi-même (par exemple, diviser la pizza en deux pour ne faire varier qu’un seul ingrédient et faire le test d’évaluation du goût à l’aveugle !). Quand l’enjeu est important, nous devrions réaliser que de telles observations ne permettent pas de parvenir à des conclusions fiables. Il sera alors nécessaire de faire confiance à des modalités d’investigation plus expertes : celles obtenues par les scientifiques.

Activités pour la classe