samedi 05 mars 2022 16h53

Les Simpsons comme paradoxes

Le paradoxe de Simpson (1), qui continue de fasciner, d'étonner et de révolter peut s'expliquer de plusieurs manières, et j'en connais une de particulièrement "tactile", c'est à dire "intuitive" pour les doigts.

Soit 4 individus nommés 1,2,3 et 4 dont la note à un test quelconque soient respectivement de 2,1,4 et 3.

Vous remarquerez la division naturelle des 4 individus en deux groupes contenant respectivement 1 et 2 d'une part et 3 et 4 d'autre part.

Vous remarquerez que chaque groupe présente une corrélation inverse: plus votre numéro dans un groupe est important, et plus votre note est basse. Une double tendance, donc qui semble qualifier TOUS les individus.

Regroupons alors les notes pour noter deux groupes dont les notes seront alors 2+1 = 3 d'une part et 4+3 =7, d'autre part. On a là une corrélation directe.

0 0 0

0 0 0 0

En fait, l'agrégation des groupes inverse le sens de la corrélation, c'est le paradoxe de Simpson. En effet, si on ne considère pas le groupage, on obtient une corrélation positive qui est en fait un résultat faux.

Sans considération des regroupements significatifs interne à une bloc de données, la corrélation ordinaire peut donner lieu à des conclusions erronées...

Supposons par exemple que les 4 individus soient ordonnés suivant leurs pratiques du sport (leurs numéros sont leurs nombres d'heures de jogging par semaine) et que la note soit l'espérance de vie. Clairement plus vous courrez, plus vous vivez longtemps.

Maintenant supposons qu'après recherche, on réalise que 1 et 2 sont des femmes et 3 et 4 des hommes. Cela pourrait se concevoir, dans certaines populations les hommes (parce qu'ils ont, les salopards, plus de temps libre) font plus de sport.

Et bien ce facteur supplémentaire (le groupement suivant le sexe) aboutit à la conclusion inverse: plus vous faites de sport, plus vous mourrez jeune... Le facteur est dit "de confusion". On ne peut tirer de conclusions sur une corrélation QUE si on a pris en compte tous les facteurs de confusion possibles, ou bien si, les connaissant, on a regroupé les notes en fonction des facteurs de confusions. Après le regroupement, le paradoxe ne doit plus se manifester, ce qui valide la corrélation...

De manière générale, il faut bien réaliser que ce n'est pas le partage en sous groupes qui donne toujours le "VRAI" et l'agrégation trop rapide qui fait illusion. Car un partage en sous groupes peut n'être pas significatif et ne contenir rien à part une relation arbitraire qui pourrait ne correspondre à aucune relation existante entre les membres du groupe...

De fait il fut montré que la chose dépend du contexte, et que sans savoir extra-statistique, on ne peut valider l'une ou l'autre des alternatives (Lindley and Novick (1981) ou plutôt on peut à partir des mêmes données valider l'une au l'autre des versions.

(1) Judas Pearl Understanding the Simpson Paradox: https://papers.ssrn.com/sol3/papers.cfm?abstract_id=2343788

Lien permanent 0 commentaire

À propos

Misères et merveilles dans tous les ordres. Lire la suite

Derniers blogs mis à jour

Février 2026

Calendrier des notes en Février 2026
D	L	M	M	J	V	S
1	2	3	4	5	6	7
8	9	10	11	12	13	14
15	16	17	18	19	20	21
22	23	24	25	26	27	28

Carte

Notes récentes

vendredi 20 février 2026 08h13
Les Esprits

Bernardo Kastrup est un drôle de...
jeudi 19 février 2026 02h23
Les islamismes

Le...
mardi 10 février 2026 09h53
Les Résurrections

Ce qui doit être évidemment central dans les...
mardi 03 février 2026 08h29
Les Religions

Alors qu'on parle beaucoup de la...
lundi 02 février 2026 16h49
Les Contre propositions

À propos des interrogations...
mercredi 28 janvier 2026 18h51
Les Hypothes.is

Un site d'annotation du web, connu depuis...
mercredi 28 janvier 2026 08h33
Les propositions

A l'occasion de...
samedi 17 janvier 2026 09h37
Les hommes et les femmes

La question maintenant brulante de...
mardi 23 décembre 2025 09h50
Les Démocraties

À l'occasion de diverses...
vendredi 19 décembre 2025 09h59
Le virtuel, la vérité et la commission

...

Rechercher

Tags populaires

russie
todd

FrancoisCarmignola

fougs

Les Simpsons comme paradoxes

François Carmignola sur Les Sionismes

François Carmignola sur Les Sionismes

Zébra sur Les Sionismes

François Carmignola sur Les Sionismes

François Carmignola sur Les Sionismes

Zébra sur Les Sionismes

François Carmignola sur Les Entrismes islamiques

Zébra sur Les Entrismes islamiques

François Carmignola sur Les échiquiers

François Carmignola sur Mozart au piano forte

Les Esprits

Les islamismes

Les Résurrections

Les Religions

Les Contre propositions

Les Hypothes.is

Les propositions

Les hommes et les femmes

Les Démocraties

Le virtuel, la vérité et la commission