Paradoxe de Simpson

Le paradoxe de Simpson ou effet de Yule-Simpson est un paradoxe statistique décrit par Edward Simpson en 1951 et George Udny Yule en 1903, dans lequel le succès de plusieurs groupes semble s'inverser quand les groupes sont combinés.



Catégories :

Paradoxe probabiliste - Statistiques

Page(s) en rapport avec ce sujet :

  • Mathématiques et sciences humaines/Mathematics and social sciences. (source : msh.revues)
  • ... Un paradoxe de Simpson évolutif... de variabilité d'une colonie à l'autre et rentrer dans un régime où le paradoxe de Simpson a lieu.... (source : tomroud)

Le paradoxe de Simpson ou effet de Yule-Simpson est un paradoxe statistique décrit par Edward Simpson en 1951 et George Udny Yule en 1903, dans lequel le succès de plusieurs groupes semble s'inverser quand les groupes sont combinés. Ce résultat qui paraît impossible est fréquemment rencontré dans la réalité, surtout dans les sciences sociales et les statistiques médicales.

Explication à travers un exemple

Pour illustrer ce paradoxe de Simpson, on considère deux contributeurs de Wikipédia, Lisa et Bart.

La première semaine, Lisa perfectionne 60 % des articles qu'elle édite tandis que Bart perfectionne 90 % des articles qu'il édite. La seconde semaine, Lisa n'perfectionne que 10 % des articles et Bart s'en tient à un score de 30 %.

Les deux fois, Bart obtient un meilleur score que Lisa. Mais quand les deux actions sont combinées, Lisa a perfectionné un plus grand pourcentage que Bart : elle a perfectionné légèrement plus de 55 % des articles qu'elle a édité tandis que Bart n'en a perfectionné même pas 36 %.

Il faut bien noter que le résultat au bout des 2 semaines ne pouvait être déduit des seuls 4 premiers pourcentages car il dépend du nombre de pages éditées par chaque contributeur. Il faut par conséquent disposer de ces nombres pour élucider ce paradoxe :

La première semaine, Lisa édite 100 articles. Elle perfectionne par conséquent 60 articles. Pendant ce temps, Bart s'occupe de 10 articles et en perfectionne ainsi 9. La seconde semaine, Lisa n'édite que 10 articles et n'perfectionne qu'une seule page. Bart édite 100 articles et en perfectionne 30. Lorsque le résultat à la fin des deux semaines est combiné, on constate que les deux contributeurs ont édités le même nombre d'articles (110) mais que Lisa en a perfectionné 61 tandis que Bart n'en a perfectionné que 39.

Semaine 1 Semaine 2 Total
 Lisa   60/100 = 60%  1/10 = 10%  61/110 = 55, 45% 
 Bart  9/10 = 90%  30/100 = 30%   39/110 = 35, 45% 

Il apparaît que les deux données, scindées, soutiennent une hypothèse donnée mais, une fois rassemblées, démontrent l'hypothèse inverse.

D'une manière plus formelle :

  • S_A(1) = 60\% ∼ — Lisa perfectionne 60% des articles qu'elle édite
  • S_B(1) = 90\% ∼ — Bart perfectionne 90% des articles qu'il édite
La notion de succès est associée à Bart.
  • S_A(2) = 10\%∼ — Lisa perfectionne 10% des articles qu'elle édite
  • S_B(2) = 30\%∼ — Bart perfectionne 30% des articles qu'il édite
Le succès est ici encore attribué à Bart.

Dans les deux cas, Bart a un meilleur pourcentage d'amélioration. Mais en combinant les deux résultats, nous voyons que Lisa et Bart ont édité 110 articles. On établit ainsi :

Recherche sur Amazon (livres) :



Ce texte est issu de l'encyclopédie Wikipedia. Vous pouvez consulter sa version originale dans cette encyclopédie à l'adresse http://fr.wikipedia.org/wiki/Paradoxe_de_Simpson.
Voir la liste des contributeurs.
La version présentée ici à été extraite depuis cette source le 07/04/2010.
Ce texte est disponible sous les termes de la licence de documentation libre GNU (GFDL).
La liste des définitions proposées en tête de page est une sélection parmi les résultats obtenus à l'aide de la commande "define:" de Google.
Cette page fait partie du projet Wikibis.
Accueil Recherche Aller au contenuDébut page
ContactContact ImprimerImprimer liens d'évitement et raccourcis clavierAccessibilité
Aller au menu