Quartet d'Anscombe

Le quartet d'Anscombe comprend quatre ensemble de données qui possèdent les mêmes propriétés statistiques simples, mais qui sont particulièrement différents quand ils sont comparés avec graphiques.



Catégories :

Analyse des données - Statistiques

Page(s) en rapport avec ce sujet :

  • Le quatuor d'Anscombe donne un bon exemple d'une relation entre.... diagramme avec un sous- ensemble des données, sans perdre ni cacher la relation qui... (source : ssc)
  • Ces données forme un ensemble de nombres relatifs `a une population de N = 8..... crées par le fichier de données, mais leurs propriétés sont les mêmes !... la rubrique de Wikipédia sur le quartet d'anscombe : http ://fr. wikipedia.... (source : utbmjb.chez-alice)
  • peut-être extraits d'un ensemble de données bien plus grand. Permet aux utilisateurs de ... Anscombe's Quartet. N : 11.0. Moyenne des X : 9.0. Moyenne des Y :... F. J. Anscombe, "Graphs in Statistical Analysis, "... (source : lix.polytechnique)
Les quatre ensembles de données possèdent les mêmes propriétés statistiques simples, mais leur expression graphique est particulièrement différente.

Le quartet d'Anscombe comprend quatre ensemble de données qui possèdent les mêmes propriétés statistiques simples, mais qui sont particulièrement différents quand ils sont comparés avec graphiques. Ils ont été fabriqués en 1973 par le statisticien Francis Anscombe dans l'objectif de démontrer l'importance de tracer des graphiques avant d'analyser un ensemble de données, car ce tracé permet d'estimer l'incidence des données aberrantes sur les propriétés statistiques de la totalité de données.

Chaque ensemble de données contient 11 points. Les quatre ensembles présentent ces propriétés :

Propriété Valeur
Moyenne des x 9.0
Variance des x 10.0
Moyenne des y 7.5
Variance des y 3.75
Corrélation entre les x et les y 0.816
Équation de la droite de régression linéaire y = 3 + 0, 5x
Somme des carrés des erreurs
assez à la moyenne
110, 0

Le premier ensemble (en haut à gauche) semble être distribué au hasard, ce qui permet d'inférer que les variables ont une certaine corrélation. Le deuxième (en haut à droite) n'est pas distribué au hasard. Il existe une relation non linéaire, fortement correlée, entre les deux variables : pour cette raison, les cœfficients de corrélation de Pearson sont inutiles. Dans le troisième ensemble (en bas à gauche), la corrélation linéaire est idéale sauf pour une donnée aberrante qui influe sur le cœfficient de corrélation, le faisant passer de 1 (pour les 10 premières données) à 0.81 (pour les 11 données). Finalement, le quatrième ensemble (en bas à droite) démontre qu'une seule donnée aberrante suffit pour obtenir un cœfficient de corrélation élevé, même si les deux variables ne sont pas linéairement corrélées.

Dans la première page du premier chapitre de son ouvrage, The Visual Display of Quantitative Information, Edward Tufte utilise le quartet pour démontrer l'importance du graphique avant d'analyser la totalité de données.

Les ensembles de données sont comme suit (les valeurs des x sont les mêmes pour les trois premiers ensembles. )

Quartet d'Ascombe
I II III IV
x y x y x y x y
10.0 8.04 10.0 9.14 10.0 7.46 8.0 6.58
8.0 6.95 8.0 8.14 8.0 6.77 8.0 5.76
13.0 7.58 13.0 8.74 13.0 12.74 8.0 7.71
9.0 8.81 9.0 8.77 9.0 7.11 8.0 8.84
11.0 8.33 11.0 9.26 11.0 7.81 8.0 8.47
14.0 9.96 14.0 8.10 14.0 8.84 8.0 7.04
6.0 7.24 6.0 6.13 6.0 6.08 8.0 5.25
4.0 4.26 4.0 3.10 4.0 5.39 19.0 12.50
12.0 10.84 12.0 9.13 12.0 8.15 8.0 5.56
7.0 4.82 7.0 7.26 7.0 6.42 8.0 7.91
5.0 5.68 5.0 4.74 5.0 5.73 8.0 6.89

Une procédure pour créer d'autres ensembles de données exhibant les mêmes propriétés statistiques simples, mais des représentations graphiques dissemblables sont proposées dans les ouvrages de la bibliographie.

Notes et références

Voir aussi

Liens externes

Bibliographie

Recherche sur Amazon (livres) :



Ce texte est issu de l'encyclopédie Wikipedia. Vous pouvez consulter sa version originale dans cette encyclopédie à l'adresse http://fr.wikipedia.org/wiki/Quartet_d%27Anscombe.
Voir la liste des contributeurs.
La version présentée ici à été extraite depuis cette source le 07/04/2010.
Ce texte est disponible sous les termes de la licence de documentation libre GNU (GFDL).
La liste des définitions proposées en tête de page est une sélection parmi les résultats obtenus à l'aide de la commande "define:" de Google.
Cette page fait partie du projet Wikibis.
Accueil Recherche Aller au contenuDébut page
ContactContact ImprimerImprimer liens d'évitement et raccourcis clavierAccessibilité
Aller au menu