Test de normalité

En statistiques, les tests de normalité permettent de vérifier si des données réelles suivent une loi normale ou non. Les tests de normalité sont des cas spécifiques des tests de correction, appliqués à une loi normale.



Catégories :

Test statistique - Statistiques

Page(s) en rapport avec ce sujet :

  • distribution des débits selon l'étape qui est mise en jeu au...... Et avant de commencer ces tests, un test de normalité est indispensable pour...... et le test de comparaison de deux moyennes selon la norme NF X 06-059, peut... (source : lcsqa)
  • Le test de normalité est lié aux tests qui ont précédé dans le sens o`u :...... [201] R. A. WOODING, “The multivariate distribution of complex normal... (source : i3s.unice)

En statistiques, les tests de normalité permettent de vérifier si des données réelles suivent une loi normale ou non. Les tests de normalité sont des cas spécifiques des tests de correction (ou tests d'ajustement, tests servant à comparer des distributions), appliqués à une loi normale.

Ces tests prennent une place importante en statistiques. En effet, de nombreux tests supposent la normalité des distributions pour être applicables. En toute rigueur, il est indispensable de vérifier la normalité avant d'utiliser les tests. Cependant, de nombreux tests sont suffisamment robustes pour être utilisables même si les distributions s'écartent de la loi normale.

Approches empiriques et graphiques

Histogramme de la distribution

Il est envisageable de visualiser la forme de la distribution des données à analyser en les représentant sous forme d'histogramme puis de comparer la forme de cet histogramme avec une courbe représentant une loi normale (les paramètres de cette loi étant calculés à partir des données à analyser). Ceci ne permet pas de conclure à la normalité des données mais peut donner un idée du type de loi sous-jacente : loi normale, loi de Cauchy ou loi de Student si la distribution semble symétrique, loi log-normale, loi gamma, loi de Weibull, loi exponentielle ou loi bêta si la distribution est asymétrique.

Normality histogram.png

Histogramme des résidus

Il est aussi envisageable de représenter l'histogramme des résidus (c'est-à-dire la différence entre la distribution observée et la loi normale). Les résidus doivent suivre aussi un loi normale.

Boîte à moustaches (box-plot)

Une boîte à moustaches sert à visualiser rapidement la symétrie de la distribution des données réelles et la présence de valeurs atypiques.

Normality box-plot.png

Graphe quantile-quantile (qq-plot)

Cœfficients d'asymétrie et d'aplatissement

Les Cœfficients d'asymétrie et d'aplatissement sont aussi utiles pour définir une loi normale.

Pour l'aplatissement : ∼ G_2 = \frac{(n+1)\,n}{(n-1)\,(n-2)\,(n-3)} \; \sum_{i=1}ˆn \left( \frac {x_i - \bar{x}} \sigma \right) ˆ4 - 3\,\frac{(n-1)ˆ2}{(n-2) (n-3)}

et pour l'asymétrie : G_1 = \frac n {(n-1)\,(n-2)} \; \sum_{i=1}ˆn \left( \frac {x_i - \bar{x}} \sigma \right) ˆ3

avec σ un estimateur non biaisé de la variance.

On sait effectivement que le cœfficient d'asymétrie vaut zéro pour toute loi normale, alors que le cœfficient d'aplatissement vaut 3 (0 si normalisé)

Approche probabiliste

Il existe aussi la plupart de tests de normalité :

Généralités

Les tests de normalité sont des tests d'hypothèse. En notant F (x) la fonction de répartition basée sur les données à analyser et F0 (x) la fonction de répartition théorique, les hypothèses nulle et alternative peuvent s'écrire :

\begin{cases} {H_0∼:∼F(x) = F_0(x)} \\ {H_1∼:∼F(x) \neq F_0(x)} \end{cases}.

Les tests sur les moments ont une hypothèse moins forte, ils ne testent pas si la fonction de répartition est normale, mais si les moments (cœfficients d'asymétrie et d'aplatissement) de la distribution inconnue sont semblables à ceux d'une loi normale :  H_{0}: G_1=0 \mbox{ et } G_2=3 \,

 H_{1}: G_1\ne 0 \mbox{ ou } G_2\ne 3 \,

On remarquera que ce n'est pas suffisant pour caractériser une loi normale (Problème des moments).

Test de correction du χ²

Article détaillé : Test du χ².

Son utilisation n'est pas recommandée du fait de son manque de puissance et de l'obligation de diviser les distributions en classes.

[1].

Tests bayesien

Kullback-Leibler distances between the whole posterior distributions of the slope and variance do not indicate non-normality. However, the ratio of expectations of these posteriors and the expectation of the ratios give similar results to the Shapiro-Wilk statistic except for very small samples, when non-informative priors are used. [2]

Spiegelhalter suggests using Bayes factors to compare normality with a different class of distributional alternatives. [3] This approach has been extended by Farrell and Rogers-Stewart. [4]

Applications

Une application des tests de normalité concerne les résidus d'un modèle de régression linéaire. S'il ne sont pas distribués de façon normale, les résidus ne peuvent pas être utilisés dans des tests Z ou dans quelqu'autre test que ce soit, à partir du moment où il fait intervenir des hypothèses de normalité (par exemple, le test t, le test F ou le test du chi-deux). Si les résidus ne sont pas normalement distribués, cela veut dire que la variable dépendante, ou tout au moins une variable explicative, pourrait avoir une fonction de répartition erronée ; des variables importantes peuvent aussi être manquantes. Une ou plusieurs correction de ces erreurs classiques peuvent génèrer des résidus qui suivent une distribution normale.

Voir aussi

Références

  1. Judge et al. (1988) and Gujarati (2003) recommendent le test de Jarque–Bera.
  2. Young K. D. S. (1993), Bayesian diagnostics for checking assumptions of normality. Journal of statistical computation and simulation, vol. 47, no3-4, pp. 167-180
  3. Spiegelhalter, D. J. (1980). An omnibus test for normality for small samples. Biometrika, 67, 493-496. DOI :10.1093/biomet/67.2.493
  4. Farrell, P. J., Rogers-Stewart, K. (2006) Comprehensive study of tests for normality and symmetry : extending the Spiegelhalter test. Journal of Statistical Computation and Simulation, 76 (9), 803 – 816. DOI :10.1080/10629360500109023

Liens externes

Recherche sur Amazon (livres) :



Ce texte est issu de l'encyclopédie Wikipedia. Vous pouvez consulter sa version originale dans cette encyclopédie à l'adresse http://fr.wikipedia.org/wiki/Test_de_normalit%C3%A9.
Voir la liste des contributeurs.
La version présentée ici à été extraite depuis cette source le 07/04/2010.
Ce texte est disponible sous les termes de la licence de documentation libre GNU (GFDL).
La liste des définitions proposées en tête de page est une sélection parmi les résultats obtenus à l'aide de la commande "define:" de Google.
Cette page fait partie du projet Wikibis.
Accueil Recherche Aller au contenuDébut page
ContactContact ImprimerImprimer liens d'évitement et raccourcis clavierAccessibilité
Aller au menu