Tests d'hypothèse et analyse de tableaux de contingence (statistique inférentielle)

 

Les démarches liées au thème des tests d'hypothèse sont multiples.

Le schéma classique (Fisher) est le suivant : étant donné une hypothèse H0, comment le résultat R d'une expérience va-t-il influencer sur la relation de confiance que le chercheur entretient avec cette hypothèse ? Globalement si la probabilité p (p-value) d'obtenir R en admettant H0 est faible, l'hypothèse H0 aura tendance à être rejetée, sinon elle sera confortée.

Exemple : H0 : les résultats en mathématique des filles et des garçons se répartissent de façon aléatoire. R : examiner les résultats de 100 élèves.

Le modèle de Neyman & Pearson introduit deux hypothèses : l'hypothèse nulle H0 (il n'y a pas de relation) et l'hypothèse alternative H1 (une relation donnée existe). Une règle de décision est introduite (liée à une valeur particulière de la p-value) pour accepter H0 (et rejeter H1) ou le contraire.

A partir de ces schémas généraux, différentes variantes ont été imaginées dans les différentes "écoles" de chercheurs. Certaines de ces règles se matérialisent uniquement à travers des manipulations statistiques (établissement de caractéristiques d'une population à partir de celles d'échantillons). D'autres peuvent faire intervenir des éléments relevant du champ considéré (intégration à une théorie).

Les outils utilisés pour parvenir au calcul d'une p-value sont multiples. Ils dépendent de la nature des variables en jeu (métrique, ordinale, nominale) et des relations qu'elles entretiennent entre elles. Ici, on va considérer le cas de variables nominales ou ordinales (cas non paramétrique), et considérer que le résultat R de l'expérience ou de l'observation s'exprime à l'aide d'un tableau de contingence (tableau à valeurs entières, souvent un nombre de sujets).

A noter que dans ce cas, le test ne va plus mettre en relation un échantillon et une population, mais mettre en évidence l'information apportée par la configuration particulière de notre tableau. Il y a une modification du schéma de raisonnement. Si l'information obtenue est jugée suffisante (p-value faible), elle est à mettre en relation avec un cadre théorique général (explications possibles, autres résultats, etc.)

Quelques exemples chiffrés (utilisation de ANASTAT)

Les résultats à un test sont donnés selon une échelle (ordinale) à trois niveaux.
niveau faible  niveau moyen  niveau élevé total 
fille 1 3 6
garçon 2 2 5
total 3 5 11
On peut se poser diverses questions:

1) Y a-t-il (proportionnellement) plus de filles de niveau élevé ?
2) Les "profils" pour chaque taux de réussite sont-ils semblables ?
3) Les filles obtiennent-elles de meilleurs résultats ?

Dans tous ces cas, les énoncés précis de H0 et de H1 sont évidents !

1) Plus de filles de niveau élevé ?

On peut procéder à une étude "exacte"
       faible moyen élevé
fille  0      1     5 
garçon 3      2     0 
x3
       faible moyen élevé 
fille  0      2     4 
garçon 3      1     1 
x15
       faible moyen élevé 
fille  0      3     3 
garçon 3      0     2 
x10
       faible moyen élevé 
fille  1      0     5 
garçon 2      3     0 
x3
       faible moyen élevé 
fille  1      1     4 
garçon 2      2     1 
x45
       faible moyen élevé 
fille  1      2     3 
garçon 2      1     2 
x90
       faible moyen élevé 
fille  1      3     2 
garçon 2      0     3 
x30
       faible moyen élevé 
fille  2      0     4 
garçon 1      3     1 
x15
       faible moyen élevé 
fille  2      1     3 
garçon 1      2     2 
x90
       faible moyen élevé 
fille  2      2     2 
garçon 1      1     3 
x90
       faible moyen élevé 
fille  2      3     1 
garçon 1      0     4 
x15
       faible moyen élevé 
fille  3      0     3 
garçon 0      3     2 
x10
       faible moyen élevé 
fille  3      1     2 
garçon 0      2     3 
x30
       faible moyen élevé 
fille  3      2     1 
garçon 0      1     4 
x15
       faible moyen élevé 
fille  3      3     0 
garçon 0      0     5 
Les nombres en présence montrent que dans 9 tableaux sur 15 les filles sont majoritaires au niveau élevé (p = 9/15 = 0.6). On pourra difficilement répondre à la première question par l'affirmative. De fait il faudrait compter les tableaux avec leur multiplicité notée en bas à gauche de chaque case pour tenir compte des répétitions. Cela conduit à un résultat du même ordre: 281/462= 0.61.

A discuter : problème des totaux marginaux, nécessité de trouver des coefficients globaux !

2) Différence de profils

Le coefficient Chi-2 mesure la distance du tableau obtenu à un tableau où les profils sont semblables. Plus cette distance sera grande et plus la probabilité d'obtenir cette configuration "au hasard" sera faible.

Résultat : Chi-2 = 0.78 ; df = 2 ; p = 0.68. On ne peut conclure à une différence de profils.

3) Les résultats des filles sont-ils meilleurs ?

Utilisation du coefficient S qui mesure la "diagonalité" du tableau.

Résultat : S de Kendall = -6 ; correction = 3.5 ; sigma = 10.23 ; z = 0.24 ; p = 0.40. On ne peut conclure à un niveau global plus élevé des filles.

Même situation avec d'autres valeurs

       faible moyen élevé 
fille  1      5     1 
garçon 5      1     5 
Chi-2 = 7.48 ; df = 2 ; p = 0.023 ; on peut admettre une différence de profils (au niveau de signification 0.05)

S = 0 ; p = 0.5 ; les résultats des filles ne sont pas plus élevés (!)

       faible moyen élevé 
fille  0      2     2 
garçon 2      1     0 
Chi-2 = 4.28 ; df = 2 ; p = 0.12 ; classiquement on ne peut admettre une différence de profils

S = -10 ; p = 0.08 ; les résultats des filles sont plus élevés (résultat significatif au niveau 0.1)

p-value et calcul de l'effet

A ne pas confondre "degré de signification" et grandeur de "l'effet" !
données
       faible moyen élevé 
fille  0      2     2 
garçon 2      1     0 
       faible moyen élevé 
fille  0      2     3 
garçon 3      1     0 
p- value S = -6 ; p = 0.08 S = -18 ; p = 0.026
effet Delta = -0.83 Delta = -0.9

Problème de l'interaction

            faible moyen élevé
-classe1
     fille  0      2     2
     garçon 2      1     0
-classe2
     fille  0      2     3
     garçon 3      1     0

Problème : la différence entre fille et garçon (relevée dans la classe 1 et la classe2) est-elle supérieure dans la classe 2 ?

C'est un schéma d'analyse de variance (utilisation du coefficient L de Meddis).

Effets simples

Classe : Lclasse = -17.00 ; pclasse = 0,5 ; la classe 2 n'est pas meilleure que la 1.

Sexe : Lsexe = 72 ; psexe = 0.001 ; les filles sont meilleures que les garçons

Interaction

Classe x sexe : Li = -11 ; pi = 0.27 ; la différence entre filles et garçons de la classe 2 ne peut pas être considérée comme plus importante que celle observée dans la classe 1.

 

 

(c) L.-O. Pochon, IRDP, 1997