|
Les démarches liées au thème des
tests d'hypothèse sont multiples.
Le schéma classique (Fisher) est le suivant : étant donné
une hypothèse H0, comment le résultat R d'une expérience
va-t-il influencer sur la relation de confiance que le chercheur entretient
avec cette hypothèse ? Globalement si la probabilité p (p-value)
d'obtenir R en admettant H0 est faible, l'hypothèse H0 aura tendance
à être rejetée, sinon elle sera confortée.
Exemple : H0 : les résultats en mathématique des filles
et des garçons se répartissent de façon aléatoire.
R : examiner les résultats de 100 élèves.
Le modèle de Neyman & Pearson introduit deux hypothèses
: l'hypothèse nulle H0 (il n'y a pas de relation) et l'hypothèse
alternative H1 (une relation donnée existe). Une règle de
décision est introduite (liée à une valeur particulière
de la p-value) pour accepter H0 (et rejeter H1) ou le contraire.
A partir de ces schémas généraux, différentes
variantes ont été imaginées dans les différentes
"écoles" de chercheurs. Certaines de ces règles se matérialisent
uniquement à travers des manipulations statistiques (établissement
de caractéristiques d'une population à partir de celles
d'échantillons). D'autres peuvent faire intervenir des éléments
relevant du champ considéré (intégration à
une théorie).
Les outils utilisés pour parvenir au calcul d'une p-value sont
multiples. Ils dépendent de la nature des variables en jeu (métrique,
ordinale, nominale) et des relations qu'elles entretiennent entre elles.
Ici, on va considérer le cas de variables nominales ou ordinales
(cas non paramétrique), et considérer que le résultat
R de l'expérience ou de l'observation s'exprime à l'aide
d'un tableau de contingence (tableau à valeurs entières,
souvent un nombre de sujets).
A noter que dans ce cas, le test ne va plus mettre en relation un échantillon
et une population, mais mettre en évidence l'information apportée
par la configuration particulière de notre tableau. Il y a une
modification du schéma de raisonnement. Si l'information obtenue
est jugée suffisante (p-value faible), elle est à mettre
en relation avec un cadre théorique général (explications
possibles, autres résultats, etc.)
Quelques exemples chiffrés (utilisation de ANASTAT)
Les résultats à un test sont donnés selon une échelle
(ordinale) à trois niveaux.
|
niveau faible |
niveau moyen |
niveau élevé |
total |
| fille |
1 |
2 |
3 |
6 |
| garçon |
2 |
1 |
2 |
5 |
| total |
3 |
3 |
5 |
11 |
On peut se poser diverses questions:
1) Y a-t-il (proportionnellement) plus de filles de niveau élevé
?
2) Les "profils" pour chaque taux de réussite sont-ils semblables
?
3) Les filles obtiennent-elles de meilleurs résultats ?
Dans tous ces cas, les énoncés précis de H0 et de
H1 sont évidents !
1) Plus de filles de niveau élevé ?
On peut procéder à une étude "exacte"
faible moyen élevé
fille 0 1 5
garçon 3 2 0
x3 |
faible moyen élevé
fille 0 2 4
garçon 3 1 1
x15 |
faible moyen élevé
fille 0 3 3
garçon 3 0 2
x10 |
faible moyen élevé
fille 1 0 5
garçon 2 3 0
x3 |
faible moyen élevé
fille 1 1 4
garçon 2 2 1
x45 |
faible moyen élevé
fille 1 2 3
garçon 2 1 2
x90 |
faible moyen élevé
fille 1 3 2
garçon 2 0 3
x30 |
faible moyen élevé
fille 2 0 4
garçon 1 3 1
x15 |
faible moyen élevé
fille 2 1 3
garçon 1 2 2
x90 |
faible moyen élevé
fille 2 2 2
garçon 1 1 3
x90 |
faible moyen élevé
fille 2 3 1
garçon 1 0 4
x15 |
faible moyen élevé
fille 3 0 3
garçon 0 3 2
x10 |
faible moyen élevé
fille 3 1 2
garçon 0 2 3
x30 |
faible moyen élevé
fille 3 2 1
garçon 0 1 4
x15 |
faible moyen élevé
fille 3 3 0
garçon 0 0 5
|
|
Les nombres en présence montrent que dans 9 tableaux sur 15 les filles
sont majoritaires au niveau élevé (p = 9/15 = 0.6). On pourra
difficilement répondre à la première question par l'affirmative.
De fait il faudrait compter les tableaux avec leur multiplicité notée
en bas à gauche de chaque case pour tenir compte des répétitions.
Cela conduit à un résultat du même ordre: 281/462= 0.61.
A discuter : problème des totaux marginaux, nécessité
de trouver des coefficients globaux !
2) Différence de profils
Le coefficient Chi-2 mesure la distance du tableau obtenu à un
tableau où les profils sont semblables. Plus cette distance sera
grande et plus la probabilité d'obtenir cette configuration "au
hasard" sera faible.
Résultat : Chi-2 = 0.78 ; df = 2 ; p = 0.68. On ne peut
conclure à une différence de profils.
3) Les résultats des filles sont-ils meilleurs ?
Utilisation du coefficient S qui mesure la "diagonalité" du tableau.
Résultat : S de Kendall = -6 ; correction = 3.5 ; sigma
= 10.23 ; z = 0.24 ; p = 0.40. On ne peut conclure à un
niveau global plus élevé des filles.
Même situation avec d'autres valeurs
faible moyen élevé
fille 1 5 1
garçon 5 1 5
|
Chi-2 = 7.48 ; df = 2 ; p = 0.023 ; on peut admettre
une différence de profils (au niveau de signification 0.05)
S = 0 ; p = 0.5 ; les résultats des filles ne sont pas plus
élevés (!)
|
faible moyen élevé
fille 0 2 2
garçon 2 1 0
|
Chi-2 = 4.28 ; df = 2 ; p = 0.12 ; classiquement on ne
peut admettre une différence de profils
S = -10 ; p = 0.08 ; les résultats des filles sont plus élevés
(résultat significatif au niveau 0.1)
|
p-value et calcul de l'effet
A ne pas confondre "degré de signification" et grandeur de "l'effet"
!
| données |
faible moyen élevé
fille 0 2 2
garçon 2 1 0
|
faible moyen élevé
fille 0 2 3
garçon 3 1 0
|
| p- value |
S = -6 ; p = 0.08 |
S = -18 ; p = 0.026 |
| effet |
Delta = -0.83 |
Delta = -0.9 |
Problème de l'interaction
faible moyen élevé
-classe1
fille 0 2 2
garçon 2 1 0
-classe2
fille 0 2 3
garçon 3 1 0
Problème : la différence entre fille et garçon (relevée
dans la classe 1 et la classe2) est-elle supérieure dans la classe
2 ?
C'est un schéma d'analyse de variance (utilisation du coefficient
L de Meddis).
Effets simples
Classe : Lclasse = -17.00 ; pclasse = 0,5 ; la
classe 2 n'est pas meilleure que la 1.
Sexe : Lsexe = 72 ; psexe = 0.001 ; les filles
sont meilleures que les garçons
Interaction
| Classe x sexe : Li = -11 ; pi = 0.27 ; la différence entre
filles et garçons de la classe 2 ne peut pas être considérée
comme plus importante que celle observée dans la classe 1.
|
 |
|