|
|
Courbes d'information et erreur standard
|
|
|
a) La courbe d’information de l’item |
||||
|
|
Nous avons vu précédemment que
la fonction caractéristique d’un item permet de calculer, pour chaque niveau
de compétence (pour chaque valeur de thêta), la probabilité de réussir (et
donc aussi de ne pas réussir) l’item. A l’aide de ces probabilités et
des paramètres du modèle utilisé (difficulté, discrimination et
pseudo-chance), on peut définir la fonction d’information de l’item, représentée
graphiquement par la courbe dite d’information (CII: voir équation et
schéma ci-après). |
||||
|
|
Cette courbe montre sur quelle
portion de l’échelle des compétences (axe horizontal) le pouvoir informatif
de l’item est le plus élevé. |
|
|||
|
|
à un ou deux Voici l’équation qui définit la
fonction d’information d’un item et qui permet de construire sa courbe
d’information (on remarquera notamment que la "quantité"
d’information associée aux différentes valeurs de thêta ne dépend pas
directement du paramètre de difficulté): |
||||
|
|
|
||||
|
|
Ij(q) |
Information associée à l’item j au
point thêta sur l’échelle du trait latent; |
|||
|
|
Pj(q) |
probabilité qu'un individu possédant
à un certain degré (entre -3 et + 3) la caractéristique q
réponde correctement à l'item; |
|||
|
|
aj |
paramètre de discrimination (égal à 1 dans le modèle à un paramètre); |
|||
|
|
gj |
paramètre de pseudo-chance (égal à 0 dans les modèles à un ou deux
paramètres); |
|||
|
|
D |
constante à laquelle on attribue
habituellement la valeur 1.7. |
|||
|
|
b) La courbe d’information du test |
||||
|
|
A partir de la courbe d’information
établie pour tous les items qui composent un test, on peut définir la courbe
d’information du test lui-même (CIT: voir schéma). Elle s’obtient simplement en
additionnant, pour chaque valeur de thêta, les Ij(q) calculés pour les différents items:
Cette courbe montre notamment
sur quelle(s) portion(s) de l’échelle des compétences (axe horizontal) le
test est le plus informatif (le plus précis). |
|
|||
|
|
Dans l’exemple présenté ici, les
individus pour lesquels le test est le plus informatif sont ceux dont les
valeurs de thêta se situent entre 0 et +1.25 approximativement. c) L’erreur standard de la mesure |
||||
|
|
Comme nous l’avons déjà signalé, la notion d’information
permet également de définir l’erreur standard (ou erreur type) de la mesure. En théorie des réponses aux items, cette erreur n’est pas
la même pour toutes les valeurs possibles de l’échelle des compétences.
Contrairement à ce que postulent d’autres modèles de la mesure (théorie
classique ou théorie de la généralisabilité notamment), l’erreur varie en
effet d’une valeur à l’autre de thêta, comme on peut aisément le constater en
considérant la formule suivante (ES(q) = erreur standard de la mesure
pour une valeur donnée de thêta): |
||||
|
|
|
||||
|
|
On vérifie également que l’erreur est minimale pour les
scores situés dans la zone de l’échelle où le test est le plus informatif
(voir point b) ci-dessus), et qu’elle
augmente lorsqu’on s’éloigne de cette zone. De ce point de vue, l’erreur
standard peut également s’interpréter comme une mesure de l’incertitude
associée à la mesure, celle-ci étant d’autant plus grande que le pouvoir
d’information du test est faible. |
||||