|
|
Brève présentation de la méthode
|
|
|
La théorie des réponses aux
items est un modèle statistique de la mesure relativement récent (deuxième
moitié du 20e siècle) qui permet notamment de faire face à des problèmes
auxquels la théorie psychométrique
classique n'apporte pas toujours des réponses et des solutions
satisfaisantes. Ainsi par exemple, l'évaluation des propriétés techniques
d'un item (par le calcul de certains indices:
de difficulté ou de discrimination notamment)
fournit des résultats qui sont toujours relatifs à l'échantillon particulier
d'individus auquel l'item a été administré. De ce fait, un item jugé facile
ou difficile au sein d'un échantillon, peut ne plus l'être (ou ne plus l'être
autant) s'il était appliqué à un échantillon différent. Par rapport à ce genre de
situation, la théorie des réponses aux items (TRI ou IRT dans la littérature
anglophone) s'efforce de produire une estimation des propriétés de l'item qui
soit indépendante d'un groupe particulier d'individus. En d’autres termes,
elle cherche à élaborer des instruments de mesure dont les caractéristiques
ne soient pas excessivement influencées par tel ou tel autre groupe de
référence: ce qui, d'une certaine manière, conduit à définir des échelles
qualifiées parfois d'"absolues". Les premières tentatives visant
à élaborer des échelles de ce genre remontent au début des années 50
(échelles de Guttman). A l'origine, elles reposaient sur un modèle
(conceptuellement difficile à justifier) de nature entièrement déterministe,
qui, par la suite, a été remplacé par des modèles beaucoup plus plausibles,
de type probabiliste. Ces modèles sont fondés sur le postulat que la réponse
d'un individu à l'item (et notamment sa probabilité de fournir une réponse
correcte) est déterminée - ou peut
être expliquée - par
deux sortes de facteurs: |
||
|
|
· |
d'une part, certains attributs
du sujet (sa compétence par exemple), qui, n'étant pas directement
accessibles à l'observation et à la mesure, sont généralement qualifiés de
traits latents; |
|
|
|
· |
d'autre part, les propriétés de
l'item lui-même: en particulier son degré de difficulté, son pouvoir de
discrimination, sans oublier le rôle que la "chance" (réponses
"au hasard") peut jouer dans certains cas. |
|
|
|
La réponse fournie à l'item est
donc considérée comme une fonction des caractéristiques de l'individu et des
caractéristiques de l'item. On postule par ailleurs (du moins dans la plupart
des applications) que tous les items appartenant à l'instrument (test,
épreuve, échelle, etc.) permettent d'appréhender une même caractéristique
"sous-jacente" (exigence d’unidimensionnalité: voir page 12
ci-après), et que les réponses à ces items sont affectées d'une erreur de mesure aléatoire. Sur le plan technique et
mathématique, la théorie des réponses aux items utilise des modèles (équations) à un ou à plusieurs
paramètre(s), qui établissent la relation entre le trait latent
(niveau de compétence par exemple) et la probabilité de réussir un item.
Cette relation est formalisée par une fonction (appelée fonction caractéristique de
l'item), et peut être représentée graphiquement par une courbe (la courbe caractéristique de l'item). Dans le contexte général qui
vient d'être esquissé, l'objectif de la méthode est double, ces deux visées
étant parfois poursuivies simultanément. Il s'agit, d'une part, d'estimer les
propriétés métriques des items (calcul des paramètres dits de
difficulté, de discrimination
et, éventuellement, de pseudo-chance)
et, d'autre part, d'estimer le niveau auquel chaque individu possède le trait
latent (paramètres des individus). Par ailleurs, ces estimations
sont supposées indépendantes des échantillons particuliers (d'individus d'une
part et d'items de l'autre) à partir desquels l'étude est réalisée (propriété
d’invariance: voir page 11). |
||
|
|
Remarque : |
L’exposé
qui suit se réfère au cas fréquent en sciences de l’éducation où l’on est en
présence d’un test ou d’une épreuve d’aptitude, de connaissance, de
compétence, etc. La méthode peut toutefois s’appliquer aussi à d’autres
instruments, et notamment à des échelles de toute sorte: d’intérêt,
d’attitude ou de motivation par exemple. |
|