Brève présentation de la méthode

 

 

La théorie des réponses aux items est un modèle statistique de la mesure relativement récent (deuxième moitié du 20e siècle) qui permet notamment de faire face à des problèmes auxquels la théorie psychométrique classique n'apporte pas toujours des réponses et des solutions satisfaisantes. Ainsi par exemple, l'évaluation des propriétés techniques d'un item (par le calcul de certains indices: de difficulté ou de discrimination notamment) fournit des résultats qui sont toujours relatifs à l'échantillon particulier d'individus auquel l'item a été administré. De ce fait, un item jugé facile ou difficile au sein d'un échantillon, peut ne plus l'être (ou ne plus l'être autant) s'il était appliqué à un échantillon différent.

Par rapport à ce genre de situation, la théorie des réponses aux items (TRI ou IRT dans la littérature anglophone) s'efforce de produire une estimation des propriétés de l'item qui soit indépendante d'un groupe particulier d'individus. En d’autres termes, elle cherche à élaborer des instruments de mesure dont les caractéristiques ne soient pas excessivement influencées par tel ou tel autre groupe de référence: ce qui, d'une certaine manière, conduit à définir des échelles qualifiées parfois d'"absolues".

 

Les premières tentatives visant à élaborer des échelles de ce genre remontent au début des années 50 (échelles de Guttman). A l'origine, elles reposaient sur un modèle (conceptuellement difficile à justifier) de nature entièrement déterministe, qui, par la suite, a été remplacé par des modèles beaucoup plus plausibles, de type probabiliste. Ces modèles sont fondés sur le postulat que la réponse d'un individu à l'item (et notamment sa probabilité de fournir une réponse correcte) est déterminée - ou peut être expliquée - par deux sortes de facteurs:

 

 

·

d'une part, certains attributs du sujet (sa compétence par exemple), qui, n'étant pas directement accessibles à l'observation et à la mesure, sont généralement qualifiés de traits latents;

 

 

·

d'autre part, les propriétés de l'item lui-même: en particulier son degré de difficulté, son pouvoir de discrimination, sans oublier le rôle que la "chance" (réponses "au hasard") peut jouer dans certains cas.

 

 

La réponse fournie à l'item est donc considérée comme une fonction des caractéristiques de l'individu et des caractéristiques de l'item. On postule par ailleurs (du moins dans la plupart des applications) que tous les items appartenant à l'instrument (test, épreuve, échelle, etc.) permettent d'appréhender une même caractéristique "sous-jacente" (exigence d’unidimensionnalité: voir page 12 ci-après), et que les réponses à ces items sont affectées d'une erreur de mesure aléatoire.

Sur le plan technique et mathématique, la théorie des réponses aux items utilise des modèles (équations) à un ou à plusieurs paramètre(s), qui établissent la relation entre le trait latent (niveau de compétence par exemple) et la probabilité de réussir un item. Cette relation est formalisée par une fonction (appelée fonction caractéristique de l'item), et peut être représentée graphiquement par une courbe (la courbe caractéristique de l'item).

 

Dans le contexte général qui vient d'être esquissé, l'objectif de la méthode est double, ces deux visées étant parfois poursuivies simultanément. Il s'agit, d'une part, d'estimer les propriétés métriques des items (calcul des paramètres dits de difficulté, de discrimination et, éventuellement, de pseudo-chance) et, d'autre part, d'estimer le niveau auquel chaque individu possède le trait latent (paramètres des individus).

Par ailleurs, ces estimations sont supposées indépendantes des échantillons particuliers (d'individus d'une part et d'items de l'autre) à partir desquels l'étude est réalisée (propriété d’invariance: voir page 11).

 

 

Remarque :

L’exposé qui suit se réfère au cas fréquent en sciences de l’éducation où l’on est en présence d’un test ou d’une épreuve d’aptitude, de connaissance, de compétence, etc. La méthode peut toutefois s’appliquer aussi à d’autres instruments, et notamment à des échelles de toute sorte: d’intérêt, d’attitude ou de motivation par exemple.