Théorie des réponses aux items (TRI ou IRT)

Modèle statistique développé dans la deuxième moitié du 20e siècle qui permet notamment de faire face à des problèmes auxquels la théorie classique de la mesure n'apporte pas toujours des réponses satisfaisantes. Ainsi par exemple, l'évaluation des propriétés techniques d'un item (par le calcul de certains indices : de difficulté ou de discrimination) fournit des résultats qui sont toujours relatifs à l'échantillon particulier d'individus auquel l'item a été administré (plus généralement, relatifs aux conditions dans lesquelles l'opération a été réalisée: moment, contexte, etc.). De ce fait, un item jugé facile ou difficile au sein d'un échantillon d'individus, peut ne plus l'être (ou ne plus l'être autant) s'il était appliqué à un échantillon différent.
Par rapport à ce genre de situation, la théorie des réponses aux items (TRI ou IRT dans la littérature anglophone) s'efforce de produire une évaluation des propriétés de l'item qui soit indépendante d'un groupe particulier d'individus. En d'autres termes, il s'agit de parvenir à l'élaboration d'instruments de mesure dont les caractéristiques ne soient pas excessivement influencées par tel ou tel autre groupe de référence: ce qui, d'une certaine manière, conduit à définir des échelles qualifiées parfois d'"absolues".
Les premières tentatives visant à élaborer des échelles de ce genre remontent au début des années '50 (échelles de Guttman). A l'origine, elles reposaient sur un modèle (conceptuellement difficile à justifier) de nature entièrement déterministe, qui, par la suite, a été remplacé par des modèles beaucoup plus réalistes, de type probabiliste. Ces modèles sont fondés sur le postulat que la réponse d'un individu à l'item (et notamment sa probabilité de fournir une réponse correcte) est déterminée - ou peut être expliquée - par deux sortes de facteurs:

    • d'une part, certains attributs du sujet (sa compétence par exemple), qui, n'étant pas directement accessibles à l'observation et à la mesure, sont généralement qualifiés de traits latents;

    • d'autre part, les propriétés de l'item lui-même, notamment, sa difficulté, son pouvoir de discrimination, sans oublier le rôle que la "chance" (réponses "au hasard") peut jouer dans certains cas.

    La réponse fournie à l'item est donc considérée comme une fonction des caractéristiques de l'individu et des caractéristiques de l'item. On postule par ailleurs (du moins dans la plupart des applications) que tous les items appartenant à l'instrument utilisé (test, épreuve) permettent d'appréhender une même caractéristique sous-jacente, et que les réponses à ces items sont affectées d'une erreur de mesure aléatoire.
    Sur le plan technique et mathématique, la théorie des réponses aux items utilise des modèles à un, deux ou trois paramètre(s), qui établissent la relation fondamentale entre le trait latent de l'individu (son niveau de compétence par exemple) et la probabilité pour cet individu de réussir un item donné. Cette relation est formalisée par une fonction (appelée fonction caractéristique de l'item), et peut être représentée géométriquement par une courbe (la courbe caractéristique de l'item). La forme la plus simple de cette fonction est celle qui repose sur le modèle de Rasch.
    Dans le cadre général qui vient d'être esquissé, l'objectif de la méthode est double, ces deux visées étant poursuivies simultanément. Il s'agit, d'une part, d'estimer les propriétés métriques des items (calcul des paramètres dits de difficulté, de discrimination et, éventuellement, de pseudo-chance) et, d'autre part, d'estimer le niveau de l'individu par rapport au trait latent considéré. Par ailleurs, ces estimations sont supposées indépendantes des échantillons particuliers (d'individus d'une part et d'items de l'autre) à partir desquels l'étude est réalisée.   

     

     

     

     

     

    powered by /boomerang