/ Décomposition (de la variance, de la variabilité d'un phénomène)

Décomposition (de la variance, de la variabilité d'un phénomène)

Certaines méthodes statistiques (et notamment l' analyse de la variance) permettent de décomposer la variance (ou variabilité) totale d'un ensemble de résultats en deux ou plusieurs "sources" de variation, selon l'origine présumée des différences observées entre les scores individuels. En effet, ces différences peuvent être attribuées soit à des variables ou combinaisons de variables dont on souhaite étudier l'influence dans une situation donnée, soit aux inévitables fluctuations aléatoires de l'échantillonnage.
Ainsi, dans le cas très simple où l'on considère les résultats d'un groupe d'élèves à une épreuve de connaissance, on peut décomposer la variabilité totale de ces résultats en deux parties. Nous avons d'abord la part de variance due à l'effet d'une variable (d'un facteur) dont on se propose d'étudier l'influence: par exemple le sexe (avec les différences observées entre garçons et filles), l'origine sociale, la méthode pédagogique utilisée, etc. On parle à cet égard de variance systématique ou '"expliquée" (par le facteur qu'on étudie). Toutefois, la variance totale comprend aussi une deuxième composante, qui n'est pas expliquée par la variable ou le facteur considéré (par le fait d'appartenir à tel groupe plutôt qu'à tel autre), car elle intervient au sein même des différents groupes (par exemple entre garçons d'une part et entre filles d'autre part). Cette composante ne peut jamais être éliminée complètement puisqu'elle résulte simplement du fait que les individus sont tous différents les uns des autres, quelle que soit l'homogénéité du groupe auquel ils appartiennent. Elle est souvent qualifiée de variance d'erreur ou de variance aléatoire, résiduelle, inexpliquée.

La démarche qui vient d'être résumée s'applique naturellement aussi lorsque l'on est en présence de situations plus complexes, au sein desquelles on souhaite étudier simultanément l'effet de plusieurs facteurs sur les résultats observés. Dans ces cas on pourra non seulement attribuer à chaque facteur la part de variance totale qu'il est susceptible d'expliquer, mais on pourra également déterminer la part de variance due à l'action conjointe de deux ou de plusieurs facteurs (interactions). Par ailleurs, à côté de ces différentes sources de variation systématique, il restera toujours une portion de variance inexpliquée ou résiduelle, d'origine aléatoire.
Cette décomposition de la variance joue un rôle essentiel en statistique car elle permet de traiter un grand nombre de problèmes a priori de nature très différente. Parmi les méthodes qui permettent d'évaluer la qualité d'un dispositif d'évaluation ou de mesure, la théorie de la généralisabilité repose précisément sur une décomposition de cette nature. On est ainsi amené à estimer et à distinguer deux grandes composantes de la variance observée: une variance dite de différenciation (ou variance "vraie") et une variance d'instrumentation (ou d'"erreur").