Approche des méthodes numériques pour la recherche en sciences humaines


Présupposés épistémologiques et philosophiques

Qu'est-ce qu'un résultat scientifique ? Qu'est-ce que la méthode scientifique ? Qu'est-ce que le hasard ?

Schémas de "validation"

Approche par preuve Sciences "formelles" Théorème
Approche par réfutation
Popper /Fisher
"Design" d'expériences, Méthode de l'hypothèse nulle
Approche par choix entre des alternatives Pearson Prise de décisions en gestion
Approche par niveaux de certitude (ou de confiance) Bayes Faisceau d'indices
Approche "entropique" (Hartley, Shannon) Kullbach Calcul de l'apport d'information (= évènement rare)

Approche mixte, construction de théorie hypothétique et réfutation sur le long terme (astrophysique)

Techniques de base

Logique
Formalisation  selon diverses appproche du raisonnement
Etablissement de règles d'inférences
Calcul des probabilités Théorie traitant des "lois" du hasard. Différentes approches de la notion de probabilité: fréquence limite, axiomatique, probabilité "subjective".
Statistique Ensemble de techniques d'interprétation mathématique appliquées à des phénomènes pour lesques une étude exhaustive de tous les facteurs est impossible à cause de leur grand nombre ou de leur complexité. A distinguer les statistiques paramétriques et non paramétriques. Définition "d'indicateurs" (coefficients numériques, courbes, etc.): répétition, fréquence, moyenne, écart type, chi-2, K, distribution, corrélation, interraction, etc.
Théorie de l'information Mesure de l'apport d'une information par rapport à un ensemble d'hypothèses donné. Entropie, liaison avec l'analyse "loglinéaire".

Les "obstacles"

Biais cognitifs: Loi des grands nombres (Bernouilli) et "loi" des petits nombres (Tversky & Kahneman, 1973), valeur absolue et relative

Biais perceptifs et "affectifs" : Signification et sens, possibilité de mémorisation, perte et gain.

Exemple de schéma (hypothèse nulle)

But: mettre en évidence un comportement "général" d'une population

Modèle de l'échantillonnage

  1. Choix d'une hypothèse H0;
  2. Choix d'une "structure" adéquate;
  3. Fabrication d'un échantillon "sans biais";
  4. Observation du pattern obtenu et calcul de la p-value (probabilité que le pattern soit observé étant donnée H0). Cette observation se réduit souvent au calcul d'un coefficient (chi-2, F, etc.);
  5. Rejet de H0 si p est faible.

Modèle des populations limitées

  1. Choix d'une hypothèse H0;
  2. Choix d'une "structure" adéquate;
  3. Observation du pattern obtenu et calcul de la p-value (probabilité que le pattern soit observé étant donnée H0);
  4. Si p est faible discussion des raisons possibles (hypothèses auxiliaires) et comparaison avec d'autres cas similaires.

Conseil avant de commencer une recherche : Etre conscient du cadre général, les méthodes numériques sont-elles utilisées de façon essentielle ou comme garde-fou ? choix des bons instruments (coefficients), établissement d'un plan (prévision des étapes).

L'outillage de base

Statistiques inférentielles

Analyse de variance Description Met en évidence une différence entre des groupes
  S'applique à Population avec une mesure métrique (p. ex. note) et critères d'appartenance à un groupe
  Usage type, exemple Comparaison des résultats obtenus en fonction de la méthode d'instruction utilisée (ou du sexe, ou des deux)
  Remarque Différents plans factoriels possibles, le "t" de Student rend un service semblable dans le cas de la comparaison de 2 groupes
Test du Chi2 Description Compare des fréquences obtenues à des données "moyennes"
  S'applique à Tableaux de contingence
  Usage type, exemple Comparaison de deux distributions
  Remarque D'autres coefficients sont mieux adaptés si des effets spécifiques (tendance diagonale par exemple) sont à mettre en évidence
Analyse Loglinéaire Description Etude de "patterns" d'association entre des variables nominales
  S'applique à Tableaux de contingence
  Usage type, exemple Analyse de tables de fréquences
  Remarque Extension du test du Chi2 pour des tables de dimensions quelconque. Utilises des concepts similaire à ceux de l'analyse de variance.

Statistiques descriptives

Analyse "cluster" (ou hiérarchique) Description Fabrique des groupes
  S'applique à Observations multivaluées
  Usage type, exemple Classement de textes en fonction des concepts inclus
  Remarque Différents critères de similitude sont possibles
Analyse factorielle Description Mise en évidence de "grands axes" (variables "virtuelles") . Calcul de corrélations multiples
  S'applique à Observations multivaluées
  Usage type, exemple Mise en évidence des traits mesurés par une batterie de test
  Remarque De nombreuses variantes existent (analyse en composante principale, analyse de correspondance, etc.)

Les "progiciels"

Les méthodologies (protocoles complexes) dédiées

Quelques fiches techniques et exemples sur: http://www.irdp.ch/recherche/methodologie.html

Luc-Olivier Pochon / mai 2005