Université de NeuchâtelSéminaire de Psychologie |
|||||||||||||||||||||||||||||||||||||||||||||||||||||||
| FAQ ANASTAT | |||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
96.1: L'ancienne version demandait de choisir (pour le calcul de K, par exemple) entre plan simple et plan factoriel. Ce n'est plus le cas de la nouvelle version, pourquoi? Anastat procède automatiquement à une analyse simple si l'objet sélectionné est un tableau et à une analyse selon le plan factoriel si l'objet est une "boîte". 96.2: Quelle méthode adopter pour entrer une famille de tableaux? Ouvrir l'éditeur et entrer les tableaux sous la forme: <le nom du tableau> TABLEAU <les données> ; (la mise en page n'a pas d'importance. Par exemple: tab1 TABLEAU f m e C1 2 0 4 C2 0 4 0 C3 0 0 4 ; Puis de choisir dans le menu "objets" la rubrique "compiler/standard/auto". On aura compris que tab1 TABLEAU f m e C1 2 0 4 C2 0 4 0 C3 0 0 4 ; peut aussi s'écrire tab1 TABLEAU
96.3: L'impression du contenu de l'éditeur semble fonctionner de façon aléatoire (c'est aussi une impression :-) ! En effet, c'est le texte avant modification qui est imprimé. Il suffit de sauver le contenu de l'éditeur pour que l'impression corresponde au contenu. Ce "bug" est corrigé dans la version 3.22 97.1: Qu'en est-il de la correction de continuité dans le calcul du S pour les tableaux à n lignes et 2 colonnes. Cette correction est la même que pour les tableaux 2xn. Le logiciel prenait 1 comme correction. Cette erreur a été corrigée.
97.2: Pourquoi est-il possible dans les modèles de se référer aux nombres entiers par ENTIER ou <entier> alors que cela n’est pas le cas pour les vecteurs (seul <vecteur> est admis)? Cela est dû au fait que le nom vecteur recouvre toute une famille d’objets (des vecteurs de toutes les dimensions). Cela est également le cas pour les autres objets non élémentaires mais prédéfinis tableau, boite, hyper. Ce travail de définition est donc à la charge de l’utilisateur. Si, par exemple, les tableaux de dimension 2x8 sont souvent utilisés, on pourra créer un modèle TABLEAU 2 8 et le nommer tableau28.
97.3: Quelle relation alors avec le mot VECTEUR que l’on écrit dans les données d’objet? Dans ce cas le mot VECTEUR représente une étiquette permettant d’orienter le contrôle des données. Cette étiquette n’est d’ailleurs pas nécessaire lorsque la compilation est effectuée à l’aide d’un modèle.
97.4: Quelle différence entre les deux manières ci-dessous de présenter une famille d’objets? A) o1 VECTEUR c i c 5 11 16 ; TABLEAU nc i c f 2 4 6 d 3 7 10 ; o2 BOITE nc i c-garçon f 2 4 6 d 3 7 10-fille f 3 6 6 d 6 4 3 B) [ VECTEUR c i c 5 11 16 ; TABLEAU nc i c f 2 4 6 d 3 7 10 ; BOITE nc i c-garçon f 2 4 6 d 3 7 10-fille f 3 6 6 d 6 4 3 ] Dans le cas A), objets seront créés. Le cas B) ne définit qu'un seul objet, consistant en une liste de trois composantes.
97.5: Comment obtenir une information sur le nombre d’arguments donnés dans l’exemple du tableau 11 (page 8 du manuel) ? Il y a plusieurs solutions possibles. En particulier on peut utiliser le filtre [* ; * ; @*]. On voit ici que le résultat n’est pas un nombre, mais un symbole. C’est une caractéristique du système.
97.6: Comment obtenir l’ensemble des mots utilisés sur un ensemble de données? Cela peut être utile avant de créer un dictionnaire. La première idée est d’utiliser le filtre: [* ; @!*]. Mais ce traitement ne convient pas. Les filtres sont réservés à compter des enregistrements (à sélectionner des enregistrement présentant un profil donné) et non à comptabibliser des éléments contenus dans ces enregistrements. Il faudra utiliser ici la rubrique répétition et globaliser le résultat sur l’ensemble des enregistrements. On va traiter un exemple avec des enregistrements relativement riches qui suivent le modèle suivant: [ (IDENT , LISTE IDENT) ; (IDENT , LISTE IDENT) ; (IDENT , LISTE IDENT) ; (IDENT , LISTE IDENT) ; (IDENT , LISTE IDENT) ; (IDENT , LISTE IDENT) ] Voici un enregistrement correspondant à ce modèle avec tout d’abord une identification du sujet, puis un certain nombre de mots induits par des mots inducteurs. [ ( identification , {pf;"4";"2";f;"15";i;si;ch;a;a1;m15}); (maître, (école, (francais, ( math, (élève, Supposons que nous voulons faire la liste de tous les mots liés à maître. Les opérations à effectuer sont les suivantes: sélectionner tout / extraire item 2 / effacer les objets sélectionnés / sélectionner tout / extraire item 2. Dès ce moment les objets ne contiennent plus que la liste des mots associés à maître (attention à ne pas sauver la base si une sauvegarde de l’ensemble n’a pas été préalablement effectuée!). Ensuite, il suffit de cocher l’option Regrouper et résumer et de lancer l’opération répétitions.
97.7: Comment utiliser les données qui sont produites par un autre programme (SPSS, par exemple) ? Il y a plusieurs méthodes possibles à partir d'un fichier (format ASCII) produit par un autre programme. Méthode 1: Chargez le fichier dans l'éditeur (rubrique Charger texte du menu Projet). Il est possible de procéder dans cet éditeur à une mise au point. Puis il suffit de sélectionner Compiler du menu Objets. Méthode 2: Par "copier/coller" à partir d’un texte écrit dans un autre logiciel (Word, par exemple) dans un éditeur ouvert par Ouvrir éditeur du menu Projet.
97.8: Quel nombre maximum d’objets le système est-il capable de traiter? Ces limites ne sont pas clairement définies, cela va dépendre de la mémoire et de la rapidité d’exécution de l’ordinateur utilisé. Des travaux ont été réalisés avec 120 observations, chacune ayant environ 1000 caractères. Une autre limite est aussi liée au nombre de mots de vocabulaire dans le dictionnaire. Ces mots étant indexés, la table d’indexage fournit une certaine limite qui n’a pas encore été atteinte. L’éditeur, quant à lui, n’accepte que les textes qui ne dépassent pas 64000 caractères. Dans le cas de gros travaux, il ne sera pas possible d’afficher directement les résultats, il faudra d’abord les sauver dans un ficher avant de les reprendre par un autre système. Le tri de grands tableaux peut également poser quelques problèmes de mémoire.
97.9: Comment obtenir la distribution exacte du S liée à un tableau ? Sélectionnez le tableau et utilisez la rubrique K ou S possibles puis S du menu Analyse. Un nouvel objet est créé auquel il suffit d’appliquer le traitement Analyse / Répétitions. Il ne vous reste plus qu'à afficher la sélection.
97.10: Pourquoi est-il possible de chercher toutes les valeurs de K ou S possibles alors que cela n’est pas possible pour d’autres coefficients? C’est possible en suivant une voie moins directe que celle offerte par ce menu qui concerne les coefficients principaux et qui se trouve également être un vestige d’une version précédente. Il faut pour cela commencer par compiler un tableau (à faibles effectifs !) et le sélectionner. Puis chercher tous les patterns possibles. Puis sélectionner tous les tableaux obtenus (en déselectionnant le tableau initial). Puis cocher l’option regrouper et enclencher la fonction Coefficients seuls avec le coefficient souhaité. Le résultat est une liste des valeurs possibles du coefficient choisi avec les contraintes indiquées.
97.11: Quelle différence peut-on observer entre les résultats donnés par le test du Chi-2 et un test basé sur le S de Kendall ? Première remarque, les tests basés sur le S de Kendall et celui du Chi-2 ne mesurent pas le même effet. Le Chi-2 cherche à mettre en évidence une différence de profil entre deux groupes, le S de Kendall mesure un effet de diagonale. Toutefois, en général, "Kendall significatif" implique "Chi carré significatif", mais il y a des exceptions. Dans le cas ci-dessous, le test de Jonkheere (basé sur le S de Kendall) donne une valeur de p égale à 0,26, alors que le Chi-2 produit un p de 0,57. Il y a un certain effet diagonal mais les profils sont semblables. 1 1 0 0 1 Dans ce deuxième cas, c'est le contraire qui se produit: S=0 et donc p > 0,5 alors que le Chi-2 conduit à p = 0,29. 1 0 1 0 1
97.12: Est-il possible que le gamma soit petit alors qu'un test basé sur le S est significatif ? La logique des "p-value" et celle des coefficients "gamma" n'est pas la même. Le rapport de l'un à l'autre fait intervenir l'écart type et le nombre d'observations. Une "p-value" n'est valable que pour un tableau donné. Alors que le "gamma" permet de dire "combien de fois" un effet d'un tableau est plus important que celui d'un autre. Si le nombre d'observations est élevé et que l'écart type est assez important on peut avoir un Kendall significatif bien que l'effet observé soit faible (gamma petit).
97.13: Si l'effet observé est grand (|gamma| > 0,70), le test sera-t-il significatif? Le tableau suivant montre le contraire: gamma = -0,755, p = 0,11: 2 11 4 4 La contradiction apparente est liée au grand nombre de sujets pour la deuxième case de la première ligne. La liberté pour obtenir des patterns du même type n'est pas très grande d'où un S peu significatif. Mais gamma prend en compte l'égalité comme un effet positif. D'où un effet important. Le coefficent "delta", presque équivalent à "gamma" mais qui ne prend pas en compte les cas d'égalité, vaut ici -0,44. Il est nettement plus faible. Du point de vue méthodologique, il est tout à fait concevable qu'un grand effet soit observé, mais que, vu la distribution particulière des résultats, il ne peut pas être considéré comme « significatif »!
97.14: Des sujets effectuent un pré-test puis un post-test. Comment apprécier la progression des sujets d’un test à l’autre? Les données seront du type: [2 ; 3]. Le traitement à appliquer va dépendre de l’hypothèse. Si une hypothèse de progression est faite, on pourra utiliser le test de Wilcoxon sur la différence entre le premier score (item 1) et le deuxième (item 2) avec 0 comme valeur de coupure. Si l’hypothèse est plutôt la stabilité on peut utiliser un test basé sur le S de Kendall sur le tableau obtenu par croisement item1 x item2.
97.15: Des sujets effectuent un pré-test, puis sous deux conditions expérimentales différentes un post-test. Comment apprécier l’effet de la condition expérimentale sur la progression des sujets d’un test à l’autre? Les données seront du type: [c1 ; 3 ; 4] avec la condition expérimentale suivie des deux résultats (considérés comme des rangs). Il y a plusieurs méthodes (outre les analyses de variances conventionnelles si le nombre de sujets et la mesure donnée par les tests le permettent) qui vont dépendre des hypothèses faites. On peut, par exemple: effectuer la différences entre l’item 3 et le 2, établir le tableau croisé « condition expérimentale x différence » et analyser ce tableau à l’aide d’un test basé sur le S. Une autre méthode consiste à analyser la boîte « condition expérimentale x item 1 x item 2 » à l’aide du test basé sur le S de Kendall.
97.16: Comment utiliser le S de Kendall dans le cas d'un plan factoriel ? Exemple d'utilisation avec des données tirées d'une recherche de Alain Brossard (1990) qui étudie le lien entre niveau atteint par des sujets dans les épreuves opératoires piagétiennes (échelle ordinale) leur sexe ou le sexe de l'expérimentateur. Effet regard (global)
S de Kendall = 539 ; correction = 27 ; sigma = 305.88 ; z = 1.674 ; p = 0.0471 Commentaire: Un effet avec p < 0.05 est constaté. Effet regard dans des sous-groupes constitués selon le sexe des sujets
S1 = 99 ; S2 = 187 ; SI = -88 ; p1 = 0.2105 ; p2 = 0.0224 ; pI = 0.2854 Commentaire: l'effet observé précédemment, apparaît avec un coefficient significatif dans le sous-groupe de filles et non significatif pour les garçons. Il n'y a pas d'effet "croisé". Effet regard dans des sous-groupes constitués selon le sexe de l'expérimentateur
S1 = 143 ; S2 = 120 ; SI = 23 ; p1 = 0.0816 ; p2 = 0.1475 ; pI = 0.4405 Commentaire: il n'y a pas d'effet significatif dans aucun des deux sous-groupes. Cette "bizarrerie" est certainement due à la combinaison d'un effet faible et à la diminution du nombre des états possibles.
97.17: Problème de l'unité d'analyse: On a examiné le nombre d’arguments logiques donné par deux groupes à l’aide du tableau ci-dessous qui donne le nombre de sujets avec 2 arguments, 3 arguments, etc.
Pourquoi ne pas avoir plus simplement comptabilisé les arguments logiques par groupe:
Cela semble permettre de gagner une dimension et de pouvoir ventiler les résultats selon le types d’arguments:
On notera que l’on a changé d’unité d’analyse, dans le premier cas, il s’agit de la comparaison de deux groupes (et le nombre des cas répertoriés est bien le nombre total de sujets). Dans le deuxième cas, ce sont les arguments qui constituent l’unité d’analyse. Mais la répartition de ces arguments à l’intérieur de ces groupes est perdu. On analysera donc la différence de types d’arguments utilisés, mais on ne pourra rien dire entre les groupes.
98.1 : Dans le document "statistiques et sciences humaines" (dossiers de psychologie n° 38), pages 9 et 10, le nombre de tableaux générés n'est-il pas trop faible ? En effet, il faudrait encore ajouter les multiplicités de chaque tableau liées à la présence d'ex aequo pour chacun des rangs. Ces multiplicités sont pour les treize tableaux page 9: 4, 18, 12, 1, 3, 36, 54, 12, 9, 36, 18, 3, 4. La valeur exacte de p est donc de 79/210 Pour les cinq tableaux de la page 10, ces multiplicités valent: 1, 24, 90, 80, 15. Donc p = 195/210. On note que les valeurs exactes de p sont proches des approximations données. En particulier, la conclusion concernant le pouvoir "falsificateur" des structures reste valable. Les valeurs exactes ont l'avantage de montrer la "finesse de grain" de la structure.
00.1 : Quelle est l'utilité des distributions exactes ? En principe, une distribution exacte permet de calculer des probabilités sans passer par l'artefact que constitue le passage par des distributions approchées. Cette question en appelle une autre (voir note 98.1) quant à la façon de calculer une distribution exacte. Par exemple la table suivante a pour statistique de Kendall: a b
c1 1 3 4
c2 3 0 3
4 3 7
S = -9 ; correction = 3.5; sigma = 4.9; z = 1.1227; p = 0.131
Une démarche exacte nous conduit à considérer les 4 tables possibles (qui ont mêmes totaux marginaux) : 1 3 2 2 3 1 4 0
3 0 2 1 1 2 0 3
S -9 -2 5 12
Il apparaît donc une distribution du S à 4 valeurs (distribution 1 1 1 1) et donc une probabilité p = 1/4. Toutefois, cette démarche, parfois rencontrée ne prend en compte les permutations internes dans les groupes et donne une valeur exagérée de p. Ainsi, il y aurait 4 manières possibles de choisir l'élément figurant dans la case supérieure gauche du premier tableau. La distribution exacte du S serait donc plutôt: 1 3 2 2 3 1 4 0
3 0 2 1 1 2 0 3
S -9 -2 5 12
Nb permutations: 4 6*3=18 4*3=12 1
Ce qui conduit à une valeur de p=4/35= 0.11. Elle est inférieure à la valeur approchée. Dans ce cas on a fait l'hypothèse d'une répartition fixe entre c1 et c2 et aléatoire entre a et b. 02.1 Est-il possible de compiler en même temps plusieurs filtres, modèles, etc. Non dans cette version. Mais c'est une bonne idée. Une version ultérieure pourrait travailler avec des fichiers sources contenant des sections (objet, filtre, modèle, etc.). De plus, il faudra pouvoir ajouter le nom des filtres et des modèles. O2.02 La notion de filtre est difficile à saisir. Peut-on faire des tableaux croisés classiques avec cet outil ? Oui, cela ce présenterait de la façon suivante: les données sont constituées de suites régulières avec chaque fois, par exemple, le sexe (codé 1 ou 2), la condition expérimentale (codée 1 ou 2) et trois réponses (codées a, b ou c). e1 [1; 1; a; b; c]; e2 [1; 2; b; c; a]; e3 [2; 1; c; a; b]; e4 [2; 2; a; b; c]; e5 [2; 2; b; c; a] Nous voulons, par exemple, regarder les réponses à la première question en fonction du sexe. Les deux filtres nécessaires sont: [!*;*;*;*;*] [*;*;!*;*;*] Après avoir activé l'option 'Regrouper et résumer' et utiliser la rubrique 'Filtrage d'objets' du menu 'Analyse' on obtient le tableau croisé: sexe x q1 "*;*;c;*;*" "*;*;b;*;*" "*;*;a;*;*" "2;*;*;*;*" 1 1 1 "1;*;*;*;*" 0 1 1 C'est moins lisible que dans les logiciels "classiques". Il manque en particulier l'information des filtres utilisés (sexe x q1 a été ajouté après coup :). Une prochaine version pourrait combler cette lacune. L'avantage des filtres est de pouvoir également utilisé pour la sélection une partie de l'information enregistrée dans la cellule et de pouvoir travailler sur des séquences de longueurs différentes. Les données se trouvent dans 'standard.apt'.
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Dernière mise à jour: Thu, 11 Jul 2002 18:54:46 GMT. |