Cours 7 Flashcards

(49 cards)

1
Q

Définition de la fidélité

A

La fidélité (reliability) d’un instrument de mesure psychologique désigne le degré de constance/cohérence/consistance, de stabilité temporelle et de précision des résultats obtenus lorsqu’un test est administré à plusieurs reprises ou dans des conditions comparables. Elle reflète la proportion de variance des scores observés qui peut être attribuée aux différences réelles entre les individus, plutôt qu’à l’erreur de mesure

En d’autres termes, un test fidèle est un test qui produit des scores similaires lorsqu’il mesure le même construit dans des conditions semblables.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Plan conceptuel de la fidélité

A

Sur le plan conceptuel, la fidélité repose sur l’idée que tout score observé (X) peut être décomposé en deux composantes principales :
X = V + E

où V représente le score vrai (valeur réelle du trait psychologique mesuré).

C’est ce que la personne obtiendrait si le test était parfaitement précis, sans aucune erreur de mesure. Par exemple : le véritable niveau d’anxiété, de motivation ou d’intelligence d’un individu) et E l’erreur de mesure (correspond à la différence entre le score observé et le score vrai. Elle résulte de facteurs aléatoires (fatigue, distraction, humeur, bruit) ou systématiques (items mal formulés, consignes ambiguës, environnement inadéquat).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

A quoi sert la formule de la fidélité

A

Ainsi, la formule X = V + E signifie que tout score observé est composé d’une partie vraie et d’une partie d’erreur. Lorsque la fidélité est élevée, la composante V domine (le score observé reflète bien les différences réelles). Lorsque la fidélité est faible, la composante E est importante — les scores varient pour des raisons qui ne sont pas liées au trait mesuré

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Que représente la fidélité ?

A

Ainsi, la fidélité représente la proportion de variance vraie contenue dans la variance totale des scores observés :

rvx’ = Var(V) ÷ Var(X)

Autrement dit, elle indique quelle part des différences entre les résultats des personnes correspond à des différences réelles dans le trait mesuré, et quelle part est due à l’erreur de mesure. Par exemple, si la fidélité d’un test est de 0,80, cela signifie que 80 % de la variance des scores reflète de vraies différences entre individus, tandis que 20 % est attribuable à l’erreur

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

De quoi dépend la fidélité

A

La fidélité ne dépend pas uniquement du test, mais surtout des scores obtenus dans un contexte précis : elle varie selon la population (âge, niveau de formation, homogénéité du groupe), les conditions d’administration (bruit, consignes, moment de passation) et la qualité des items. . Sur le plan pratique, la fidélité détermine le degré de confiance que l’on peut accorder à l’interprétation des scores.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

degré de confiance de la fidélité

A
  • Un coefficient élevé (p. ex. 0,80 ou 0,90) signifie que les différences observées traduisent principalement des différences réelles.
  • Une fidélité faible (p. ex. 0,50 ou moins) indique que les scores sont fortement influencés par des erreurs ou des facteurs aléatoires — l’interprétation doit alors être faite avec prudence.

check exemple

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Rôle de la fidélité dans la qualité psychométrique et l’interprétation des résultats

A

La fidélité occupe une place centrale dans l’évaluation de la qualité psychométrique d’un instrument de mesure. Avec la validité, elle constitue l’un des deux piliers essentiels sur lesquels repose toute interprétation correcte des scores. Elle détermine la précision avec laquelle un test mesure un construit psychologique donné — c’est-à-dire sa capacité à reproduire des résultats similaires dans des conditions semblables. Un instrument hautement fidèle permet de distinguer avec cohérence les différences réelles entre individus.

  • Plus la fidélité est élevée, plus la zone d’incertitude autour du score est étroite : on peut alors interpréter les résultats avec plus de confiance.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Sur le plan pratique, la fidélité agit sur :

A
  • La stabilité temporelle des résultats (test–retest) → Exemple : un inventaire de personnalité fidèle donnera des scores similaires lorsqu’il est repassé quelques semaines plus tard, tant que la personnalité de la personne n’a pas changé.
  • La cohérence interne entre les items mesurant le même construit → Exemple : si un test de motivation contient plusieurs questions sur l’effort et la persévérance, les réponses à ces questions devraient être fortement corrélées entre elles.
  • La fiabilité des comparaisons interindividuelles → Exemple : dans un contexte de sélection, une bonne fidélité garantit que si une personne A obtient un score supérieur à une personne B, cette différence traduit réellement une différence dans le trait évalué, et non une simple fluctuation due au hasard.
  • La sensibilité à détecter de vrais changements → Exemple : dans un suivi clinique, une amélioration du score après une thérapie reflétera un progrès réel seulement si le test est suffisamment fidèle pour ne pas confondre ce changement avec du bruit aléatoire
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Fidélité insuffisante

A

Une fidélité insuffisante compromet la valeur scientifique et éthique de l’instrument. Elle augmente le risque de fausses conclusions sur les aptitudes, les attitudes ou les traits d’une personne, ce qui peut entraîner des décisions injustes ou inappropriées

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Fidélité adéquate

A

. À l’inverse, une fidélité adéquate assure que les différences observées correspondent principalement à des différences véritables dans le construit évalué, renforçant ainsi la validité interprétative et la crédibilité scientifique du test

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

Facteurs influençant la fidélité

A
  1. Caractéristiques de l’instrument
  2. Caractéristiques de la population évaluée
  3. Conditions d’administration
  4. Temporalité et stabilité du construit
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Facteurs influençant la fidélité

Caractéristiques de l’instrument

A

La structure et la qualité des items constituent l’une des principales sources de variation de la fidélité. Des items ambigus, trop difficiles ou mal formulés introduisent de l’incohérence dans les réponses, réduisant la cohérence interne du test. À l’inverse, des items clairs, homogènes et bien représentatifs du construit favorisent la stabilité des résultats

Le nombre d’items joue également un rôle important : selon la théorie classique des tests, plus un instrument est long, plus il contient d’observations du même construit, ce qui réduit la part d’erreur aléatoire

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Facteurs influençant la fidélité

Caractéristiques de la population évaluée

A

La fidélité dépend aussi du profil du groupe testé. Une population trop homogène (par exemple, un groupe d’étudiants ayant tous un niveau de compétence similaire) présente une variance réduite des scores, ce qui tend à abaisser le coefficient de fidélité. Au contraire, une population plus hétérogène (par exemple, des individus de différents âges ou niveaux scolaires) permet de mieux détecter les différences réelles entre personnes, et conduit souvent à une fidélité plus élevée

Ainsi, la fidélité n’est pas une propriété fixe du test, mais une caractéristique relative à la variabilité du groupe observé.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

Facteurs influençant la fidélité

Conditions d’administration

A

Les conditions de passation ont un effet direct sur la stabilité des scores. Des perturbations externes (bruit, distractions, température, fatigue) ou des consignes floues introduisent des erreurs aléatoires, diminuant la fidélité observée. La relation examinateur–participant, la motivation des sujets et la standardisation de la procédure sont également déterminantes.

Une procédure rigoureusement standardisée — consignes identiques, temps chronométré, même matériel — garantit au contraire une meilleure constance des résultats.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

Facteurs influençant la fidélité

Temporalité et stabilité du construit

A

la fidélité dépend enfin de la nature du trait psychologique mesuré. Les construits stables (comme les traits de personnalité ou les aptitudes cognitives) produisent généralement des coefficients élevés au fil du temps. Les construits variables ou sensibles au contexte (comme la motivation ou l’humeur) présentent naturellement une fidélité temporelle plus faible, car ils changent réellement d’un moment à l’autre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Concepts fondamentaux

L’erreur aléatoire

Erreur de mesure : composantes aléatoires et systématiques

A

L’erreur aléatoire (erreur due au hasard) provient de fluctuations imprévisibles qui influencent les réponses d’un individu sans qu’on puisse en identifier précisément la cause.
Ces variations se produisent d’un test à l’autre ou même d’un item à l’autre, et leur direction change constamment

Ces erreurs ont tendance à se compenser mutuellement lorsqu’on répète la mesure : certaines augmentent légèrement le score, d’autres le diminuent, ce qui explique pourquoi elles diminuent à mesure que la fidélité du test augmente. Un test très fidèle est donc celui où la part d’erreur aléatoire est faible.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

Concepts fondamentaux

L’erreur systématique

Erreur de mesure : composantes aléatoires et systématiques

A

L’erreur systématique, au contraire, provient de facteurs constants qui biaisent les résultats dans une direction spécifique et prévisible. Elle ne se compense pas dans le temps, car elle affecte tous les individus ou toutes les passations de manière identique

L’erreur systématique compromet non seulement la fidélité, car elle introduit une distorsion stable, mais aussi la validité, puisqu’elle fait en sorte que le test mesure quelque chose d’autre que le construit visé.
Ainsi, même un test produisant des résultats très constants peut être invalide s’il comporte un biais systématique.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

Concepts fondamentaux

Coefficient de fidélité : interprétation et signification statistique

A

Le coefficient de fidélité (noté rₓₓ′) indique la proportion de la variance observée qui correspond réellement à la variance vraie, c’est-à-dire aux différences réelles entre les individus plutôt qu’à l’erreur de mesure. Il exprime en une seule valeur la part de stabilité et de précision des résultats.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

Concepts fondamentaux

Définition mathématique

Coefficient de fidélité

A

Sur le plan statistique, la fidélité se formule ainsi :

rxx′ = σvraie2 ÷ σobservé2

où :
* σ²ᵥraie = la variance vraie (les différences réelles entre les personnes),
* σ²observée = la variance totale observée (qui inclut la variance vraie + l’erreur de mesure).

Un exemple pratique : Si la variance vraie est de 40 et la variance observée de 50, alors rxx′ = 40 ÷ 50 = 0,80. Ce coefficient (0,80) signifie que 80 % de la variance totale des scores provient de différences réelles entre les individus, et 20 % d’erreurs aléatoires ou de fluctuations non contrôlées. Plus le coefficient est élevé, plus les scores sont stables, cohérents et fiables pour soutenir des décisions psychologiques ou éducatives.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

Concepts fondamentaux

Interprétation pratique

Coefficient de fidélité

A

On considère généralement :

  • r ≥ 0,90 → fidélité excellente (tests cliniques ou de sélection individuelle) ;
  • 0,80 ≤ r < 0,90 → très bonne fidélité (usage courant en psychologie et éducation) ;
  • 0,70 ≤ r < 0,80 → fidélité acceptable (recherches exploratoires) ;
  • r < 0,70 → fidélité insuffisante (interprétation prudente).

Un exemple illustratif : Un test de motivation affichant r = 0,85 permettra de comparer avec confiance les scores des individus. En revanche, un test de créativité avec r = 0,55 produira des résultats trop instables pour fonder des décisions individuelles.

21
Q

Concepts fondamentaux

Lien avec la validité

Coefficient de fidélité

A

La fidélité est une condition nécessaire mais non suffisante à la validité. Un test doit d’abord être cohérent pour espérer être valide : un instrument instable ne peut mesurer de manière fiable le construit qu’il prétend évaluer. Cependant, l’inverse n’est pas toujours vrai : un test peut être hautement fidèle mais non valide, s’il mesure avec constance quelque chose de différent du construit visé

La fidélité constitue le socle indispensable de la validité, mais cette dernière dépend aussi d’autres dimensions : la pertinence du contenu, la structure factorielle, les corrélations avec d’autres variables, et les conséquences de l’usage du test

22
Q

Impact d’une fidélité faible ou élevée sur les décisions prises à partir des scores

A

La fidélité d’un test ne se limite pas à une qualité technique : elle a des conséquences directes sur la manière dont les résultats sont interprétés et utilisés pour prendre des décisions éducatives, cliniques ou organisationnelles. Une mesure peu fidèle conduit à des conclusions incertaines ou injustes, tandis qu’une mesure très fidèle renforce la confiance et la justesse des interprétations.

23
Q

Quand la fidélité est élevée

Impact d’une fidélité faible ou élevée sur les décisions prises à partir des scores

A

Un test présentant une fidélité élevée (p. ex. r ≥ 0,85) produit des résultats stables et cohérents, ce qui permet :

  • de discerner avec précision les différences réelles entre individus ;
  • de suivre l’évolution d’une personne au fil du temps ;
  • et de prendre des décisions confiantes sur la base des scores obtenus.

Voir exemple cours

24
Q

Quand la fidélité est faible

Impact d’une fidélité faible ou élevée sur les décisions prises à partir des scores

A

Une fidélité faible (p. ex. r ≤ 0,60) indique qu’une grande part de la variance des scores provient d’erreurs de mesure ou de fluctuations aléatoires. Dans ce cas, les décisions fondées sur ces scores deviennent risquées et potentiellement injustes.

Les tests peu fidèles affaiblissent la validité des interprétations et peuvent avoir des conséquences éthiques sérieuses : erreurs de diagnostic, orientations inadaptées, jugements injustes ou perte de crédibilité scientifique.

25
Les types de fidélité
- Fidélité test–retest : stabilité temporelle - Fidélité interjuges : cohérence entre évaluateurs - Fidélité formes parallèles : équivalence entre versions - Fidélité structure interne : cohérence entre les items
26
# Les types de fidélité Fidélité test–retest : stabilité temporelle
La fidélité test–retest **évalue la stabilité des résultats dans le temps.** Elle consiste à administrer le même test à un même groupe de personnes à deux moments distincts, séparés par un intervalle de temps approprié (par exemple, quelques jours ou quelques semaines), puis à corréler les deux séries de scores obtenues.**Le coefficient de corrélation obtenu (r test–retest) indique le degré de constance des résultats au fil du temps**. Si le construit mesuré est **stable** (comme la personnalité ou les aptitudes cognitives), les **scores devraient demeurer similaires d’une passation à l’autre.** Un coefficient **élevé** (p. ex. *r = 0,85*) reflète une **bonne stabilité temporelle**, tandis qu’un coefficient faible (p. ex. r = 0,50) suggère que les résultats varient pour des raisons non liées au trait mesuré
27
# Les types de fidélité Interprétation pratique | Fidélité test–retest : stabilité temporelle
* Une fidélité test–retest **élevée** signifie que les variations de scores entre les deux passations sont minimes : le test mesure un trait stable et les *fluctuations observées sont principalement dues au hasard ou à des facteurs contextuels mineurs*. * Une fidélité test–retest **faible** indique que les *résultats changent sensiblement d’une passation à l’autre* ce qui peut être dû : o à une instabilité réelle du trait (ex. : humeur, anxiété, motivation) ; o à des conditions d’administration différentes ; o ou à des problèmes de formulation des items.
28
# Les types de fidélité Points de vigilance ## Footnote Fidélité test–retest : stabilité temporelle
* L’intervalle entre les deux passations doit être suffisamment long pour éviter les effets de mémoire, mais pas trop long pour que le trait évalué n’ait pas eu le temps de changer. * Les conditions d’administration doivent être strictement identiques (même lieu, même durée, mêmes consignes). * Cette méthode convient mieux aux construits relativement stables, comme les traits de personnalité, les aptitudes ou les attitudes générales
29
# Les types de fidélité Fidélité interjuges : cohérence entre évaluateurs
La fidélité interjuges (ou fidélité interévaluateurs) **mesure le degré d’accord entre plusieurs personnes qui évaluent le même phénomène**. Elle est essentielle lorsque les scores dépendent de jugements humains, par exemple dans l’observation clinique, la cotation de réponses ouvertes, ou l’évaluation de comportements en situation.
30
# Les types de fidélité Interprétation | Fidélité interjuges : cohérence entre évaluateurs
Une fidélité interjuges élevée signifie que les juges appliquent les critères de manière cohérente et uniforme. Une fidélité faible, au contraire, indique que les juges diffèrent dans leur interprétation ou leur rigueur d’évaluation. | voir tableau
31
# Les types de fidélité Facteurs influençant la fidélité interjuges | Fidélité interjuges : cohérence entre évaluateurs
* Formation et expérience des évaluateurs : des juges bien formés tendent à produire des notations plus cohérentes. * Clarté des critères : des consignes explicites et des grilles d’évaluation précises réduisent la subjectivité. * Complexité du comportement observé : plus le phénomène est ambigu ou multidimensionnel, plus la fidélité interjuges risque d’être faible. * Conditions d’observation : l’éclairage, la durée de la séance ou la qualité de l’enregistrement peuvent influencer la perception des juges
32
# Les formes de fidélité Fidélité formes parallèles : équivalence entre versions
La fidélité formes parallèles (ou équivalence entre versions) vise à **évaluer la constance des résultats entre deux versions équivalentes d’un même test**. Elle est utilisée lorsqu’il existe **plusieurs formes d’un instrument**, conçues pour mesurer le même construit, mais avec des items différents. L’objectif est de vérifier si ces versions produisent des résultats comparables chez les mêmes individus. Deux versions du test (souvent appelées Forme A et Forme B) sont administrées au même groupe de participants, à un intervalle court pour éviter les changements réels du trait mesuré. Les scores obtenus aux deux versions sont ensuite corrélés pour estimer leur degré d’équivalence
33
# Les types de fidélité Applications pratiques | Fidélité formes parallèles : équivalence entre versions
* Évaluations répétées : permet d’éviter l’effet de mémoire lorsque le même test doit être administré à plusieurs reprises (ex. : avant et après une intervention). * Contextes d’examen : utile lorsque plusieurs versions équivalentes d’un même test sont nécessaires pour prévenir la tricherie ou les fuites d’items. * Recherches longitudinales : permet de mesurer l’évolution d’un trait sans réutiliser exactement les mêmes questions.
34
# Les types de fidélité Précautions méthodologiques | Fidélité formes parallèles : équivalence entre versions
* Les deux formes doivent être rigoureusement construites selon les mêmes critères : même structure, même nombre d’items, même contenu, même format de réponse. * Les items doivent présenter des difficultés et discriminations comparables. * Le moment d’administration doit être suffisamment proche pour que le trait évalué n’ait pas eu le temps de changer. * Si l’intervalle entre les deux passations est long, la corrélation observée peut refléter à la fois la fidélité temporelle et l’équivalence de contenu, ce qui complique l’interprétation.
35
# Les types de fidélité Fidélité structure interne : cohérence entre les items
La fidélité structure interne (ou cohérence interne) **évalue dans quelle mesure les items d’un même test mesurent le même construit psychologique**. Contrairement aux méthodes test–retest ou formes parallèles, elle repose sur **une seule passation du test**. Elle constitue donc une estimation très utilisée dans la pratique psychométrique, notamment lorsque l’on cherche à vérifier la **homogénéité** d’un instrument. Si un test vise à mesurer un construit unique (par exemple, l’anxiété), les items devraient produire **des réponses corrélées entre elles**. La cohérence interne exprime à quel point ces items “vont dans la même direction”. Une forte corrélation moyenne entre les items traduit une bonne fidélité structurelle. | favoriser ce type de fidélité
36
# Les types de fidélité Indices de cohérence interne | Fidélité structure interne : cohérence entre les items
* L'**alpha de Cronbach** (α) : Il est basé sur le principe de la tau-équivalence issu de la mathématique (chaque items compte pour 1). Plus les items sont homogènes, plus α est élevé. * Le **coefficient oméga** (ω) : Il est basé sur les charges factorielles issues d’une analyse factorielle confirmatoire. Contrairement à α, il ne suppose pas que tous les items contribuent également au construit. C’est un indice plus robuste lorsque les items présentent des contributions inégales
37
# Les types de fidélité Limites et précautions | Fidélité structure interne : cohérence entre les items
* Un α très élevé (> 0,95) peut indiquer une redondance excessive entre les items (items trop similaires). * La cohérence interne dépend du nombre d’items : plus le test est long, plus α tend à augmenter mécaniquement. * Une forte cohérence interne ne garantit pas l’unidimensionnalité : plusieurs sous-facteurs peuvent produire une fidélité élevée, sans mesurer un seul construit homogène. * Il est donc recommandé de combiner α ou ω avec une analyse factorielle pour confirmer la structure du test.
38
# Interprétation des résultats et considérations pratiques Comprendre la valeur du coefficient
Un coefficient de fidélité (α, ω, rₓₓ′, etc.) exprime la **proportion de la variance totale des scores attribuable aux différences réelles entre individus.** Mais cette valeur n’est **jamais absolue** : elle dépend du type de test, de la population et du contexte d’administration. Ainsi, la lecture critique d’un rapport de fidélité consiste à replacer la valeur observée dans son contexte d’utilisation et à la comparer aux standards du domaine d’application.
39
Relation entre fidélité et longueur du test
La longueur d’un test joue un rôle déterminant dans son niveau de fidélité. En règle générale, **plus un test contient d’items mesurant le même construit, plus la fidélité tend à augmenter**, car chaque nouvel item apporte une observation supplémentaire du phénomène évalué, **réduisant ainsi l’effet des erreurs aléatoires**. Cependant, cette relation n’est pas infinie : allonger un test améliore la fidélité jusqu’à un certain point, après quoi les gains deviennent marginaux ou contre-productifs.
40
# Relation entre fidélité et longueur du test Interprétation psychométrique
Chaque item agit comme une **petite mesure du construit latent**. Plus il y a d’items, plus la moyenne des erreurs aléatoires s’annule, et plus le score total reflète fidèlement le score vrai. Mais si certains items sont mal conçus, ambigus ou redondants, leur ajout peut au contraire **diluer la qualité psychométrique du test**. En d’autres termes, **ajouter des items n’améliore la fidélité que si ces items sont pertinents et bien corrélés aux autres**. Un test plus long mais mal construit ne sera pas plus fidèle.
41
# Relation entre fidélité et longueur du test Limites pratiques et éthiques
* **Fatigue et désengagement** : des tests trop longs peuvent provoquer une baisse de concentration, augmentant paradoxalement l’erreur de mesure. * **Redondance** : au-delà d’un certain seuil, les items n’apportent plus d’information nouvelle. * **Équilibre entre rigueur et accessibilité** : un test doit rester psychométriquement solide tout en respectant la disponibilité, la motivation et le bien-être des répondants
42
# Considérations éthiques Prudence face à une fidélité insuffisante
Lorsqu’un test présente une fidélité faible (p. ex. r < 0,60), la part d’erreur de mesure est trop importante pour justifier des décisions individuelles importantes. Les différences de scores risquent alors de refléter des fluctuations aléatoires plutôt que des différences réelles entre personnes D’un point de vue éthique, il est donc essentiel de ne pas surinterpréter les résultats d’un test dont la fidélité est jugée insuffisante, et de compléter l’évaluation par d’autres sources d’information (entrevues, observations, données contextuelles, etc.).
43
# Considérations éthiques Méfiance envers les fidélités “trop élevées”
Une fidélité extrêmement élevée (p. ex. α > 0,95) peut sembler idéale, mais elle n’est pas toujours souhaitable. Elle peut signaler une redondance excessive des items — autrement dit, que le test mesure la même chose de façon répétitive, sans capturer toute la richesse du construit D’un point de vue psychométrique, une fidélité trop élevée peut donc réduire la validité de contenu et compromettre l’utilité pratique du test
44
# Considérations éthiques Équilibre et responsabilité professionnelle
L’éthique en psychométrie consiste à rechercher un équilibre entre précision et diversité des mesures. Un test fiable est avant tout un instrument qui : * fournit des résultats stables, * reflète fidèlement le construit mesuré, * et respecte la dignité et la singularité des personnes évaluées. Les praticiens ont la responsabilité de : * vérifier systématiquement la fidélité rapportée avant d’utiliser un instrument ; * interpréter les résultats à la lumière de leurs limites psychométriques ; * et communiquer ces limites aux clients, étudiants ou institutions concernés. Beaucoup de précision peut signifier qu’on perdre la diversité de la mesure, perdre de la variance Important d’avoir de la diversité
45
L'erreur type de mesure
* L’erreur type de mesure, c’est la marge d’erreur d’un test. Elle montre à quel point un score peut s’éloigner du vrai niveau d’une personne, à cause de petites erreurs associées a la mesure. Plus l’erreur est petite, plus le score est précis. * Un score observé est le résultat qu’on obtient à un test : o Il est composé de deux parties : - Le Score vrai : ce que la personne sait ou peut vraiment faire. - L`erreur de mesure : les petites choses qui font varier le score (fatigue, stress, distraction, etc.). -> Donc, le score qu’on voit n’est jamais parfait, il contient toujours un peu d’erreur. -> La moyenne va représenter les scores entier des passations d’un individu avec l’erreur type de mesure on créer un écart type de confiance ## Footnote Utilisé de la même façon que les écart-types (pas uniquement pour test-retest) best to use avec un seul participant je crois
46
Calcul de l'erreur type de mesure
L'erreur type de mesure se calcule grâce à l'écart-type des scores et à la fidélité du test. La formule est : ETM=σ√(1-r) Où : 𝜎 = écart-type des scores observés; r = coefficient de fidélité du test (généralement mesuré par des méthodes comme l’Alpha, Omega ou le méthode test-retest, entre autres)
47
Interprétation de l’ETM:
o L'ETM montre à quel point un score est précis : -> ETM faible (< 5 %) → le score est très précis, proche du vrai résultat.. -> ETM moyenne (5–10 %) → le score est assez précis, mais avec un peu d’incertitude. -> ETM élevée (> 10 %) → le score est peu précis, il peut être assez différent du vrai niveau de la personne.
48
Exemple d’interprétation de l’ETM:
Supposons qu’un test de QI ait un écart-type de 15 points et une fidélité de 0,90. L’ETM serait calculé comme suit : ETM =σ√(1-r) = 15 x 0,316 = 4.743 (arrondi à 5) Cela signifie que si une personne obtient un score observé de 110, son score vrai se situe probablement entre 105 et 115 (±5 points autour du score observé). En nous basant sur l'interprétation de l’ETM (ETM ÷ Score = 5 ÷ 110 ≈ 4,5%), cet exemple montre qu'une ETM d'environ 4,5 % est considérée comme une faible erreur. Cela signifie que le score observé est assez proche du score vrai, avec une faible marge d'incertitude liée aux erreurs aléatoires (le test est donc considéré précis et fiable).
49
Applications concrètes de l’ETM :
* En pratique, l’erreur type de mesure n’est pas seulement un concept statistique : elle sert à mieux comprendre la précision d’un score et à guider les décisions dans différents contextes d’évaluation. L’ETM a des applications concrètes : o **Évaluer la précision des scores individuels** : Permet de calculer un intervalle de confiance autour d’un score observé, pour estimer la position probable du score vrai (l'application la plus utilisée). - *Prendre des décisions éclairées* : Dans les contextes cliniques, éducatifs ou professionnels, l’ETM aide à estimer la marge d’erreur d’un score avant d’en tirer des conclusions. o **Comparer la précision des tests** : Un test avec une faible ETM est plus précis et plus fiable qu’un test avec une ETM élevée