Quelles est la propriété psychométrique la plus importante et la plus négligée?
la validité
Qu’est-ce que la validité des scores/ instruments ?
Le degré de validité détermine quoi ?
détermine l’interprétation et les inférences que l’on peut faire à partir des scores d’une échelle (plus le degré de validité est élevé plus on peut faire des inférences solides, ex. se prononcer sur la condition d’une personne)
Est-ce que le nom d’un test ou d’une échelle continue un indice adéquat du construit mesuré?
Non, pas toujours
Quelle question doit-on poser au lieu de « « est-ce que ce test est valide ou pas » ?
« est-ce que ce test est une mesure valide de ce construit, pour cette population et pour cette application (utilisation) particulière »
Quels trois éléments doit-on évaluer pour déterminer la validité d’un test ou d’une mesure ?
2. Est-ce qu’il mesure bien ce construit pour la population ciblée (e.g., groupe d’âge, niveau académique, groupe clinique particulier, etc.) ? (un instrument peut être valide pour une population mais pas nécessairement pour une autre) 3. Est-ce qu’il mesure bien ce construit pour une application particulière (e.g., classifier dans des groupes diagnostiques, donner une valeur quantitative sur continuum, etc.) ? (les instruments peuvent être utilisés pour différentes raisons : ex. dépister pour classer en 2 groupes VS identifier les individus le long d'un continuum --> on ne va pas nécessairement utiliser le même instrument pour faire les deux car pour l'un il peut être valide mais pas pour l'autre utilisation)
Quels sont les 3 points clés à propos de la validité des teste que soulignent les organisations professionnelles ?
2. La validité est une question de degré ; ce n’est pas une question absolue, de « tout ou rien » (en fonction de l'application et la population) 3. La validité d’un test repose sur de solides bases théoriques et empiriques (les deux contribuent à la validité des scores générés)
Quelles sont les différentes sources de la validité ?
Est-ce que la vraisemblance fait partie des sources de validité ?
Non
Qu’est-ce que la vraisemblance ?
Aussi appelée validité d’apparence (« face validity »)
Le degré auquel une mesure semble adéquate et reliée à un construit spécifique selon le jugement de (a) les personnes qui sont évaluées avec le test (i.e., clients.es, profanes, non-experts.es qui sont évalués.es) et/ou (b) les personnes qui utilisent le test (i.e., intervenants.es, mais peut aussi être des représentants légaux reliés à la population ciblée, etc., par ex. parents, enseignants, etc.)
Une mesure détient une bonne vraisemblance lorsque quoi ?
lorsque les personnes évaluées ou celles qui l’utilisent jugent qu’elle « semble pertinente et adéquate » pour mesurer le construit
Si l’instrument ne paraît pas valide ou vraisemblable pour les personnes évaluées/utilisatrices dans les situations concrètes d’évaluation, est-ce que cela peut devenir une menace à la validité ?
Oui, en l’influençant.
ex. les personnes ne prennent pt pas le questionnaire au sérieux s’ils ne le jugent pas pertinent
* e.g., mesurer le niveau d’agressivité d’un enfant en lui faisant faire un dessin ? * e.g., l’item « je sens parfois mon âme sortir de mon corps » serait-il perçu comme peu valide dans plusieurs contextes (e.g., sélection du personnel) ?
Quels facteurs peuvent influencer la vraisemblance ?
Qu’est-ce que la validité de contenu ?
Réfère au degré de représentativité des items (questions) utilisés pour mesurer un construit (à quel point les items (questions/symptômes/etc.) sont représentatives du concept que l’on souhaite mesurer)
Q’est-ce qui est central dans la validité de contenu ?
Avant de construire une échelle, les auteurs.trices doivent toujours faire quoi ?
décrire en détails et de façon compréhensive les différents domaines et sous-domaines du construit d’intérêt
* Quels sont les domaines inclus selon la théorie/recherches? - Quelle est l’importance relative de chacun? * Y a-t-il des sous-domaines selon la théorie/recherches? - Quelle est leur importance relative? * Avec quels items (et de quel format) peut-on bien représenter ces domaines et/ou sous-domaines? (avec combien d'items? Quels sont les plus importants?)
À partir de quoi les chercheurs.euses définissent un construit (et donc, son contenu) ?
1) Cadre théorique (un concept théorique, une théorie, un amalgame de théories…Ex. Bandura dit que l’auto efficacité c’est …)
2) Recherches empiriques (recension)
3) Connaissances et expériences professionnelles/pratiques
Quels sont les deux types de validité de contenu?
De quelle manière peut-on estimer le degré de validité de contenu empiriquement ?
Afin de quantifier le degré de validité de contenu qu’est-ce qu’on fait ?
on donne aux experts.es un choix de réponse avec une gradation à propos de chaque item afin de systématiser le tout
Pas du tout pertinent / représentatif = 0
Un peu pertinent / représentatif = 1
Assez pertinent / représentatif = 2
Très pertinent / représentatif = 3
Quelles sont les deux grandes menaces à la validité de contenu ?
Qu’est-ce que la validité de construit ?
Réfère au degré de (a) reproductibilité de la structure interne théorique sous-jacente à l’instrument ainsi que les (b) relations du construit d’intérêt avec d’autres construits externes (relation entre les scores générés par mon instrument et des concepts indépendants)
Quelles sont les deux grandes façons de vérifier la validité de construit ?
idéalement on fait les 2
MAIS Avant d’entamer ces évaluations, il faut toutefois bien connaitre la théorie sous-jacente au construit
Qu’est-ce que le réseau nomologique ?