Qu’est-ce que la validité?
Qu’est-ce que le degré de validité?
détermine l’interprétation et les inférences que l’on peut faire à partir des scores d’une échelle
Attention : le nom d’un test ou d’une échelle ne constitue pas toujours un indice adéquat du construit mesuré – Soyez toujours méfiants.es !
La validité d’un test ou d’une mesure doit être évaluée relativement à trois aspects. Quels sont ces trois aspects?
Les organisations professionnelles soulignent trois points clés à propos de la validité des tests (AERA, APA, & NCME, 2014) :
Quelles sont les différentes sources de validité?
Qu’est-ce que la vraisemblance (ou validité d’apparence)?
Quand peut-on dire qu’une mesure détient une bonne vraisemblance?
lorsque les personnes évaluées ou celles qui l’utilisent jugent qu’elle «semble pertinente et adéquate» pour mesurer le construit
Avec quelle type de validité la vraisemblance est-elle souvent confondue?
validité de contenu
Quel est un danger si l’instrument de mesure ne paraît pas valide ou vraisemblable pour les personnes évaluées/utilisatrices dans les situations concrètes d’évaluation?
Peut devenir une menace à la validité
- e.g., mesurer le niveau d’agressivité d’un enfant en lui faisant faire un dessin de sa famille ?
- e.g., l’item «je sens parfois mon âme sortir de mon corps» serait-il perçu comme valide dans plusieurs contextes (e.g., sélection du personnel)?
Quels éléments peuvent venir altérer la vraisemblance d’une mesure?
Qu’est-ce que la validité de contenu?
Avec quel type de validité est-il difficile de faire un bon échantillonnage pour des construits psychologiques complexes? Ici, les méthodes statistiques ne sont d’aucune aide… ou presque. Comment peut-on y remédier?
Concernant la validité de contenu, avant de construire une échelle, les auteurs.trices doivent toujours décrire en détails et de façon compréhensive les différents domaines et sous-domaines du construit d’intérêt
- Exemple : Échelle de problèmes extériorisés
a) Quels sont les domaines inclus selon la théorie/recherches?
b) Quelle est l’importance relative de chacun?
c) Y a-t-il des sous-domaines selon la théorie/recherches?
d) Quelle est leur importance relative?
À partir de quoi les chercheurs.euses définissent un construit (et donc, son contenu) ?
Quels sont les deux types de validité de contenu?
Nominale : auteurs.trices du test
Consensuelle : groupe de spécialistes indépendants
Comment peut-on estimer le degré de validité de contenu empiriquement (Polit & Beck, 2006)?
Avec une échelle de mesure quantitative
- on demande à des experts.es indépendants.es d’estimer
A) à quel point (degré) chacun des items d’un test est pertinent et représentatif du construit d’intérêt
B) à quel point (degré) l’ensemble des items constitue un bon échantillon représentatif du contenu du construit
Comment peut-on quantifier le degré de validité de contenu?
Cet exemple représente quel notion en lien avec la validité de contenu:
- ex., Extraversion : «Dans une situation sociale impliquant plusieurs personnes, j’ai de la difficulté à faire les premiers pas pour aller vers les autres»
a) Pas du tout pertinent / représentatif = 0
b) Un peu pertinent / représentatif = 1
c) Assez pertinent / représentatif = 2
d) Très pertinent / représentatif = 3
quantifier le degré de validité de contenu
Quelles sont les deux menaces à la validité de contenu?
Qu’est-ce que la validité de construit?
Réfère au degré de
(a) reproductibilité de la structure interne théorique sous-jacente à l’instrument
(b) reproductibilité des relations du construit d’intérêt avec d’autres construits externes
Comment peut-on vérifier la validité de construit?
Qu’est-ce que le réseau nomologique?
Qu’est-ce que la nomologie?
«l’étude des lois»