Qu’est-ce que la validité?
On veut savoir si l’instrument de mesure mesure vraiment ce qu’il prétend ou devrait mesurer.
- Validité des scores
- L’échantillon d’item de l’échelle représente bien le construit qu’on veut mesurer.
- Degré de validité détermine l’interprétation et les inférences que l’on peut faire à partir des scores d’une échelle
Vraie question pour mesurer la validité
Est-ce-que le ce test est une mesure valide de ce construit, pour cette population et pour cette utilisation en particulier?
3 aspects de la validité à être évalués
3 points clés que les organisations professionnelles soulignent à propos de la validité des tests (IDB)
Différentes sources de validité (3)
Qu’est-ce que la vraisemblance?
Aussi appelé “validité d’apparence”.
- Pas une source de validité!!!
- Degré auquel une mesure semble adéquate pour les personnes qui sont évaluées avec le test ET/OU les personnes qui utilisent le test.
- Bonne vraisemblance quand la majorité des personnes (évaluées ou qui évaluent) jugent qu’elle semble pertinente et adéquate.
- Parfois confondu avec validité de contenu : mais ce ne l’est pas.
- Si pas vraisemblable pour les personnes, peut être une menace à la validité.
Validité de contenu
Réfère au degré de représentativité des items (questions)
La validité de contenu est pour la plupart du temps établie de façon …(D)
Déductive : auteur.trice demande à des experts indépendants de se prononcer sur la pertinence des items
2 questions posées aux experts indépendants sur la validité de contenu
Quelle est la forme de validité la plus négligée?
Validité de contenu
La représentativité dans la validité de contenu
Est-ce que tous les domaines et sous-domaines du contruit sont représentés?
- Évite sur ou sous représentation de certains contenu.
Ex. 15 item qui mesure 1 concept et 2 items seulement qui représentent un autre concept.
Validité de contenu : Avant de construire une échelle, les auteur.trices doivent toujours…
Décrire en détails et de façon compréhensive les différents domaines (sous-domaines) du construit d’intérêt
- Important de bien définir le concept qui est mesuré.
Validité de contenu : à partir de quoi les chercheur.euses définissent un construit? (3)
Deux types de validité de contenu
Comment estimer le degré de validité de contenu empiriquement?
Avec une échelle de mesure quantitative, on demande à des experts indépendants d’estimer
1. À quel point chacun des items d’un test est pertinent et représentatif du construit d’intérêt
2. À quel point l’ensemble des items constitue un bon échantillon représentatif du contenu du construit
Afin de quantifier le degré de validité de contenu…
On donne aux expert.es un choix de réponse avec une gradation à propos de chaque item afin de synthétiser le tout
- Quand on quantifie, on peut calculer les indice de validité de contenu.
Deux grandes menaces à la validité de contenu
Validité de construit : réfère à quoi? (r-r)
A. Au degré de reproductibilité de la structure interne théorique de l’instrument : est-ce que je peux reproduire la structure théorique que les auteurs proposent de l’instrument?
B. Au degré de les relations du construit d’intérêt avec d’autres construits externes: relation avec construits et avec concepts indépendants.
Deux grandes façons de vérifier la validité de construit
Théorie sous-jacente à la validité de construit : Réseau nomologique
Théorie expliquant…
Théorie expliquant le construit par le biais de ses interrelations avec d’autres construits de façon CLAIRE
- Peut inclure facteurs étiologiques et conséquences développementales
- Devrait tjrs se retrouver dans le document expliquant l’instrument mais y est rarement
Qu’est-ce que la nomologie?
Étude des lois
Validité de construit : validité factorielle
Vérifier si la structure factorielle théorique qui représente le construit est reproduite sur le plan empirique
- Multidimensionnel : plus d’une dimension (ex. EDC)
Validité factorielle : L’objectif est de vérifier deux aspects inter-reliés de la structure factorielle théorique
Validité factorielle : Analyse factorielle exploratoire
On cherche les items inter-corrélés (individus tendent à répondre de façon similaire)
- Critère classique : saturation factorielle de 0,40 et plus (équivalent à une corrélation entre un item et un score total)
- Matrice de corrélation