Séance 5 - Régression Multiple Flashcards

(27 cards)

1
Q

En régression multiple, la corrélation multiple R est équivalente à la
corrélation moyenne de Pearson entre chaque prédicteur X et la variable dépendante Y.

Vrai ou Faux?

A

Faux.

La corrélation multiple correspond à la corrélation entre la valeur
prédite de la variable dépendante Y par la régression multiple (à l’aide de la
combinaison des prédicteurs) et la valeur observée de Y.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

Comme une corrélation de Pearson, une corrélation multiple R varie
de -1 à +1.

Vrai ou Faux?

A

Faux.

Comme R est une corrélation entre les valeurs prédite et observée
de Y, il ne fait pas de sens qu’une grande valeur prédite de Y soit systématiquement
associée à une petite valeur observée de Y (une association négative). Plus une valeur
observée est grande et plus sa valeur prédite risque d’être grande, ce qui implique que
la corrélation multiple R est toujours de valeur positive (entre 0 et 1).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

Tout comme la somme de carrés inter-groupe en ANOVA, la somme
de carrés de régression corresponds à la variance qu’on tente d’expliquer.

Vrai ou Faux?

A

Vrai.

En ANOVA, la somme de carrés inter-groupe est la variabilité de la
variable dépendante Y expliquée par la condition (la variable indépendante). En
régression, la somme de carrés régression est la variabilité expliquée par la
combinaison des prédicteurs (les variables indépendantes).

Ce sont deux contextes
statistiques distincts, en raison du fait que la variable indépendante est nominale en
ANOVA mais continue en régression.

Toutefois, ces deux SC capturent la même
information (la variabilité de Y expliquée par X).

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

Quelles sont les hypothèses (nulle et alternative) de l’ANOVA réalisée sur la
régression multiple ?

A

H0 : R2 = 0
H1 : R2 > 0

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

Est-ce qu’on a besoin du coefficient de détermination (R2), du test F et la table d’ANOVA en régression simple ?

A

Non, ces indices ne sont pas nécessaires car :

Comme il y a un seul prédicteur X, la contribution du prédicteur et la contribution de la régression complète à la prédiction de Y sont de taille identique (zone b dans la figure) et donc la p-valeur des deux tests sera également identique.

Le coefficient de détermination aura la même valeur que la corrélation de Pearson au carré, R2 = r2

Le coefficient beta standardisé β aura la même valeur que la corrélation de Pearson r.

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

L’hypothèse alternative (H1) dans une regression multiple peut être birectionnelle ?

A

Faux.

L’H1 est toujours directionnelle à droit car les hypothèses sont exprimés selon le coefficient de détermination (R2) - (Une variance ne peut pas être négative)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

Si j’affirme qu’il existe une
association “modérée” entre X et Y,
je parle de…

A. La signification
statistique de la
corrélation

B. La valeur
numérique du
coefficient de
corrélation

C. Le coefficient de
régression

D. Le signe de
l’association
(corrélation ou
régression)

A

B. La valeur
numérique du
coefficient de
corrélation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Quel(s) énoncé(s) est(sont) vrai(s) ?
Une corrélation de r = -0.30 entre X
et Y indique que..

A.Les personnes qui
ont une valeur
supérieure à la
moyenne sur X ont
tendance à avoir
une valeur
supérieure sur Y

B.Les personnes qui
ont une valeur
supérieure à la
moyenne sur X ont
tendance à avoir
une valeur
inférieure sur Y

C.Les personnes qui
ont une valeur
inférieure à la
moyenne sur X ont
tendance à avoir
une valeur
supérieure sur Y

D.Les personnes qui
ont une valeur dans
la moyenne sur X
ont tendance à
avoir une valeur
dans la moyenne
sur Y

A

B, C et D

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

Quel(s) énoncé(s) est(sont) faux ?

A.La pente d’une
régression prend
une valeur
uniquement entre
-1 et 1

B.Le résidu d’une
régression est la
valeur du
prédicteur X après
avoir soustrait la
valeur prédite de la
variable
dépendante Y

C.La régression
permet de
confirmer la
direction de la
relation (X -> Y ou
Y -> X)

D.La corrélation
partielle permet
d’estimer la
corrélation entre X
et Y si tous les
répondants avec la
même valeur sur la
variable
confondante

A

A,B et C

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

Dans une régression multiple standard, les prédicteurs sont :

A. Entrés selon l’ordre théorique
B. Entrés un par un automatiquement
C. Entrés simultanément
D. Entrés selon leur corrélation

A

C

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

La méthode hiérarchique sert principalement à :

A. Maximiser le R² automatiquement
B. Tester la contribution additionnelle de variables
C. Éliminer les variables non significatives
D. Standardiser les coefficients

A

B

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

Quelle statistique est la plus importante en régression hiérarchique ?

A. β
B. R
C. ΔR²
D. Moyenne

A

C

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

Si la p-valeur du ΔR² = 0,007, on conclut que :

A. Le modèle est invalide
B. La contribution additionnelle est significative
C. Les variables sont colinéaires
D. Le R² diminue

A

B

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

La méthode standard permet de tester des hypothèses théoriques sur l’ordre des variables.

Vrai ou Faux ?

A

?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

En régression hiérarchique, le chercheur choisit l’ordre d’entrée des variables.

Vrai ou Faux ?

A

Vrai

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

Le ΔR² indique la variance supplémentaire expliquée par un nouveau bloc.

Vrai ou Faux ?

17
Q

Une p-valeur du ΔR² inférieure à 0,05 indique une contribution significative.

Vrai ou Faux ?

18
Q

En entrée hiérarchique, la variabilité commune entre deux prédicteurs est assignée au premier prédicteur entré.

Vrai ou Faux ?

A

Vrai

Car le second n’étant pas encore dans la régression, il ne peut pas affecter « l’ajustement » du premier

19
Q

En entrée standard, la variabilité commune entre les prédicteurs est assignée au premier prédicteur.

Vrai ou Faux ?

A

La variabilité commune entre les prédicteurs n’est assignée à aucun prédicteur.

La contribution de chaque prédicteur étant « ajustée » pour les autres, aucun ne va expliquer la variabilité commune

20
Q

Quel variable constitue la quantité aléatoire dans une régression ?

A

Les erreurs de prédiction (e.i. Les résidus)

21
Q

Pour que les conclusion statsitques sur les coefficients de régression (B) et de détermination (R2) soient valides, les résidus de l’équation de régression doivent rencontrer des hypothèses.

Identifiez celles-ci.

A

H1 : Ils doivent être indépendants

H2 : Ils doivent être distribués selon une loi normale

H3 : Ils doivent être de moyenne 0 pour toutes les valeurs prédites de Y (postulat de linéarité)

H4 : Ils doivent avoir une variance stable pour toutes les valeurs prédites de Y (postulat d’homoélasticité)

22
Q

Chaque résidu (et donc chaque observation) doit provenir d’une personne distincte, sans relation avec les autres personnes de l’échantillon (les participants ne doivent pas s’inter-influencé)

Si non-respectée, les observations appariées vont réduire la variabilité de Y

C’est une hypothèse qui ne touche pas les données elles-mêmes mais plutôt comment elles ont été récoltées

À quels hypothèses des résidus renvoient on ?

A

H1 : Indépendance des résidus

23
Q

Vérifier la normalité d’une variable (examen graphique de l’histogramme, statistiques d’aplatissement et d’asymétrie, test de Shapiro Wilk)

À quels hypothèses des résidus renvoient on ?

A

H2 : Normalité des résidus

24
Q

Ce postulat reflète le fait que la régression (simple ou multiple) est un outil qui capture uniquement la relation linéaire (droite ou plan) entre Y et le(s) prédicteur(s) X

On valide ce postulat à l’aide d’un graphique des résidus selon les valeurs prédites de Y (dans le tableau « ajusté »

Le postulat est respecté si la moyenne des résidus est centrée autour de zéro pour la majorité des points.

À quels hypothèses des résidus renvoient on ?

A

H3 : Linéarité des résidus

25
Ce postulat vérifie si le test statistique sur la pente (qui utilise la variabilité des résidus) est valide pour toutes les valeurs prédites de Y Encore ici, on valide ce postulat à l’aide d’un graphique des résidus selon les valeurs prédites de Y Le postulat est respecté si la dispersion des résidus est stable autour de zéro pour la majorité des points. À quels hypothèses des résidus renvoient on ?
H4 : Variance stable des résidus
26
Le postulat de linéarité et le postultat d'homoélasticité s'identifie avec des chiffres. Vrai ou Faux ?
Ne s’identifie pas avec des chiffres. Il s’agit d’un exercice visuel dans lequel il est question d’observer le jeu de donné
27
Dans une régression hiérarchique, que teste le F du changement ? A. La corrélation simple B. L’importance relative des prédicteurs C. La variance supplémentaire expliquée D. La normalité des résidus
C