stat.module9-complet Flashcards

(67 cards)

1
Q

que nous permettaient les tests de comparaison que nous avons vu (IC 95%, X2, t de student, ANOVA)?

A

Comparer des moyennes ou des proportions d’un ou de plusieurs groupes

(IC 95%=1groupes,
t de Student =1 ou 2 groupes,
X2 de Pearson= ≥ 2 groupes
ANOVA=≥ 2 groupes)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

avec les tests de liaison, on peut chercher s’il y a une liaison. entre quels type de variable peut on faire cela?

A
  1. entre deux variables quantitatives
  2. entre deux variables qualitatives
  3. entre 1 quantitative et 1 qualitative
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

V ou F: parfois, X et Y sont interchangeables

A

V
(ex: Comment le poids (X) varie en fonction de la longueur (Y) des poissons? et inversement)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

V ou F: le test de liaison utilisé est le même pour une questions dont le X et le Y sont interchangeable vs une questions où ils ne le sont pas

A

F
( Les tests de liaison seront différents si X et Y sont interchangeables ou non)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

V ou F: Parfois, l’ordre de X et Y est important

A

V
(X prédit Y ou X « cause » Y, ex: Âge en mois (X) peut influencer le poids des poissons (Y))

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

qu’est ce que le diagramme de dispersion (ou nuage de point) nous permet-il de mesurer?

A

le degré d’association linéaire entre 2 variables quantitatives X et Y interchangeables

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

lorsqu’on mesure le degré d’association linéaire entre 2 variables quantitatives X et Y interchangeables, quel est notre principal résultat?

A

un coefficient de corrélation (de Pearson)

(aussi appelé rxy (échantillon) ou 𝜌xy (population))

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

que décrit le coefficient de correlation (de pearson)?

A

le sens (direction) et la précision de l’association

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

lorsqu’on évalue la corrélation avec un nuage de point, qu’est ce qu’on suppose?

A

Suppose que la relation est une ligne droite (y = b0 +b1x)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

entre quelles valeurs varie le coefficient de corrélation de pearson?
que signifie un coefficient=0?

A

entre -1 et 1
0= absence de corrélation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

qu’est ce que le signe (- ou +) de notre coefficient de corrélation de pearson nous permet de déterminer?
que signifie positif vs négatif?

A

le sens de la relation
positif= association positive, quand X ↑ alors Y ↑
négatif= association négative, quand X ↑ alors Y ↓

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

qu’est ce que la précision de la relation linéaire?

A

à quel point la corrélation est parfaite

(ex: rxy=1 ou rxy=-1 : corrélations parfaites)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

quelles sont les 4 conditiond s’application du coefficient de corrélation?

A
  1. Échantillon aléatoire représentatif de la population
  2. deux variables sont quantitatives
  3. min. 1 des deux est normalement distribuée+
    homoscédasticité
  4. Relation linéaire entre les deux variables
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

quel graphique représente l’homoscédasticité?

A

1

(Homoscédasticité =variance homogène; variance égale)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

quel graphique représente une relation linéaire?

A

1

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

si on obtiens un rxy=0, mais que X et Y ne respectent pas la relation linéraire, qu’est ce que ça veut dire?

A

pas significatif: Une corrélation faible ne veut pas nécessairement dire absence de liaison entre X et Y

(voir image)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

si on obtiens un rxy=0,7 (élevé), mais que X et Y ne respectent pas la relation linéraire, qu’est ce que ça veut dire?

A

pas significatif: Une corrélation élevée ne veut pas nécessairement dire qu’une liaison existe entre X et Y

(voir image)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

interprétez ce coefficient de relation

A

-: relation négative (quand X aug. Y dim.)
0,80: relation assez précise
p=0,02 : Corrélation est statistiquement différente de zéro

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

V ou F: si n est très petit, on rejette H0:𝜌=0, même si rxy est assez proche de 0

A

F. c’est si n est très grand

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

qui suis-je? La proportion de la variation totale d’une variable déterminée par ou attribuée à
la relation linéaire avec l’autre variable
.
(en bref, à quel point la variation est due l’association avec l’autre variable)

A

Coefficient de détermination R^2

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

que suppose le coefficient de détermination R^2?

A

que la relation entre x et y est causale

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

interprétez ce coefficient de corrélation (juste 4)

A

en supposant que la relation est causale, le R^2 nous permet de dire que 64% de la variation de y est expliquée par x

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

quelle est la condition pour que r^2 aie du sens?

A

il FAUT que la relation soit linéaire

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

V ou F: « r » n’est valide que pour la plage de valeurs étudiées

A

V: on ne peut pas extrapoler

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
V ou F: la relation est linéaire et le r est seulement interprété pour la plage de donnée. On obtiens un r très élevé, on peut donc conclure que x cause y
F; les conditions sont respectée, on peut donc conclure qu'il y une correlation entre x et y CORRELATION≠CAUSALITÉ
26
quand 2 variables (x et y) sont liées, donnez 4 explications possibles
1. x cause y 2.y cause x 3. x et y sont affectés par une cause commune 4. biais dans l'étude crée faux lien
27
nommez les 4 similarités entre la régression linéaire et la corrélation
1. évalue la liaison entre x et y 2. décrit le sens de la relation 3. donne un R^2 4. relation linéaire
28
nommez les 4 différences entre la régression linéaire et la correlation 1. variables pas ____________ 2. estime aussi __________ 3. x peut être _______ ou _______ 4. on peut évaluer relation pour _______
1. variables pas interchangeables 2. estime aussi de COMBIEN y varie quand x augmente 3. x peut être qualitatif ou quantitatif 4. on peut évaluer relation pour plusieurs x en meme temps
29
formule de quoi?
Régression linéaire simple
30
concrètement, qu'est ce que ça signifie que x et y ne soient pas interchangeables pour la régression linéaire?
C.-à-d. On a déterminé a priori qu’une variable est une conséquence de l’autre (y (var. dépendante)= issue, x(var indépendante)=prédicteur)
31
question: Existe-t-il une relation linéaire entre la variable dépendante et le prédicteur? faites H0 et HA
H0: b1=0 (la pente de la relation entre les deux variables dans la population est égale à 0) HA : b1 ≠ 0) (la pente de la relation entre les deux variables dans la population est différente de 0)
32
à quoi correspondent b0 et b1 dans la formule de la régression linéaire simple?
b0: valeur de Y quand X=0 b1: pente de la droite de régression (mesure combien « Y » change par unité de changement de « X »)
33
avec quel(s) test(s) répond-on à la question: Existe-t-il une relation linéaire entre la variable dépendante et le prédicteur?
test de t ANOVA
34
quelles sont les étapes de réalisation de la régression linéaire simple? (4)
1. trouver la meilleure droite pour nuage 2. évaluer correlation 3.analyse de variance 4. t de student
35
c'est un logiciel qui trouve la droite la plus adéquate pour un nuage de point, mais expliquez en gros la méthode pour y arriver
-> méthode des points carrés (on trace une droite et on mesure les résiduels (distance entre chaque point et la droite), on additionne les résiduels, la droite avec la plus petite somme est la meilleure)
36
lors de l'analyse des variances pour une régression linéaire (ressemble à l'ANOVA), que mesure-t-on?
la variance entre valeur prédite (ŷ𝒊) par la droite et moyenne générale (ȳ) vs. la variance entre observations (𝒚𝒊) et valeur prédite (ŷ𝒊) par la droite
37
1. quel est l'Acronyme pour la variation totale (régression linéaire)? 2. pour la variation expliquée par la régression? 3. pour la variation résiduelle ou non expliquée?
1. (SCÉT) 2. (SCÉE) 3. (SCÉR)
38
associez les images (1,2,3) à a. variation expliquée par la régression b.variation résiduelle ou non expliquée? c.variation totale
1. c 2. a 3. b
39
associez les formules (1,2,3) à: a. variation expliquée par la régression b.variation résiduelle ou non expliquée? c.variation totale à ces formules
1. c 2. a 3. b
40
la variation totale est égale à la some de ...
la variation expliquée par la régression + la variation résiduelle ou non expliquée
41
quelle est cette formule?
analyse de variance Si F(1,n-2) > F𝛼 alors on rejette H0
42
dans quelle situation obtiens on une régression linaire qui ressemble à ca?
prédicteur (X) qualitatif (2 ou > 2 catégories) (droite relie alors les moyennes de chacun des groupes)
43
pour une régression linéaire avec X qualitatif, que signifie R^2?
La proportion de la variation de « Y » qui est expliquée par l’appartenance à un groupe plutôt qu’à un autre
44
quelles sont les 3 conditions d'application de la régression linéaire?
1. relation linéaire entre x et y 2. valeurs résiduelles suivent loi normale 3. homoscédasticité des résiduels
45
quels sont les 4 abus à éviter avec la régression linéaire?
1, Analyser des relations qui ne sont pas linéaires 2. Extrapoler au-delà des valeurs de l’étude 3. Conclure une relation cause-effet
46
V ou F contrairement au modèle de régression linaire simple qui ne tiens compte d'une seule variable dépendante, le modèle de régression multiple permet d'évaluer plusieurs variables dépendantes.
F. les deux évaluent 1 variable dépendante la multiple intègre + d'1 variable INDÉPENDANTE
47
lorsqu'on est pas sur que nos groupes sont homogènes, que nous permet la régression linéaire multiple?
de controler un biais de l'étude (ex. on veut évaluer effet tx sur lait, mais l'age et le poids de nos groupes ne sont pas homogènes -> en les incluants dans l'équation, il sont gardés constants)
48
interprétez (en gros) cet exemple de régression linéaire multiple
b1: effet du tx sur prod. de lait, quand l’âge et le poids sont gardés constants b2: effet de l’âge sur prod.de lait, qaund le tx et le poids sont gardés constants b3 : effet du poids sur la prod. de lait, lorsque le tx et l’âge sont gardés constants
49
qui suis-je? je sui un régression, comme la régression linéaire, mais ma variable dépendante est qualitative binaire!!
régression logistique
50
d'après vous, qu'est ce qui est illustré par ce graphique?
la régression logistique (courbe en s) de la relation entre une variable dépendante qualitative binaire (Y) et X
51
qu'est ce que les cotes (odds)?
à quel point il y a de chance que A se produise vs qu'il ne se produise pas. (Ex: probabilité d'être malade=70%, prob. d'être sain=30%, odds (malade)=0,7/0,3=2,33 -> on a 2,33 plus de chance d'être malade que sain. )
52
quelle est cette formule?
modèle de la régression logistique
53
associez les significations de b1 à variable dépendante qualitative ou quantitative 1. b1= rapport de cotes (odds ratio) de maladie quand « X » est présent vs. absent 2. b1= rapport de cotes de maladie quand « X » augmente d’une unité
1. qualitatif 2. quantitatif
54
probabilité que A arrive+probabilité que A n'arrive pas=?
1
55
qu'est ce que le rapport de cotes (odds ratio)?
il s'agit des cotes (odds) entre deux autres cotes
56
v ou f: un autre nom pour le rapport de cote est le rapport de risque
NON autre chose complètement, voir cours épidémio
57
qu'elle est cette formule?
rapport de cotes pour x qualitatif
58
peut on avoir plusieurs prédicteurs (x) pour une régression logisitique?
oui: régression logistique multiple
59
quels sont les condition d'application de la régression logistique? (1)
1. relation entre x et ln(𝑃(𝑌)/1−𝑃(𝑌)) est une droite
60
quel test utilise-t-on quand la variable indépendante est le TEMPS jusqu’à un évènement
analyse de survie
61
puisque le temps de survie pourrait être traité comme une variable quantitative, pourquoi n'utilise-t-on pas des tests comme le test de t, l'ANOVA ou la régression linéaire?
Plusieurs observations n’auront jamais l’événement (du moins pendant l’étude) (ex: on s'intéresse au nombre de mois entre la maladie et la mort sur 1 ans et 4 chiens ne meurent pas)
62
que sont les données censurées?
Les individus pour qui l’événement d’intérêt n’arrive pas pendant l’étude
63
qu'est ce qu'on obtient avec l'analyse de survie? (3)
1. un hazard ratio (HR) 2. un graphique du temps de survie 3. parfois le temps médian de survie
64
qui suis-je? facteur par lequel augmente le risque qu'un individu expérimente l'événement dans la prochaine période t en fonction de X
hazard ratio
65
comment le hazard ratio est-il impacté par X si X est qualitatif? X quantitatif?
qualitatif: HR= facteur par lequel le risque d'obtenir Y augmente quand X est présent ou non quantitatif: HR=facteur par lequel le risque d'obtenir Y augmente par unité de changement de X
66
que représente ce graphique?
courbe de survie (Kaplan-Meier) (pense pas que c important)
67
allez faire vos exercices :)