stat.module9-complet Flashcards by Promo2029 Medvet

que nous permettaient les tests de comparaison que nous avons vu (IC 95%, X2, t de student, ANOVA)?

Comparer des moyennes ou des proportions d’un ou de plusieurs groupes

(IC 95%=1groupes,
t de Student =1 ou 2 groupes,
X2 de Pearson= ≥ 2 groupes
ANOVA=≥ 2 groupes)

How well did you know this?

Not at all

Perfectly

avec les tests de liaison, on peut chercher s’il y a une liaison. entre quels type de variable peut on faire cela?

entre deux variables quantitatives
entre deux variables qualitatives
entre 1 quantitative et 1 qualitative

How well did you know this?

Not at all

Perfectly

V ou F: parfois, X et Y sont interchangeables

V
(ex: Comment le poids (X) varie en fonction de la longueur (Y) des poissons? et inversement)

How well did you know this?

Not at all

Perfectly

V ou F: le test de liaison utilisé est le même pour une questions dont le X et le Y sont interchangeable vs une questions où ils ne le sont pas

F
( Les tests de liaison seront différents si X et Y sont interchangeables ou non)

How well did you know this?

Not at all

Perfectly

V ou F: Parfois, l’ordre de X et Y est important

V
(X prédit Y ou X « cause » Y, ex: Âge en mois (X) peut influencer le poids des poissons (Y))

How well did you know this?

Not at all

Perfectly

qu’est ce que le diagramme de dispersion (ou nuage de point) nous permet-il de mesurer?

le degré d’association linéaire entre 2 variables quantitatives X et Y interchangeables

How well did you know this?

Not at all

Perfectly

lorsqu’on mesure le degré d’association linéaire entre 2 variables quantitatives X et Y interchangeables, quel est notre principal résultat?

un coefficient de corrélation (de Pearson)

(aussi appelé rxy (échantillon) ou 𝜌xy (population))

How well did you know this?

Not at all

Perfectly

que décrit le coefficient de correlation (de pearson)?

le sens (direction) et la précision de l’association

How well did you know this?

Not at all

Perfectly

lorsqu’on évalue la corrélation avec un nuage de point, qu’est ce qu’on suppose?

Suppose que la relation est une ligne droite (y = b0 +b1x)

How well did you know this?

Not at all

Perfectly

entre quelles valeurs varie le coefficient de corrélation de pearson?
que signifie un coefficient=0?

entre -1 et 1
0= absence de corrélation

How well did you know this?

Not at all

Perfectly

qu’est ce que le signe (- ou +) de notre coefficient de corrélation de pearson nous permet de déterminer?
que signifie positif vs négatif?

le sens de la relation
positif= association positive, quand X ↑ alors Y ↑
négatif= association négative, quand X ↑ alors Y ↓

How well did you know this?

Not at all

Perfectly

qu’est ce que la précision de la relation linéaire?

à quel point la corrélation est parfaite

(ex: rxy=1 ou rxy=-1 : corrélations parfaites)

How well did you know this?

Not at all

Perfectly

quelles sont les 4 conditiond s’application du coefficient de corrélation?

Échantillon aléatoire représentatif de la population
deux variables sont quantitatives
min. 1 des deux est normalement distribuée+
homoscédasticité
Relation linéaire entre les deux variables

How well did you know this?

Not at all

Perfectly

quel graphique représente l’homoscédasticité?

(Homoscédasticité =variance homogène; variance égale)

How well did you know this?

Not at all

Perfectly

quel graphique représente une relation linéaire?

How well did you know this?

Not at all

Perfectly

si on obtiens un rxy=0, mais que X et Y ne respectent pas la relation linéraire, qu’est ce que ça veut dire?

pas significatif: Une corrélation faible ne veut pas nécessairement dire absence de liaison entre X et Y

(voir image)

How well did you know this?

Not at all

Perfectly

si on obtiens un rxy=0,7 (élevé), mais que X et Y ne respectent pas la relation linéraire, qu’est ce que ça veut dire?

pas significatif: Une corrélation élevée ne veut pas nécessairement dire qu’une liaison existe entre X et Y

(voir image)

How well did you know this?

Not at all

Perfectly

interprétez ce coefficient de relation

-: relation négative (quand X aug. Y dim.)
0,80: relation assez précise
p=0,02 : Corrélation est statistiquement différente de zéro

How well did you know this?

Not at all

Perfectly

V ou F: si n est très petit, on rejette H0:𝜌=0, même si rxy est assez proche de 0

F. c’est si n est très grand

How well did you know this?

Not at all

Perfectly

qui suis-je? La proportion de la variation totale d’une variable déterminée par ou attribuée à
la relation linéaire avec l’autre variable
.
(en bref, à quel point la variation est due l’association avec l’autre variable)

Coefficient de détermination R^2

How well did you know this?

Not at all

Perfectly

que suppose le coefficient de détermination R^2?

que la relation entre x et y est causale

How well did you know this?

Not at all

Perfectly

interprétez ce coefficient de corrélation (juste 4)

en supposant que la relation est causale, le R^2 nous permet de dire que 64% de la variation de y est expliquée par x

How well did you know this?

Not at all

Perfectly

quelle est la condition pour que r^2 aie du sens?

il FAUT que la relation soit linéaire

How well did you know this?

Not at all

Perfectly

V ou F: « r » n’est valide que pour la plage de valeurs étudiées

V: on ne peut pas extrapoler

How well did you know this?

Not at all

Perfectly

V ou F: la relation est linéaire et le r est seulement interprété pour la plage de donnée. On obtiens un r très élevé, on peut donc conclure que x cause y

F; les conditions sont respectée, on peut donc conclure qu'il y une correlation entre x et y CORRELATION≠CAUSALITÉ

quand 2 variables (x et y) sont liées, donnez 4 explications possibles

1. x cause y 2.y cause x 3. x et y sont affectés par une cause commune 4. biais dans l'étude crée faux lien

nommez les 4 similarités entre la régression linéaire et la corrélation

1. évalue la liaison entre x et y 2. décrit le sens de la relation 3. donne un R^2 4. relation linéaire

nommez les 4 différences entre la régression linéaire et la correlation 1. variables pas ____________ 2. estime aussi __________ 3. x peut être _______ ou _______ 4. on peut évaluer relation pour _______

1. variables pas interchangeables 2. estime aussi de COMBIEN y varie quand x augmente 3. x peut être qualitatif ou quantitatif 4. on peut évaluer relation pour plusieurs x en meme temps

formule de quoi?

Régression linéaire simple

concrètement, qu'est ce que ça signifie que x et y ne soient pas interchangeables pour la régression linéaire?

C.-à-d. On a déterminé a priori qu’une variable est une conséquence de l’autre (y (var. dépendante)= issue, x(var indépendante)=prédicteur)

question: Existe-t-il une relation linéaire entre la variable dépendante et le prédicteur? faites H0 et HA

H0: b1=0 (la pente de la relation entre les deux variables dans la population est égale à 0) HA : b1 ≠ 0) (la pente de la relation entre les deux variables dans la population est différente de 0)

à quoi correspondent b0 et b1 dans la formule de la régression linéaire simple?

b0: valeur de Y quand X=0 b1: pente de la droite de régression (mesure combien « Y » change par unité de changement de « X »)

avec quel(s) test(s) répond-on à la question: Existe-t-il une relation linéaire entre la variable dépendante et le prédicteur?

test de t ANOVA

quelles sont les étapes de réalisation de la régression linéaire simple? (4)

1. trouver la meilleure droite pour nuage 2. évaluer correlation 3.analyse de variance 4. t de student

c'est un logiciel qui trouve la droite la plus adéquate pour un nuage de point, mais expliquez en gros la méthode pour y arriver

-> méthode des points carrés (on trace une droite et on mesure les résiduels (distance entre chaque point et la droite), on additionne les résiduels, la droite avec la plus petite somme est la meilleure)

lors de l'analyse des variances pour une régression linéaire (ressemble à l'ANOVA), que mesure-t-on?

la variance entre valeur prédite (ŷ𝒊) par la droite et moyenne générale (ȳ) vs. la variance entre observations (𝒚𝒊) et valeur prédite (ŷ𝒊) par la droite

1. quel est l'Acronyme pour la variation totale (régression linéaire)? 2. pour la variation expliquée par la régression? 3. pour la variation résiduelle ou non expliquée?

1. (SCÉT) 2. (SCÉE) 3. (SCÉR)

associez les images (1,2,3) à a. variation expliquée par la régression b.variation résiduelle ou non expliquée? c.variation totale

1. c 2. a 3. b

associez les formules (1,2,3) à: a. variation expliquée par la régression b.variation résiduelle ou non expliquée? c.variation totale à ces formules

1. c 2. a 3. b

la variation totale est égale à la some de ...

la variation expliquée par la régression + la variation résiduelle ou non expliquée

quelle est cette formule?

analyse de variance Si F(1,n-2) > F𝛼 alors on rejette H0

dans quelle situation obtiens on une régression linaire qui ressemble à ca?

prédicteur (X) qualitatif (2 ou > 2 catégories) (droite relie alors les moyennes de chacun des groupes)

pour une régression linéaire avec X qualitatif, que signifie R^2?

La proportion de la variation de « Y » qui est expliquée par l’appartenance à un groupe plutôt qu’à un autre

quelles sont les 3 conditions d'application de la régression linéaire?

1. relation linéaire entre x et y 2. valeurs résiduelles suivent loi normale 3. homoscédasticité des résiduels

quels sont les 4 abus à éviter avec la régression linéaire?

1, Analyser des relations qui ne sont pas linéaires 2. Extrapoler au-delà des valeurs de l’étude 3. Conclure une relation cause-effet

V ou F contrairement au modèle de régression linaire simple qui ne tiens compte d'une seule variable dépendante, le modèle de régression multiple permet d'évaluer plusieurs variables dépendantes.

F. les deux évaluent 1 variable dépendante la multiple intègre + d'1 variable INDÉPENDANTE

lorsqu'on est pas sur que nos groupes sont homogènes, que nous permet la régression linéaire multiple?

de controler un biais de l'étude (ex. on veut évaluer effet tx sur lait, mais l'age et le poids de nos groupes ne sont pas homogènes -> en les incluants dans l'équation, il sont gardés constants)

interprétez (en gros) cet exemple de régression linéaire multiple

b1: effet du tx sur prod. de lait, quand l’âge et le poids sont gardés constants b2: effet de l’âge sur prod.de lait, qaund le tx et le poids sont gardés constants b3 : effet du poids sur la prod. de lait, lorsque le tx et l’âge sont gardés constants

qui suis-je? je sui un régression, comme la régression linéaire, mais ma variable dépendante est qualitative binaire!!

régression logistique

d'après vous, qu'est ce qui est illustré par ce graphique?

la régression logistique (courbe en s) de la relation entre une variable dépendante qualitative binaire (Y) et X

qu'est ce que les cotes (odds)?

à quel point il y a de chance que A se produise vs qu'il ne se produise pas. (Ex: probabilité d'être malade=70%, prob. d'être sain=30%, odds (malade)=0,7/0,3=2,33 -> on a 2,33 plus de chance d'être malade que sain. )

quelle est cette formule?

modèle de la régression logistique

associez les significations de b1 à variable dépendante qualitative ou quantitative 1. b1= rapport de cotes (odds ratio) de maladie quand « X » est présent vs. absent 2. b1= rapport de cotes de maladie quand « X » augmente d’une unité

1. qualitatif 2. quantitatif

probabilité que A arrive+probabilité que A n'arrive pas=?

qu'est ce que le rapport de cotes (odds ratio)?

il s'agit des cotes (odds) entre deux autres cotes

v ou f: un autre nom pour le rapport de cote est le rapport de risque

NON autre chose complètement, voir cours épidémio

qu'elle est cette formule?

rapport de cotes pour x qualitatif

peut on avoir plusieurs prédicteurs (x) pour une régression logisitique?

oui: régression logistique multiple

quels sont les condition d'application de la régression logistique? (1)

1. relation entre x et ln(𝑃(𝑌)/1−𝑃(𝑌)) est une droite

quel test utilise-t-on quand la variable indépendante est le TEMPS jusqu’à un évènement

analyse de survie

puisque le temps de survie pourrait être traité comme une variable quantitative, pourquoi n'utilise-t-on pas des tests comme le test de t, l'ANOVA ou la régression linéaire?

Plusieurs observations n’auront jamais l’événement (du moins pendant l’étude) (ex: on s'intéresse au nombre de mois entre la maladie et la mort sur 1 ans et 4 chiens ne meurent pas)

que sont les données censurées?

Les individus pour qui l’événement d’intérêt n’arrive pas pendant l’étude

qu'est ce qu'on obtient avec l'analyse de survie? (3)

1. un hazard ratio (HR) 2. un graphique du temps de survie 3. parfois le temps médian de survie

qui suis-je? facteur par lequel augmente le risque qu'un individu expérimente l'événement dans la prochaine période t en fonction de X

hazard ratio

comment le hazard ratio est-il impacté par X si X est qualitatif? X quantitatif?

qualitatif: HR= facteur par lequel le risque d'obtenir Y augmente quand X est présent ou non quantitatif: HR=facteur par lequel le risque d'obtenir Y augmente par unité de changement de X

que représente ce graphique?

courbe de survie (Kaplan-Meier) (pense pas que c important)

allez faire vos exercices :)

stat.module9-complet Flashcards

(67 cards)