stat.Module3-complet Flashcards

(73 cards)

1
Q

les données peuvent être synthétisées avec des mesures comme la moyenne et l’écart type. comment appelle-t-on ces mesures?

A

paramètres

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

à quoi servent les paramètres?

A

à comparer différents groupes ou études

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

paramètre de dispersion vs position? (1 vs 2 )

A
  1. dispersion
  2. position
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

quels sont les paramètres de tendance centrale? (servent à décrire un individu ‘typique’ du groupe) (3)

A
  1. Moyenne
  2. Médiane
  3. Mode
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

quels sont les autres paramètres? (pas de tendance centrale) (3)

A
  1. Quartiles
  2. Percentiles
  3. Fréquence relative
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

comment la distribution doit elle être pour que les paramètres de tendance centrale soit valides?

A

la distribution doit être unimodale

(Il faut qu’il existe un individu typique vs. plusieurs individus typiques)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

qui suis-je? je suis la lettre ‘µ’

A

moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

formule de quoi?

A

calcul de la moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

en plus d’être unimodale, comment doit être la distribution pour que la moyenne représente bien la tendance centrale?

A

symétrique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

pour représenter un individu typique d’une distribution asymétrique, quel type de moyenne utilise-t-on?

A

Moyenne géométrique

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q
  1. comment effectuer la Moyenne géométrique?
  2. qu’est ce qu’on doit faire si les valeurs peuvent être négatives?
A
  1. On calcule le log de chaque donnée, puis on fait la moyenne des valeurs transformées, qu’on ramène ensuite à l’échelle originale
  2. Il faut alors ajouter une constante avant de faire log
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

comment calcule-t-on la médiane?

A

la médiane sépare les données en 2 groupes égaux

si N impair: valeur au centre
si N pair: moyenne des deux valeurs au centre

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

qui suis-je? je peux etre utilisé avec des données ordinales. je suis moins efficace que la moyenne car je n’utilise pas toutes les données dans mon calcul, dailleurs, je suis peu affectée par les données extrêmes.

A

la médiane

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

qui suis-je? je suis un paramètre très peu utilisé, et si les valeurs
d’une variable ne se répètent jamais, je n’existe pas! je n’indique rien quant à la symétrie et au nombre de pic.

A

le mode

(valeur qui revient le plus souvent)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

lorsqu’on a une distribution unimodale et symétrique (parfaitement), que pouvez vous dire à propre de la moyenne, de la médiane et du mode?

A

moyenne=médiane=mode

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

lorsqu’on a une distribution unimodale et asymétrique à droite, que pouvez vous dire à propre de la moyenne, de la médiane et du mode?

A

mode<médiane<moyenne

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

qui sommes nous? nous sommes les 3 valeurs qui partagent la distribution en 4

A

Les quartiles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

comment calcule-t-on les quartiles?

A

Q2=médiane
Q1= 0,25 (n),
Q3 = 0,75 (n)
arrondir!

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

qui somme nous? nous sommes les 99 valeurs qui partagent la
distribution en 100 groupes de tailles égales

A

les percentiles

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
20
Q

avec une variable qualitative, où les paramètres de positions sont inutiles, qu’est ce qu’on utilise à la place?

A

On présente fréquences relatives à la place

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
21
Q

lorsquon choisit quels parametres de position sont pertinent, de quoi tient-on compte principalement? (2)

A

Type de données,
Type de distribution

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
22
Q

considérant le choix des paramètre de position en fonction du type de donnée, nommez les paramètres pertinents pour…
1. Quantitatives
2. Qualitatives nominale
3. Qualitatives ordinale
4. Qualitatives binaire

A
  1. moyenne, médiane, mode
  2. mode ou fréquences relatives
  3. médiane, mode ou fréquences relatives
  4. proportion (0-100%)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
23
Q

v ou f: les paramètres de position sont insuffisants pour décrire
complètement des données

A

V: aussi besoin des paramètres de dispersion

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
24
Q

quels sont les principaux paramètres de dispersion ? (6)

A
  1. Minimum et maximum
  2. Étendue
  3. Étendue interquartile
  4. Variance
  5. Écart-type
  6. Coefficient de variation
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
25
dites en plus sur le maximum et le minimum
26
qui suis-je? je suis le maximum - minimum. comme je ne suis basée que sur deux données, je surestime la dispersion si elles sont extrêmes
étendue
27
qui suis-je? je suis Q3-Q1. je ne suis pas influencée par des données extrêmes, mais je ne présente la dispersion que du 50% central de la distribution
Étendue interquartile
28
qui suis-je? je résume l’écart entre chaque observation et la moyenne. je suis représentée par ‘σ2’, et je suis un des paramètres de dispersion les plus utilisés
Variance
29
c'est la formule de quoi?
σ2 = variance 𝑥𝑖=chaque observation 𝜇= moyenne 𝑁= nb d'observation
30
(parenthèse) lorsqu'on cherche la variance pour un échantillon et non d'une population, qu'est ce qui change a/n de la formule?
31
que signifie une variance élevée?
Observations sont très différentes (beaucoup de variation)
32
que signifie une variance basse?
Observations sont plus similaires (Variance = 0 → toutes les observations ont la même valeur)
33
la variance est-elle plutot utilisée en statistique descriptive ou inférentielle?
inférentielle (Comme statistique descriptive, ce n’est pas un nombre qui « parle » beaucoup)
34
qui suis-je? je suis la racine carrée de la variance, et je suis plus utilisée que celle-ci en stat descriptive. je suis symbolisée par σ
L’écart-type
35
quelle est la formule qu'on observe ici? si on cherchait cette valeur pour un échantillon et non une population, à quoi ressemblerait elle?
L’écart-type
36
définissez l'écart type en termes simples
c'est l’écart typique : écart qu'on observera en moyenne entre une donnée prise au hasard dans un échantillon et la moyenne de l’échantillon
37
qui suis-je? j'Estime le degré de dispersion pondérée par la moyenne. en gros, je permets de comparer des pommes avec des oranges (je permets de comparer directement la dispersion de plusieurs variables mesurées avec des unités différentes (e.g. années, kg et cm))
Coefficient de variation
38
c'est la formule de quoi?
CV= coefficient de variation σ= écart type 𝜇= moyenne
39
pour quel type de variable la moyenne= P, et voir image
Variance et écart-type d’une variable binaire
40
pour quelles variables peut on faire la description d’une distribution
Variables quantitatives seulement
41
qui suis-je? je mesure le degré de symétrie d’une distribution
Coefficient d’asymétrie (skewness)
42
c'est la formule de quoi? qu'est ce que ca veux dire si je suis... a. =0 b. >0 c. <0
Coefficient d’asymétrie a. distribution symétrique b. Asymétrique à droite c. Asymétrique à gauche
43
qui suis-je? je mesure le degré de concentration des données autour de la moyenne. lors de distribution standard, je suis = 3
Coefficient d’aplatissement (kurtosis)
44
c'est la formule de quoi? qu'est ce que ca veux dire si je suis... a. =3 b. >3 c. <3
Coefficient d’aplatissement a. distribution normale standard b. élevé, données proches de la moyenne (courbe pointue) c. faible, données très dispersés (courbe plate)
45
quelle est la principale raison de décrire une distribution?
si elle ressemble à une distribution théorique connue, on peut déterminer la probabilité d’observer une certaine valeur ou une valeur plus extrême par hasard
46
Dans cette série, quel est le 1er quartile? 1. 0,33 2. 0,42 3. 0,44 4. 0,45 5. 0,50 6. 0,52 7. 0, 55 8. 0, 56 9. 0, 61 10. 0,63
Q1= 0, 44
47
Dans cette série, quel est le 2eme quartile? 1. 0,33 2. 0,42 3. 0,44 4. 0,45 5. 0,50 6. 0,52 7. 0, 55 8. 0, 56 9. 0, 61 10. 0,63
Q2=0,51
48
Dans cette série, quel est le 3eme quartile? 1. 0,33 2. 0,42 3. 0,44 4. 0,45 5. 0,50 6. 0,52 7. 0, 55 8. 0, 56 9. 0, 61 10. 0,63
Q3= 0, 56
49
Dans cette série, quel est l'étendue interquartile? 1. 0,33 2. 0,42 3. 0,44 4. 0,45 5. 0,50 6. 0,52 7. 0, 55 8. 0, 56 9. 0, 61 10. 0,63
Q3 - Q1= 0,56 - 0,44 = 0,12
50
dans cette série, 1, 1, 2, 3, 4, 5, 5, 5, 6, 6, 7, 7, 22, 34 la moyenne géométrique sera a. > que la moyenne arithmétique b. < que la moyenne arithmétique c: = à la moyenne arithmétique
B
51
2
52
ici, la moyenne arithémétique sera a. > que la médiane b. < que la médiane c: = à la médiane
a
53
a. symétrique b. asymétrique à D c. asymétrique à G
b
54
a. unimodale b. bimodale
a
55
31
56
quel type de variable associe-t-on à la loit normale, la loi de T et la loi binomiale?
Loi normale et T = variable quantitative continue Loi binomiale = variable qualitative binaire
57
qui suis-je? je suis la loi la plus importante en statistiques, je suis beaucoup utilisée en biologie, et je permet d'observer que les valeurs loin de la moyenne sont moins probables
loi normale
58
quelle loi?
loi normale
59
vrai ou faux: les mesures biologiques suivent parfaitement la loi normale
F: Beaucoup de mesures biologiques suivent à peu près la loi normale
60
formule de quoi?
loi normale
61
nommez quelques particularités des distributions normales: 1. la médiane=? 2. le mode=? 3. quelle est la forme? 4. que pouvez vous dire de l'aire sous la courbe?
1,2. moyenne= médiane= mode 3. cloche qui s’étend vers ±∞ 4. =1 (image)
62
considérant qu'on ne peut pas établir une table de toutes les distributions normales possibles, que doit-on faire avec les variables?
les transformer : on fait de la distribution une "standard normal distribution" (Distribution normale centrée (i.e. µ=0) + réduite (i.e. écart-type est réduit à σ=1))
63
formule de quoi?
de transformation des variables
64
distribution rouge vs bleue?
65
quelle est l'utilité de ce tableau?
avec une distribution normale centrée réduite, il permet de déterminer la probabilité d'obtenir une certaine valeur de X
66
comment utiliser ce tableau? ex: on cherche la probabilité d'obtenir une production > 11,000 kg de lait/an pour une distribution avec 9,859 de moy et 2,011 d'écart type.
on commence par effectuer la calcul sur l'image ici, puis avec la valeur de Z obtenue (0,57), on retourne dans le tableau et on trouve l'aire au delà de Z (ici .2843) (P que prod > 11,000kg = P que Z > 0.57 = 0.2843 (i.e. 28%))
67
qui suis-je? je suis une loi utile quand on a un petit nombre d’observations. similairement à la loi normale, je suis en forme de cloche et je suis en fonction de µ et σ, mais je suis aussi en fonction de n (i.e. nombre d’observations)
Loi de T de Student
68
qu'arrive-t-il à la loi de student, quand le n est très grand?
69
qui suis-je? je suis une loi utile pour les variables qualitatives binaires. je permet de calculer la probabilité de k succès après n tentatives sachant qu’il y a une probabilité P de succès à chaque tentative
loi binomiale
70
formule de quoi?
loi binomiale n= taille échantillon P= prévalence réelle dans la population k= nb de sujet avec la caractéristique 𝑃 ( 𝑋 = 𝑘) = probabilité d'observer K sujet avec la charactéristique
71
quelles sont les suppositions à respecter avec la loi binomiale? (4)
1. Variable binaire 2. Échantillon sélectionné au hasard 3. Chaque individu à la même chance d’être sélectionné 4. taille de l’échantillon < 10% de la population totale
72
pourquoi ne peut on pas conclure que P=30% ?
car le hasard ne fait pas toujours bien les choses
73
dans cette situation, que va nous permettre la loi binomiale?
En utilisant la loi binomiale, on peut calculer la probabilité d’obtenir 3/10... ce qui nous permet de conclure que la prévalence d’obésité la plus probable chez les chiens au QC est autour de 30%, mais pourrait facilement (i.e. >5% de chance) être entre 10-55%