stat.Module4-complet Flashcards

(40 cards)

1
Q

qui suis-je? ensemble de sujet possédant des caractéristiques
communes et exclusives, Ex: les vaches laitières du Québec en 2007

A

population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

qui suis-je? Sous-ensemble de la population (de 1 sujet à… la population au complet). je suis utilisé afin d’estimer la valeur d’un paramètre dans la population

A

échantillon

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

comment l’échantillon est-il utilisé afin d’estimer la valeur d’un paramètre dans la population?

A

en extrapolant ou en inférant de l’échantillon à la population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

quels sont les avantages (1) vs inconvénients (2) de l’échantillon?

A

a: moins couteux que recensement

d: perte de précision,
on peut trouver la prévalence la plus probable (ex pensez aux chiens obèses), mais l’intervalle de confiance est très grand)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

comment faire en sorte que l’échantillon soit le plus représentatif de la population?

A

Idéal:
Tirer au sort les individus de l’échantillon dans la population
+
avoir un n large

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

qu’est ce qu’on observe?

A

Problèmes de représentativité:
Deux échantillons fort semblables, mais ± représentatifs de leurs populations d’origine respectives

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

paramètre vs statistique?

A

ce sont tous les deux des mesures d’une caractéristique (moyenne, écart-type, variance, ect),
mais le paramètre= “vraie” valeur dans la population,
statistique= dans l’échantillon, donc un “estimé” de la valeur dans la population

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

identifiez les lettres pour chacun des paramètres/ statistiques suivant

indice: les statistiques sont souvent représentée par une lettre de l’alphabet, vs le paramètre est souvent représenté par une lettre grecque

A
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

avec un échantillon aléatoire, associez la moyenne et l’écart type à…
1. estimateur nonbiaisé de la population si n est grand
2. un estimé non-biaisé de la population même lorsque la taille d’échantillon est petite

A
  1. écart type
  2. moyenne
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

qui suis-je? phénomène selon lequel pour une variable donnée, les mesures individuelles varient dans la population

A

variation individuelle

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

donnez un exemple de variation individuelle appliqué à une variable qualitative vs quantitative

A

quantitative;
La glycémie varie d’un individu à l’autre,
La production de lait varie,
ect
qualitative:
Certains sont des Holstein, d’autres sont des Jersey ou des Ayrshire,
Certains sont morts, d’autres sont vivants,
ect

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

que cause la variation individuelle a/n des échantillons?

A

de la variation entre les échantillons

(si trop similaire: on soupçonne de l’erreur d’échantillonnage?)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

qui suis-je? on m’obtient en calculant une statistique (ex: moyenne, écart-type) dans chaque échantillons et en représentant celle-ci à travers tout les échantillons prélevés

A

La distribution d’échantillonnage

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

expliquez comment obtenir la distribution d’échantillonage (4 étapes)

A
  1. choisir une population (ex: vaches laitières au qc)
  2. piger plusieurs échantillons parmi cette population (ex: 250 échantillons de 50 vaches
  3. choisir une/des statistiques et calculer les pour tous les échantillons (ex: moyenne)
  4. créer un graphique de la distribution de la statistique (ex: image)
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

v ou f? une statistique (e.g. la moyenne) peut varier
d’un échantillon à l’autre par simple hasard

A

v

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

si on prends un échantillon (50 vaches) dans notre population de vaches au qc, qu’on le traite avec la poupoudre magique et qu’on observe que les vaches traitées ont une moyenne de production laitière de 10 100kg (241kg de plus que la moyenne de la population)

A

considérant qu’il s’Agit d’un exemple fictif, on peut comparer avec la distribution d’échantillonnage
de la moyenne pour tous les échantillons possibles

(ici on voit que la poudre magique a prob. rien changé)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

(parenthèse, mais important) que représente la valeur P d’un test statistique?

A

Représente la probabilité d’observer une valeur aussi ou plus extrême par hasard

18
Q

qu’est ce qui permet de déterminer la probabilité (P) que le résultat obtenu sois simplement du à l’erreur d’échantillonnage?

A

en théorie, la distribution d’échantillonnage de la statistique qui nous intéresse,

(en pratique, pas besoin de l’avoir à 100%:
juste besoin d’à peu près la forme de la distribution d’échantillonnage et quelques valeurs clés)

19
Q

(parenthèse)
quand on parle d’une distribution d’échantillonnage plutôt que d’un échantillon, qu’est ce qu’on utilise plutot qu‘écart-type’?
pourquoi?

A

‘erreur-type’
car la variation entre les statistiques d’un échantillon à l’autre est due à ‘l’erreur d’échantillonnage’

(Standard error (SE) en anglais)

20
Q

qui suis-je? je suis utile pour estimer la forme, la moyenne et l’erreur-type de la distribution d’échantillonnage de la moyenne

A

Théorème central limite

21
Q

quels sont les 3 points importants du Théorème central limite?

A

1.Si n ≥ 30→ distribution normale
2. La moyenne de la distribution d’échantillonnage des moyennes = moyenne de la population
3. erreur type= écart-type population/√n

22
Q

qu’est ce quon sous-entend quand on parle de taille d’échantillon ∞?

23
Q

quelle est la certitude qu’on prends le plus souvent pour l’intervalle de confiance?

24
Q

Comme on peut recréer la distribution d’échantillonnage de la moyenne, comment fait on pour trouver un IC particulier (e.g. IC 95%)?

A

trouver les valeurs qui correspondent aux percentiles 2.5 et 97.5 → 95% des valeurs possibles pour la moyenne seront contenues dans cette intervalle

25
normalement, pour pouvoir utiliser le théorème central limite, il faut que n ≥ 30. si n < 30, quelle est la condition pour l'utiliser?
données approximativement normale dans l’échantillon
26
formule de quoi?
théorème central limite et distribution T de Student t choisi selon 𝛼 et ddl (voir tableau) 𝛼= 1- niveau de confiance ddl= degrés de liberté= n -1
27
calculez un intervale de confiance avec les données suivantes: X̄=9,806kg s (écart-type) = 2,150 kg n = 20 vaches 𝛼=0,05 distribution de production ≈ Normale (utilisez le tableau pour la valeur de t)
28
Certains chercheurs utiliseront la distribution normale plutôt que T pour estimer IC 95% d’une moyenne ou d'une valeur de P. dans quelle circonstances n'est ce pas exact?
Ce n’est pas exact si n < 500
29
que peut on dire de l'intervalle de confiance (IC) lorsque n est petit (pour un meme 𝛼)?
il sera plus large
30
qui est 1 vs 2? (P et IC) lequel est le plus informatif?
1= P 2= IC, IC est plus informatif (donne une idée de la plage des valeurs possibles pour le paramètre)
31
pensez au calcul de l'intervalle de confiance pour un échantillon (ex: image). quelle est la différence avec le calcul pour la population?
la nomenclature est différente (image)
32
pensez au calcul de l'intervalle de confiance pour un échantillon (ex: image). quelle est la différence avec le calcul pour une proportion?
la condition n ≥ 30 est remplacée par: np et n(1-p) ≥ 10
33
quelle est l'erreur type de la distribution d’échantillonnage d’une proportion?
34
formule de quoi
calcul IC 95% d’une proportion
35
à quoi sert ce tableau?
à déterminer la valeur de z pour la formule de calcul d'IC d'une proportion
36
quels sont les autres noms pour le risque d'Erreur consentie?
erreur type ou 𝛼
37
pourquoi le risque d'erreur consentie s'appelle le risque d'erreur consentie?
pour un 𝛼=0,05, On consent à une probabilité de commettre une erreur de 5% ( Il y a tout de même 5% de chance que la ‘vraie’ valeur ne soit pas dans l’IC)
38
qu'arrive-t-il à la largeur de l'IC quand on augmente la certitude?
il s'élargit (notre estimation de la vraie valeur devient moins précise mais plus certaine)
39
quels sont les moyens controlables (2) et non-controlables (1) qu'on peut utiliser pour baisser la largeur de l'IC (augmentation de la précision)
controlable: 1.augmentation n 2. aug. 𝛼 (rarement modifié) incontrolable: 3. peu variation entre individus (plus les individus sont similaires, plus l’IC est étroit)
40
en fonction de quoi calcule-t-on la taille de l'échantillon avanr l'étude? (4)
1. 𝛼 choisi 2. Précision désirée 3. La variation (ex: écart-type ou proportion attendue) 4 (Formule Ancelle)