stat.Module4-complet Flashcards by Promo2029 Medvet

qui suis-je? ensemble de sujet possédant des caractéristiques
communes et exclusives, Ex: les vaches laitières du Québec en 2007

population

How well did you know this?

Not at all

Perfectly

qui suis-je? Sous-ensemble de la population (de 1 sujet à… la population au complet). je suis utilisé afin d’estimer la valeur d’un paramètre dans la population

échantillon

How well did you know this?

Not at all

Perfectly

comment l’échantillon est-il utilisé afin d’estimer la valeur d’un paramètre dans la population?

en extrapolant ou en inférant de l’échantillon à la population

How well did you know this?

Not at all

Perfectly

quels sont les avantages (1) vs inconvénients (2) de l’échantillon?

a: moins couteux que recensement

d: perte de précision,
on peut trouver la prévalence la plus probable (ex pensez aux chiens obèses), mais l’intervalle de confiance est très grand)

How well did you know this?

Not at all

Perfectly

comment faire en sorte que l’échantillon soit le plus représentatif de la population?

Idéal:
Tirer au sort les individus de l’échantillon dans la population
+
avoir un n large

How well did you know this?

Not at all

Perfectly

qu’est ce qu’on observe?

Problèmes de représentativité:
Deux échantillons fort semblables, mais ± représentatifs de leurs populations d’origine respectives

How well did you know this?

Not at all

Perfectly

paramètre vs statistique?

ce sont tous les deux des mesures d’une caractéristique (moyenne, écart-type, variance, ect),
mais le paramètre= “vraie” valeur dans la population,
statistique= dans l’échantillon, donc un “estimé” de la valeur dans la population

How well did you know this?

Not at all

Perfectly

identifiez les lettres pour chacun des paramètres/ statistiques suivant

indice: les statistiques sont souvent représentée par une lettre de l’alphabet, vs le paramètre est souvent représenté par une lettre grecque

How well did you know this?

Not at all

Perfectly

avec un échantillon aléatoire, associez la moyenne et l’écart type à…
1. estimateur nonbiaisé de la population si n est grand
2. un estimé non-biaisé de la population même lorsque la taille d’échantillon est petite

écart type
moyenne

How well did you know this?

Not at all

Perfectly

qui suis-je? phénomène selon lequel pour une variable donnée, les mesures individuelles varient dans la population

variation individuelle

How well did you know this?

Not at all

Perfectly

donnez un exemple de variation individuelle appliqué à une variable qualitative vs quantitative

quantitative;
La glycémie varie d’un individu à l’autre,
La production de lait varie,
ect
qualitative:
Certains sont des Holstein, d’autres sont des Jersey ou des Ayrshire,
Certains sont morts, d’autres sont vivants,
ect

How well did you know this?

Not at all

Perfectly

que cause la variation individuelle a/n des échantillons?

de la variation entre les échantillons

(si trop similaire: on soupçonne de l’erreur d’échantillonnage?)

How well did you know this?

Not at all

Perfectly

qui suis-je? on m’obtient en calculant une statistique (ex: moyenne, écart-type) dans chaque échantillons et en représentant celle-ci à travers tout les échantillons prélevés

La distribution d’échantillonnage

How well did you know this?

Not at all

Perfectly

expliquez comment obtenir la distribution d’échantillonage (4 étapes)

choisir une population (ex: vaches laitières au qc)
piger plusieurs échantillons parmi cette population (ex: 250 échantillons de 50 vaches
choisir une/des statistiques et calculer les pour tous les échantillons (ex: moyenne)
créer un graphique de la distribution de la statistique (ex: image)

How well did you know this?

Not at all

Perfectly

v ou f? une statistique (e.g. la moyenne) peut varier
d’un échantillon à l’autre par simple hasard

How well did you know this?

Not at all

Perfectly

si on prends un échantillon (50 vaches) dans notre population de vaches au qc, qu’on le traite avec la poupoudre magique et qu’on observe que les vaches traitées ont une moyenne de production laitière de 10 100kg (241kg de plus que la moyenne de la population)

considérant qu’il s’Agit d’un exemple fictif, on peut comparer avec la distribution d’échantillonnage
de la moyenne pour tous les échantillons possibles

(ici on voit que la poudre magique a prob. rien changé)

How well did you know this?

Not at all

Perfectly

(parenthèse, mais important) que représente la valeur P d’un test statistique?

Study These Flashcards

Représente la probabilité d’observer une valeur aussi ou plus extrême par hasard

qu’est ce qui permet de déterminer la probabilité (P) que le résultat obtenu sois simplement du à l’erreur d’échantillonnage?

Study These Flashcards

en théorie, la distribution d’échantillonnage de la statistique qui nous intéresse,

(en pratique, pas besoin de l’avoir à 100%:
juste besoin d’à peu près la forme de la distribution d’échantillonnage et quelques valeurs clés)

(parenthèse)
quand on parle d’une distribution d’échantillonnage plutôt que d’un échantillon, qu’est ce qu’on utilise plutot qu‘écart-type’?
pourquoi?

Study These Flashcards

‘erreur-type’
car la variation entre les statistiques d’un échantillon à l’autre est due à ‘l’erreur d’échantillonnage’

(Standard error (SE) en anglais)

qui suis-je? je suis utile pour estimer la forme, la moyenne et l’erreur-type de la distribution d’échantillonnage de la moyenne

Study These Flashcards

Théorème central limite

quels sont les 3 points importants du Théorème central limite?

Study These Flashcards

1.Si n ≥ 30→ distribution normale
2. La moyenne de la distribution d’échantillonnage des moyennes = moyenne de la population
3. erreur type= écart-type population/√n

qu’est ce quon sous-entend quand on parle de taille d’échantillon ∞?

Study These Flashcards

n ≥ 30

quelle est la certitude qu’on prends le plus souvent pour l’intervalle de confiance?

Study These Flashcards

95%

Comme on peut recréer la distribution d’échantillonnage de la moyenne, comment fait on pour trouver un IC particulier (e.g. IC 95%)?

Study These Flashcards

trouver les valeurs qui correspondent aux percentiles 2.5 et 97.5 → 95% des valeurs possibles pour la moyenne seront contenues dans cette intervalle

normalement, pour pouvoir utiliser le théorème central limite, il faut que n ≥ 30. si n < 30, quelle est la condition pour l'utiliser?

données approximativement normale dans l’échantillon

formule de quoi?

théorème central limite et distribution T de Student t choisi selon 𝛼 et ddl (voir tableau) 𝛼= 1- niveau de confiance ddl= degrés de liberté= n -1

calculez un intervale de confiance avec les données suivantes: X̄=9,806kg s (écart-type) = 2,150 kg n = 20 vaches 𝛼=0,05 distribution de production ≈ Normale (utilisez le tableau pour la valeur de t)

Certains chercheurs utiliseront la distribution normale plutôt que T pour estimer IC 95% d’une moyenne ou d'une valeur de P. dans quelle circonstances n'est ce pas exact?

Ce n’est pas exact si n < 500

que peut on dire de l'intervalle de confiance (IC) lorsque n est petit (pour un meme 𝛼)?

il sera plus large

qui est 1 vs 2? (P et IC) lequel est le plus informatif?

1= P 2= IC, IC est plus informatif (donne une idée de la plage des valeurs possibles pour le paramètre)

pensez au calcul de l'intervalle de confiance pour un échantillon (ex: image). quelle est la différence avec le calcul pour la population?

la nomenclature est différente (image)

pensez au calcul de l'intervalle de confiance pour un échantillon (ex: image). quelle est la différence avec le calcul pour une proportion?

la condition n ≥ 30 est remplacée par: np et n(1-p) ≥ 10

quelle est l'erreur type de la distribution d’échantillonnage d’une proportion?

formule de quoi

calcul IC 95% d’une proportion

à quoi sert ce tableau?

à déterminer la valeur de z pour la formule de calcul d'IC d'une proportion

quels sont les autres noms pour le risque d'Erreur consentie?

erreur type ou 𝛼

pourquoi le risque d'erreur consentie s'appelle le risque d'erreur consentie?

pour un 𝛼=0,05, On consent à une probabilité de commettre une erreur de 5% ( Il y a tout de même 5% de chance que la ‘vraie’ valeur ne soit pas dans l’IC)

qu'arrive-t-il à la largeur de l'IC quand on augmente la certitude?

il s'élargit (notre estimation de la vraie valeur devient moins précise mais plus certaine)

quels sont les moyens controlables (2) et non-controlables (1) qu'on peut utiliser pour baisser la largeur de l'IC (augmentation de la précision)

controlable: 1.augmentation n 2. aug. 𝛼 (rarement modifié) incontrolable: 3. peu variation entre individus (plus les individus sont similaires, plus l’IC est étroit)

en fonction de quoi calcule-t-on la taille de l'échantillon avanr l'étude? (4)

1. 𝛼 choisi 2. Précision désirée 3. La variation (ex: écart-type ou proportion attendue) 4 (Formule Ancelle)

stat.Module4-complet Flashcards

(40 cards)