qui suis-je? ensemble de sujet possédant des caractéristiques
communes et exclusives, Ex: les vaches laitières du Québec en 2007
population
qui suis-je? Sous-ensemble de la population (de 1 sujet à… la population au complet). je suis utilisé afin d’estimer la valeur d’un paramètre dans la population
échantillon
comment l’échantillon est-il utilisé afin d’estimer la valeur d’un paramètre dans la population?
en extrapolant ou en inférant de l’échantillon à la population
quels sont les avantages (1) vs inconvénients (2) de l’échantillon?
a: moins couteux que recensement
d: perte de précision,
on peut trouver la prévalence la plus probable (ex pensez aux chiens obèses), mais l’intervalle de confiance est très grand)
comment faire en sorte que l’échantillon soit le plus représentatif de la population?
Idéal:
Tirer au sort les individus de l’échantillon dans la population
+
avoir un n large
qu’est ce qu’on observe?
Problèmes de représentativité:
Deux échantillons fort semblables, mais ± représentatifs de leurs populations d’origine respectives
paramètre vs statistique?
ce sont tous les deux des mesures d’une caractéristique (moyenne, écart-type, variance, ect),
mais le paramètre= “vraie” valeur dans la population,
statistique= dans l’échantillon, donc un “estimé” de la valeur dans la population
identifiez les lettres pour chacun des paramètres/ statistiques suivant
indice: les statistiques sont souvent représentée par une lettre de l’alphabet, vs le paramètre est souvent représenté par une lettre grecque
avec un échantillon aléatoire, associez la moyenne et l’écart type à…
1. estimateur nonbiaisé de la population si n est grand
2. un estimé non-biaisé de la population même lorsque la taille d’échantillon est petite
qui suis-je? phénomène selon lequel pour une variable donnée, les mesures individuelles varient dans la population
variation individuelle
donnez un exemple de variation individuelle appliqué à une variable qualitative vs quantitative
quantitative;
La glycémie varie d’un individu à l’autre,
La production de lait varie,
ect
qualitative:
Certains sont des Holstein, d’autres sont des Jersey ou des Ayrshire,
Certains sont morts, d’autres sont vivants,
ect
que cause la variation individuelle a/n des échantillons?
de la variation entre les échantillons
(si trop similaire: on soupçonne de l’erreur d’échantillonnage?)
qui suis-je? on m’obtient en calculant une statistique (ex: moyenne, écart-type) dans chaque échantillons et en représentant celle-ci à travers tout les échantillons prélevés
La distribution d’échantillonnage
expliquez comment obtenir la distribution d’échantillonage (4 étapes)
v ou f? une statistique (e.g. la moyenne) peut varier
d’un échantillon à l’autre par simple hasard
v
si on prends un échantillon (50 vaches) dans notre population de vaches au qc, qu’on le traite avec la poupoudre magique et qu’on observe que les vaches traitées ont une moyenne de production laitière de 10 100kg (241kg de plus que la moyenne de la population)
considérant qu’il s’Agit d’un exemple fictif, on peut comparer avec la distribution d’échantillonnage
de la moyenne pour tous les échantillons possibles
(ici on voit que la poudre magique a prob. rien changé)
(parenthèse, mais important) que représente la valeur P d’un test statistique?
Représente la probabilité d’observer une valeur aussi ou plus extrême par hasard
qu’est ce qui permet de déterminer la probabilité (P) que le résultat obtenu sois simplement du à l’erreur d’échantillonnage?
en théorie, la distribution d’échantillonnage de la statistique qui nous intéresse,
(en pratique, pas besoin de l’avoir à 100%:
juste besoin d’à peu près la forme de la distribution d’échantillonnage et quelques valeurs clés)
(parenthèse)
quand on parle d’une distribution d’échantillonnage plutôt que d’un échantillon, qu’est ce qu’on utilise plutot qu‘écart-type’?
pourquoi?
‘erreur-type’
car la variation entre les statistiques d’un échantillon à l’autre est due à ‘l’erreur d’échantillonnage’
(Standard error (SE) en anglais)
qui suis-je? je suis utile pour estimer la forme, la moyenne et l’erreur-type de la distribution d’échantillonnage de la moyenne
Théorème central limite
quels sont les 3 points importants du Théorème central limite?
1.Si n ≥ 30→ distribution normale
2. La moyenne de la distribution d’échantillonnage des moyennes = moyenne de la population
3. erreur type= écart-type population/√n
qu’est ce quon sous-entend quand on parle de taille d’échantillon ∞?
n ≥ 30
quelle est la certitude qu’on prends le plus souvent pour l’intervalle de confiance?
95%
Comme on peut recréer la distribution d’échantillonnage de la moyenne, comment fait on pour trouver un IC particulier (e.g. IC 95%)?
trouver les valeurs qui correspondent aux percentiles 2.5 et 97.5 → 95% des valeurs possibles pour la moyenne seront contenues dans cette intervalle