stat.Module3-complet Flashcards by Promo2029 Medvet

les données peuvent être synthétisées avec des mesures comme la moyenne et l’écart type. comment appelle-t-on ces mesures?

paramètres

How well did you know this?

Not at all

Perfectly

à quoi servent les paramètres?

à comparer différents groupes ou études

How well did you know this?

Not at all

Perfectly

paramètre de dispersion vs position? (1 vs 2 )

dispersion
position

How well did you know this?

Not at all

Perfectly

quels sont les paramètres de tendance centrale? (servent à décrire un individu ‘typique’ du groupe) (3)

Moyenne
Médiane
Mode

How well did you know this?

Not at all

Perfectly

quels sont les autres paramètres? (pas de tendance centrale) (3)

Quartiles
Percentiles
Fréquence relative

How well did you know this?

Not at all

Perfectly

comment la distribution doit elle être pour que les paramètres de tendance centrale soit valides?

la distribution doit être unimodale

(Il faut qu’il existe un individu typique vs. plusieurs individus typiques)

How well did you know this?

Not at all

Perfectly

qui suis-je? je suis la lettre ‘µ’

moyenne

How well did you know this?

Not at all

Perfectly

formule de quoi?

calcul de la moyenne

How well did you know this?

Not at all

Perfectly

en plus d’être unimodale, comment doit être la distribution pour que la moyenne représente bien la tendance centrale?

symétrique

How well did you know this?

Not at all

Perfectly

pour représenter un individu typique d’une distribution asymétrique, quel type de moyenne utilise-t-on?

Moyenne géométrique

How well did you know this?

Not at all

Perfectly

comment effectuer la Moyenne géométrique?
qu’est ce qu’on doit faire si les valeurs peuvent être négatives?

On calcule le log de chaque donnée, puis on fait la moyenne des valeurs transformées, qu’on ramène ensuite à l’échelle originale
Il faut alors ajouter une constante avant de faire log

How well did you know this?

Not at all

Perfectly

comment calcule-t-on la médiane?

la médiane sépare les données en 2 groupes égaux

si N impair: valeur au centre
si N pair: moyenne des deux valeurs au centre

How well did you know this?

Not at all

Perfectly

qui suis-je? je peux etre utilisé avec des données ordinales. je suis moins efficace que la moyenne car je n’utilise pas toutes les données dans mon calcul, dailleurs, je suis peu affectée par les données extrêmes.

la médiane

How well did you know this?

Not at all

Perfectly

qui suis-je? je suis un paramètre très peu utilisé, et si les valeurs
d’une variable ne se répètent jamais, je n’existe pas! je n’indique rien quant à la symétrie et au nombre de pic.

le mode

(valeur qui revient le plus souvent)

How well did you know this?

Not at all

Perfectly

lorsqu’on a une distribution unimodale et symétrique (parfaitement), que pouvez vous dire à propre de la moyenne, de la médiane et du mode?

moyenne=médiane=mode

How well did you know this?

Not at all

Perfectly

lorsqu’on a une distribution unimodale et asymétrique à droite, que pouvez vous dire à propre de la moyenne, de la médiane et du mode?

mode<médiane<moyenne

How well did you know this?

Not at all

Perfectly

qui sommes nous? nous sommes les 3 valeurs qui partagent la distribution en 4

Les quartiles

How well did you know this?

Not at all

Perfectly

comment calcule-t-on les quartiles?

Q2=médiane
Q1= 0,25 (n),
Q3 = 0,75 (n)
arrondir!

How well did you know this?

Not at all

Perfectly

qui somme nous? nous sommes les 99 valeurs qui partagent la
distribution en 100 groupes de tailles égales

les percentiles

How well did you know this?

Not at all

Perfectly

avec une variable qualitative, où les paramètres de positions sont inutiles, qu’est ce qu’on utilise à la place?

On présente fréquences relatives à la place

How well did you know this?

Not at all

Perfectly

lorsquon choisit quels parametres de position sont pertinent, de quoi tient-on compte principalement? (2)

Type de données,
Type de distribution

How well did you know this?

Not at all

Perfectly

considérant le choix des paramètre de position en fonction du type de donnée, nommez les paramètres pertinents pour…
1. Quantitatives
2. Qualitatives nominale
3. Qualitatives ordinale
4. Qualitatives binaire

moyenne, médiane, mode
mode ou fréquences relatives
médiane, mode ou fréquences relatives
proportion (0-100%)

How well did you know this?

Not at all

Perfectly

v ou f: les paramètres de position sont insuffisants pour décrire
complètement des données

V: aussi besoin des paramètres de dispersion

How well did you know this?

Not at all

Perfectly

quels sont les principaux paramètres de dispersion ? (6)

Minimum et maximum
Étendue
Étendue interquartile
Variance
Écart-type
Coefficient de variation

How well did you know this?

Not at all

Perfectly

dites en plus sur le maximum et le minimum

qui suis-je? je suis le maximum - minimum. comme je ne suis basée que sur deux données, je surestime la dispersion si elles sont extrêmes

étendue

qui suis-je? je suis Q3-Q1. je ne suis pas influencée par des données extrêmes, mais je ne présente la dispersion que du 50% central de la distribution

Étendue interquartile

qui suis-je? je résume l’écart entre chaque observation et la moyenne. je suis représentée par ‘σ2’, et je suis un des paramètres de dispersion les plus utilisés

Variance

c'est la formule de quoi?

σ2 = variance 𝑥𝑖=chaque observation 𝜇= moyenne 𝑁= nb d'observation

(parenthèse) lorsqu'on cherche la variance pour un échantillon et non d'une population, qu'est ce qui change a/n de la formule?

que signifie une variance élevée?

Observations sont très différentes (beaucoup de variation)

que signifie une variance basse?

Observations sont plus similaires (Variance = 0 → toutes les observations ont la même valeur)

la variance est-elle plutot utilisée en statistique descriptive ou inférentielle?

inférentielle (Comme statistique descriptive, ce n’est pas un nombre qui « parle » beaucoup)

qui suis-je? je suis la racine carrée de la variance, et je suis plus utilisée que celle-ci en stat descriptive. je suis symbolisée par σ

L’écart-type

quelle est la formule qu'on observe ici? si on cherchait cette valeur pour un échantillon et non une population, à quoi ressemblerait elle?

L’écart-type

définissez l'écart type en termes simples

c'est l’écart typique : écart qu'on observera en moyenne entre une donnée prise au hasard dans un échantillon et la moyenne de l’échantillon

qui suis-je? j'Estime le degré de dispersion pondérée par la moyenne. en gros, je permets de comparer des pommes avec des oranges (je permets de comparer directement la dispersion de plusieurs variables mesurées avec des unités différentes (e.g. années, kg et cm))

Coefficient de variation

c'est la formule de quoi?

CV= coefficient de variation σ= écart type 𝜇= moyenne

pour quel type de variable la moyenne= P, et voir image

Variance et écart-type d’une variable binaire

pour quelles variables peut on faire la description d’une distribution

Variables quantitatives seulement

qui suis-je? je mesure le degré de symétrie d’une distribution

Coefficient d’asymétrie (skewness)

c'est la formule de quoi? qu'est ce que ca veux dire si je suis... a. =0 b. >0 c. <0

Coefficient d’asymétrie a. distribution symétrique b. Asymétrique à droite c. Asymétrique à gauche

qui suis-je? je mesure le degré de concentration des données autour de la moyenne. lors de distribution standard, je suis = 3

Coefficient d’aplatissement (kurtosis)

c'est la formule de quoi? qu'est ce que ca veux dire si je suis... a. =3 b. >3 c. <3

Coefficient d’aplatissement a. distribution normale standard b. élevé, données proches de la moyenne (courbe pointue) c. faible, données très dispersés (courbe plate)

quelle est la principale raison de décrire une distribution?

si elle ressemble à une distribution théorique connue, on peut déterminer la probabilité d’observer une certaine valeur ou une valeur plus extrême par hasard

Dans cette série, quel est le 1er quartile? 1. 0,33 2. 0,42 3. 0,44 4. 0,45 5. 0,50 6. 0,52 7. 0, 55 8. 0, 56 9. 0, 61 10. 0,63

Q1= 0, 44

Dans cette série, quel est le 2eme quartile? 1. 0,33 2. 0,42 3. 0,44 4. 0,45 5. 0,50 6. 0,52 7. 0, 55 8. 0, 56 9. 0, 61 10. 0,63

Q2=0,51

Dans cette série, quel est le 3eme quartile? 1. 0,33 2. 0,42 3. 0,44 4. 0,45 5. 0,50 6. 0,52 7. 0, 55 8. 0, 56 9. 0, 61 10. 0,63

Q3= 0, 56

Dans cette série, quel est l'étendue interquartile? 1. 0,33 2. 0,42 3. 0,44 4. 0,45 5. 0,50 6. 0,52 7. 0, 55 8. 0, 56 9. 0, 61 10. 0,63

Q3 - Q1= 0,56 - 0,44 = 0,12

dans cette série, 1, 1, 2, 3, 4, 5, 5, 5, 6, 6, 7, 7, 22, 34 la moyenne géométrique sera a. > que la moyenne arithmétique b. < que la moyenne arithmétique c: = à la moyenne arithmétique

ici, la moyenne arithémétique sera a. > que la médiane b. < que la médiane c: = à la médiane

a. symétrique b. asymétrique à D c. asymétrique à G

a. unimodale b. bimodale

quel type de variable associe-t-on à la loit normale, la loi de T et la loi binomiale?

Loi normale et T = variable quantitative continue Loi binomiale = variable qualitative binaire

qui suis-je? je suis la loi la plus importante en statistiques, je suis beaucoup utilisée en biologie, et je permet d'observer que les valeurs loin de la moyenne sont moins probables

loi normale

quelle loi?

loi normale

vrai ou faux: les mesures biologiques suivent parfaitement la loi normale

F: Beaucoup de mesures biologiques suivent à peu près la loi normale

formule de quoi?

loi normale

nommez quelques particularités des distributions normales: 1. la médiane=? 2. le mode=? 3. quelle est la forme? 4. que pouvez vous dire de l'aire sous la courbe?

1,2. moyenne= médiane= mode 3. cloche qui s’étend vers ±∞ 4. =1 (image)

considérant qu'on ne peut pas établir une table de toutes les distributions normales possibles, que doit-on faire avec les variables?

les transformer : on fait de la distribution une "standard normal distribution" (Distribution normale centrée (i.e. µ=0) + réduite (i.e. écart-type est réduit à σ=1))

formule de quoi?

de transformation des variables

distribution rouge vs bleue?

quelle est l'utilité de ce tableau?

avec une distribution normale centrée réduite, il permet de déterminer la probabilité d'obtenir une certaine valeur de X

comment utiliser ce tableau? ex: on cherche la probabilité d'obtenir une production > 11,000 kg de lait/an pour une distribution avec 9,859 de moy et 2,011 d'écart type.

on commence par effectuer la calcul sur l'image ici, puis avec la valeur de Z obtenue (0,57), on retourne dans le tableau et on trouve l'aire au delà de Z (ici .2843) (P que prod > 11,000kg = P que Z > 0.57 = 0.2843 (i.e. 28%))

qui suis-je? je suis une loi utile quand on a un petit nombre d’observations. similairement à la loi normale, je suis en forme de cloche et je suis en fonction de µ et σ, mais je suis aussi en fonction de n (i.e. nombre d’observations)

Loi de T de Student

qu'arrive-t-il à la loi de student, quand le n est très grand?

qui suis-je? je suis une loi utile pour les variables qualitatives binaires. je permet de calculer la probabilité de k succès après n tentatives sachant qu’il y a une probabilité P de succès à chaque tentative

loi binomiale

formule de quoi?

loi binomiale n= taille échantillon P= prévalence réelle dans la population k= nb de sujet avec la caractéristique 𝑃 ( 𝑋 = 𝑘) = probabilité d'observer K sujet avec la charactéristique

quelles sont les suppositions à respecter avec la loi binomiale? (4)

1. Variable binaire 2. Échantillon sélectionné au hasard 3. Chaque individu à la même chance d’être sélectionné 4. taille de l’échantillon < 10% de la population totale

pourquoi ne peut on pas conclure que P=30% ?

car le hasard ne fait pas toujours bien les choses

dans cette situation, que va nous permettre la loi binomiale?

En utilisant la loi binomiale, on peut calculer la probabilité d’obtenir 3/10... ce qui nous permet de conclure que la prévalence d’obésité la plus probable chez les chiens au QC est autour de 30%, mais pourrait facilement (i.e. >5% de chance) être entre 10-55%

stat.Module3-complet Flashcards

(73 cards)