stat.Module2-complet Flashcards

(46 cards)

1
Q

lors de compilation de données dans un chiffrier (ex: excel), que représentent généralement les lignes vs les colonnes?

A

Chaque ligne= une observation (e.g. un
individu)
Chaque colonne= une variable (e.g. âge,
malade/sain, date d’échantillonnage…)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
2
Q

quel type de description des données suis-je? je suis la première étape et je suis très important. je décris une variable à la fois.

A

Description univariée

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
3
Q

que permet la description univariée? (4)

A
  1. le nettoyage des données (données aberrantes, erreurs)
  2. se familiariser et décrire les données
  3. indique représentations graphiques et tables utiles
  4. Indique analyses statistiques appropriée
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
4
Q

dans un contexte de tri des données, déterminer qui est la variable quantitative vs qualitative;

  1. Regroupe les données par catégorie+ Permet de voir certaines erreurs
  2. Permet rapidement de voir min, max et données manquantes+ erreurs et données aberrantes
A
  1. qualitative
  2. quantitative
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
5
Q

quelle erreur potentielle observe-t-on ici?

A

120 kg de lait en 120 jours?
Erreur de frappe?
À corriger ou exclure?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
6
Q

quelle erreur potentielle observe-t-on ici?

A

Lignes 2 à 1926 → 0
Lignes 1927 à 1976 → 1
Ligne 1977 → 2 ??? Erreur?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
7
Q

quelle erreur potentielle observe-t-on ici?

A

Varie de 1 à 298 jours
Donnée semble manquante pour près de 400 vaches?

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
8
Q

Pour explorer, présenter et même parfois pour analyser les données, que peut on faire avec nos variables quantitatives?
comment s’appelle ce processus?

A

on transformera parfois une
variable quantitative en créant des catégories
-> discrétisation

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
9
Q

quel sont les différents types d’échelles qu’on peut choisir lors de la discrétisation?

A
  1. Échelle par amplitude
  2. Échelle par fréquence
  3. Échelle de convenance
How well did you know this?
1
Not at all
2
3
4
5
Perfectly
10
Q

qui suis-je? je suis une échelle de discrétisation. lorsqu’on m’utilise, On choisit des intervalles égaux puis on compte le nombre de sujet par intervalles.

A

échelle par amplitude

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
11
Q

qui suis-je? je suis une échelle de discrétisation. lorsqu’on m’utilise, mes intervalles sont choisit en fonction de la pertinence des bornes

A

Échelle de convenance

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
12
Q

qui suis-je? je suis une échelle de discrétisation. lorsqu’on m’utilise, On divise les observations en groupes égaux, puis les bornes des intervalles sont ensuite délimitées

A

Échelle par fréquence

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
13
Q

quelle échelle de fréquence observe-t-on?

A

Échelle de convenance

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
14
Q

quelle échelle de fréquence observe-t-on?

A

Échelle par fréquence

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
15
Q

quelle échelle de fréquence observe-t-on?

A

échelle par amplitude

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
16
Q

quelle échelle de fréquence (discrétisation) utilise-t-on afin de présenter les données aux lecteurs?

A

l’échelle qui ‘communique’ le mieux l’information

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
17
Q

quelle échelle de fréquence (discrétisation) utilise-t-on dans les analyses statistiques?

A

-> Échelle de convenance souvent mieux reliée à la
biologie du phénomène étudié

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
18
Q

que peut on faire avec des variables quantitative exprimée par des nombres difficiles à manipuler?

A

On pourra les transformer pour faciliter interprétation

(ex: transformation logarithmique)

How well did you know this?
1
Not at all
2
3
4
5
Perfectly
19
Q

qui suis-je? je suis une transformation de variables quantitatives très utilisé en biologie et sciences santé qui facilite l’interprétation de plusieurs statistiques lorsque la distribution s’étire de façon exponentielle vers une des extrémités

A

Transformation logarithmique (naturel ou autre) de x

20
Q

qu’Est ce qu’on utilise pour visualiser et décrire les variables qualitatives? (discrétisation)

A

Effectifs et fréquences relatives

21
Q

associez
a. effectifs
b. Fréquences relatives
c. Fréquences cumulées

1.Nb de sujets/catégorie
2. On ajoute les fréquences relatives des catégories inférieures
3.Nb de sujets/catégorie / nb total

22
Q

associez 1,2,3 à
effectifs, Fréquences relatives, Fréquences cumulées

A
  1. effectifs,
  2. Fréquences relatives,
  3. Fréquences cumulées
23
Q

qui suis-je (tableau, graphique, paramètres)?
Précis mais peuvent contenir beaucoup de nombres:
rend plus difficile la visualisation des données et
prend de la place (e.g. dans un article)

24
Q

qui suis-je (tableau, graphique, paramètres)?
Illustre souvent peu l’image globale et perte d’information
(ex; surf island)

25
qui suis-je (tableau, graphique, paramètres)? Illustrent souvent mieux l’image globale, mais parfois perte d’information (rigueur scientifique vs. clarté).
graphique
26
qu'est ce qui est illustré ici en 1 vs en 2? (permis par la table de fréquence)
on peut représenter la distributions de 2 ou plusieurs variables qualitatives 1: indépendamment 2: entre elles
27
nommez les 5 représentations graphiques les plus importantes
1. Diagramme en barres 2. Diagramme circulaire 3.Histogramme de fréquences 4. Diagramme en boîte 5. Diagramme de dispersion
28
quel type de variable présente-on avec le diagramme en barres?
qualitatives nominales ou ordinales
29
qu'est ce qui est important de surveiller avec de type de graphique?
Quand fréquence relative est présentée, préférable d’avoir un axe des ordonnées complet (i.e. de 0-100%), (axe des effectifs tronqué donne l'impression que la différence entre les groupes est plus importante)
30
quel type de variable présente-on avec le diagramme circulaire?
qualitative seulement (ou quantitative discrétisée)
31
qui suis-je? je ne permet de représenter qu’une seule variable à la fois, et je suis difficile à visualiser lorsqu'il y a beaucoup de catégories. la surface de mes secteurs est proportionnelle à l’effectif des catégories représentées
Diagramme circulaire
32
quel type de variable présente-on avec l'Histogramme de fréquence?
quantitative discrète ou continue
33
quelle est la différence entre un diagramme à barre et un histogramme de fréquence
les catégories du diagramme en barre sont des noms vs les catégories de l'histogramme de fréquence représentent des intervalles sur une échelle de mesure continue
34
quel type de représentation graphique observe-t-on? quelle est la particularité ici?
Histogramme de fréquence présentation des distributions par niveau d’une autre variable (Une variable quantitative et une qualitative sur un même graphique)
35
quelles sont les règles de l'histogramme de fréquence? 1. comment doivent être les intervalles? 2. que fait-on lorsqu'un intervalle est vide? 3. comment divise-t-on les données? 4. une fois les observations réparties, que fait-on?
1. tous être de taille équivalente 2. le vide doit apparaitre sur le graphique 3. en 5 à 15 catégories à intervalles égaux 4. on compte le nombre d’observations par catégorie et on construit l'histogramme.
36
en quoi l'histogramme de fréquence permet-il de décrire la distribution? ( 4)
1. nb de pics 2. symétrie 3. aplatissement 4. similitude avec une distribution théorique (parfois) ex: normale, poisson
37
en terme de nb de pics, comment peut etre la distribution? (histogramme de fréquence)
Unimodale, bimodale, multimodale ( ≥ 2 pics: souvent le résultat d’une caractéristique sous-jacente, voir image)
38
en terme de symétrie, comment peut etre la distribution? (histogramme de fréquence)
(seulement si unimodal) Symétrique vs asymétrique (asymétrique à droite = longue queue à droite)
39
quel type de variable présente-on avec le diagramme en boite?
Variable quantitative (souvent par catégorie d’une variable qualitative)
40
sur ce diagramme en boite (box plot), identifiez les éléments importants (1-7)
1. donnée extrême 2. moustache (ici autre valeur que maximum) 3. Q3 (75% observations) 4. Q2 (50% observations) 5. moyenne 6. Q1 (25% observations) 7. moustache (ici autre valeur que minimum
41
concernant les moustaches du diagramme en boite, quelles sont les différentes facons de faire? (3)
1. valeurs max et min 2. autre percentile (ex: 5 ou 95) 3. autre valeur (voir autre flash card pour formule)
42
lors de l'utilisation d'une autre valeur pour les moustaches du diagramme en boite, quelle est la formule mentionnée dans le ppt?
Q1: valeur à 25% des données Q2: à 50% des données Q3: à 75% des données EIQ: écart interquartile (Q3-Q1)
43
comment le diagramme en boite permet-il de déduire la symétrie de la distribution?
Diviser le diagramme à la médiane, si longueurs égales → symétrie
44
quel type de variable présente-on avec le diagramme de dispersion?
relation entre 2 variables quantitatives
45
que permet d'évaluer le diagramme de dispersion? (image) à quoi doit-on faire attention?
la forme de la relation, Certaines procédures statistiques tentent de tirer une droite: pas toujours une représentation adéquate
46
que nous permet le diagramme de dispersion (illustré ici)
permet de faire apparaitre des points anormaux qu'on ne remarque pas en observant X et Y indépendamment