Corrélation curvilinéaire
La relation entre les variables est mieux décrite par une ligne courbe
William Playfair
crédité pour l’invention du
diagramme à barres et circulaire
Sir Francis Galton
L’origine du diagramme de dispersion
Karl Pearson
Le calcul du coefficient de corrélation
Coefficient de corrélation
Décrit mathématiquement la grandeur moyenne du degré de similarité de la position des données sur nos variables (X, Y).
Restriction de l’étendue
Corrélation chute
Valeurs extrêmes
Une valeur extrême qui est alignée avec le “ballon de football” augmente drastiquement la valeur de r; Une valeur extreme qui est orthogonale (perpendiculaire) avec le “ballon de football” réduit drastiquement la valeur de r.; Une valeur extreme peut également faire apparaître une corrélation où il y en n’avait pas (corrélation nulle) -> plus notre échantillon est grand, le plus on réduit l’impact relatif d’un seul score extreme sur r
R^2 ou coefficient de détermination
renseigne sur le degré de reduction de l’incertitude
ex. : r^2 = 0.16
Cela signifie que 16% de la variance de la deuxième variable pouvant
être prédite à partir de la première