Regresná analýza
Regresná analýza skúma vzťah medzi premennými.
Najčastejšie sa používa jednoduchá lineárna regresia, ktorá hovorí:
„Ako sa mení závislá premenná Y, keď sa mení nezávislá premenná X?“
Regresná analýza - 2 ciele
5 krokov v procese regresnej analýzy:
(+ 2 typy)
Jednoduchá lineárna regresia
typ regresnej analýzy, kde modelujeme vzťah medzi jednou závislou a jednou nezávislou premennou.
Viacnásobná regresia
typ regresnej analýzy, ktorý zahrňuje dve alebo viac nezávislých premenných.
Rozdiel medzi koreláciou a regresnou analýzou
Obidve sú používané na analýzu vzťahov medzi premennými.
Korelácia skúma existenciu a smer vzťahu medzi premennými, zatiaľ čo regresia sa zameriava na modelovanie tohto vzťahu na predpovedanie nových dát.
Korelácia - meria stupeň vzájomnej závislosti medzi dvoma premennými (-1 negatívna kor. 0 žiadna kor. +1 pozitívna kor.) Ale nevyjadruje príčinné vzťahy.
Cieľom regresnej analýzy je nielen identifikovať vzťah, ale aj kvantifikovať intenzitu tohto vzťahu a predpovedať hodnoty závislej premennej. Regresia poskytuje rovnicu, ktorá najlepšie opisuje vzťah medzi premennými, a tým umožňuje predpovedať alebo odhadnúť výsledky na základe známych hodnôt nezávislých premenných.
Zisťovanie normality (3)
Z-skóre
-výpočet šikmosti: skewness/ std. error of skw.= z-skóre
-výpočet špicatosti: kurtosis/ std. error of kurt. = z-skóre
-absolútna hodnota < 1,96
- vyššia ako 1,96 = nenormálne rozloženie
ako má vyzerať špicatosť pri normálne rozložených dátach?
M=Mdn=Mod
priemer vs. medián
aritmetický priemer vs. percentil (stredové číslo)
Štandardná odchýlka
SD (kard.pr.)
ako veľmi sa jednotlivé hodnoty v súbore (priemerne) líšia od priemeru.
Vnútorná konzistencia
- čo to je
- označenie a hodnoty
ako dobre spolu „držia“ položky dotazníka
Cronbachovo α
α > 0.9 → výborná
α > 0.8 → dobrá
α > 0.7 → prijateľná
Multikolinearita
- čo to je
- prečo je to problém
- ako ju zistíme (2) a hodnoty
vo viacnásobnej lineárnej regresii
Problém, keď sú nezávislé premenné silno korelované medzi sebou.
To spôsobuje:
1. Skreslené (nestabilné) odhady regresných koeficientov
2. Ťažko sa určí, ktorá nez. premenná má vplyv
Ako ju zistiť?
✅ Korelačná matica: ak medzi nezávislými premennými je korelácia r > 0.8, pozor
✅ VIF (Variance Inflation Factor):
VIF = 1 → žiadny problém
VIF > 5 → vážna multikolinearita
VIF > 10 → kritická
Replikovateľnosť
spoľahlivosť celého výskumu (nie použitého testu)
„Dostanú iní výskumníci rovnaký výsledok, ak zopakujú štúdiu rovnakým postupom (dizajn + zber dát + analýza)?“
McNemar
- kedy sa používa
- čo ma zaujíma vo výsledkoch
Cochran
- kedy sa používa
- čo ma zaujíma vo výsledkoch
Wilcoxon
- kedy sa používa
- čo ma zaujíma vo výsledkoch
Friedman
- kedy sa používa
- čo ma zaujíma vo výsledkoch
chí-kvadrát
- kedy sa používa
- čo ma zaujíma vo výsledkoch
Spearman
- kedy sa používa
- čo ma zaujíma vo výsledkoch
Pearson
- kedy sa používa
- čo ma zaujíma vo výsledkoch
Mann-Whitney
- kedy sa používa
- čo ma zaujíma vo výsledkoch
Kruskal-Wallis (neparametricka ANOVA)
- kedy sa používa
- čo ma zaujíma vo výsledkoch
nepárový t-test
- kedy sa používa
- čo ma zaujíma vo výsledkoch