Introduction to Statistical Modeling Flashcards

Question

What is omitted variable bias?

Answer 1

Bias in coefficient estimates when a relevant predictor is left out and correlated with included predictors.

Answer 2

Strong correlation among predictors causing unstable coefficient estimates and large SEs.

Answer 3

0/1 indicator variable used to encode categories.

Answer 4

Baseline group omitted from dummies; other category coefficients are relative to it.

Answer 5

Product of predictors allowing effect of one predictor to depend on another.

Answer 6

Non-constant error variance across X or fitted values.

Answer 7

Constant error variance: Var(ε_i)=σ^2.

Answer 8

Correlation between errors over time/order (violates independence).

Answer 9

How extreme a point’s X values are relative to others (potential influence on fit).

Answer 10

How much removing a point changes estimates/predictions.

Answer 11

Point with unusual Y given X (large residual).

Answer 12

Outlier: large residual; influential: changes model fit/coefficients strongly (often high leverage).

Answer 13

A condition about data-generating process that must hold for standard inference to be valid.

Answer 14

Linearity, Independence, Homoskedasticity, Normality (often ranked with first two most critical).

Answer 15

Mean function E[Y|X] is correctly modeled (no systematic structure left in residuals).

Answer 16

Errors/observations are independent: Cov(ε_i, ε_j)=0 for i≠j (no clustering/time dependence).

Answer 17

Errors are normally distributed (mainly affects exact small-sample inference).

Answer 18

Using same data to explore/generate hypotheses then confirm/test them → inflated false positives.

Answer 19

Pre-specify or split data into exploratory vs confirmatory sets; use CV for prediction.

Answer 20

Model fits noise in training data, reducing out-of-sample performance.

Answer 21

Model too simple to capture true structure; systematic errors remain.

Answer 22

More complex models reduce bias but increase variance; optimal complexity balances both.

Answer 23

A mathematical description of how data are generated: systematic signal + random noise. Intuition: data vary even at same X.

Answer 24

The outcome variable you want to explain or predict.

Answer 25

A variable used to explain or predict Y.

Answer 26

The average value of Y among units with the same X; the regression function targets this.

Answer 27

Random deviation of observed Y from the model mean at X; captures unmeasured factors + randomness.

Answer 28

e_i = y_i − ŷ_i (observed minus fitted); estimate of ε_i.

Answer 29

The model’s predicted mean response at X_i.

Answer 30

β's enter as a linear combination: β0 + β1 g1(x)+…; β not multiplied together or inside nonlinear functions.

Answer 31

y = β0 + β1 x + β2 x^2 + ε (polynomial regression).

Answer 32

Expected/average Y when all predictors equal 0 (may be non-meaningful if 0 is outside range).

Answer 33

Average change in E[Y|x] for a 1-unit increase in x; association, not necessarily causation.

Answer 34

Average change in E[Y|X] for 1-unit increase in x_j holding other predictors constant (adjusted effect).

Answer 35

A variable related to both X and Y that can distort the observed X–Y association.

Answer 36

Data collected without random assignment; causal claims require stronger assumptions.

Answer 37

Study with random assignment of treatments; supports causal inference under proper design.

Answer 38

Observed subset of the population.

Answer 39

Full set of units you want to generalize to.

Answer 40

Single entity measured (person, firm, day, site, etc.).

Answer 41

Sample resembles population; supports generalization.

Answer 42

Turning an abstract construct into a measurable variable.

Answer 43

Whether the measured variable truly captures the intended construct (measurement matches concept).

Answer 44

Whether observed association reflects causal effect within the studied sample (no major bias/confounding).

Answer 45

Whether results generalize to other populations/settings.

Answer 46

Choice of predictors/functional form (transformations/interactions) included in the model.

Answer 47

Bias in coefficient estimates when a relevant predictor is left out and correlated with included predictors.

Answer 48

Strong correlation among predictors causing unstable coefficient estimates and large SEs.

Answer 49

0/1 indicator variable used to encode categories.

Answer 50

Baseline group omitted from dummies; other category coefficients are relative to it.

Answer 51

Product of predictors allowing effect of one predictor to depend on another.

Answer 52

Non-constant error variance across X or fitted values.

Answer 53

Constant error variance: Var(ε_i)=σ^2.

Answer 54

Correlation between errors over time/order (violates independence).

Answer 55

How extreme a point’s X values are relative to others (potential influence on fit).

Answer 56

How much removing a point changes estimates/predictions.

Answer 57

Point with unusual Y given X (large residual).

Answer 58

Outlier: large residual; influential: changes model fit/coefficients strongly (often high leverage).

Answer 59

A condition about data-generating process that must hold for standard inference to be valid.

Answer 60

Linearity, Independence, Homoskedasticity, Normality (often ranked with first two most critical).

Answer 61

Mean function E[Y|X] is correctly modeled (no systematic structure left in residuals).

Answer 62

Errors/observations are independent: Cov(ε_i, ε_j)=0 for i≠j (no clustering/time dependence).

Answer 63

Errors are normally distributed (mainly affects exact small-sample inference).

Answer 64

Using same data to explore/generate hypotheses then confirm/test them → inflated false positives.

Answer 65

Pre-specify or split data into exploratory vs confirmatory sets; use CV for prediction.

Answer 66

Model fits noise in training data, reducing out-of-sample performance.

Answer 67

Model too simple to capture true structure; systematic errors remain.

Answer 68

More complex models reduce bias but increase variance; optimal complexity balances both.

Answer 69

A mathematical description of how data are generated: systematic signal + random noise. Intuition: data vary even at same X.

Answer 70

The outcome variable you want to explain or predict.

Answer 71

A variable used to explain or predict Y.

Answer 72

The average value of Y among units with the same X; the regression function targets this.

Answer 73

Random deviation of observed Y from the model mean at X; captures unmeasured factors + randomness.

Answer 74

e_i = y_i − ŷ_i (observed minus fitted); estimate of ε_i.

Answer 75

The model’s predicted mean response at X_i.

Answer 76

β's enter as a linear combination: β0 + β1 g1(x)+…; β not multiplied together or inside nonlinear functions.

Answer 77

y = β0 + β1 x + β2 x^2 + ε (polynomial regression).

Answer 78

Expected/average Y when all predictors equal 0 (may be non-meaningful if 0 is outside range).

Answer 79

Average change in E[Y|x] for a 1-unit increase in x; association, not necessarily causation.

Answer 80

Average change in E[Y|X] for 1-unit increase in x_j holding other predictors constant (adjusted effect).

Answer 81

A variable related to both X and Y that can distort the observed X–Y association.

Answer 82

Data collected without random assignment; causal claims require stronger assumptions.

Answer 83

Study with random assignment of treatments; supports causal inference under proper design.

Answer 84

Observed subset of the population.

Answer 85

Full set of units you want to generalize to.

Answer 86

Single entity measured (person, firm, day, site, etc.).

Answer 87

Sample resembles population; supports generalization.

Answer 88

Turning an abstract construct into a measurable variable.

Answer 89

Whether the measured variable truly captures the intended construct (measurement matches concept).

Answer 90

Whether observed association reflects causal effect within the studied sample (no major bias/confounding).

Answer 91

Whether results generalize to other populations/settings.

Answer 92

Choice of predictors/functional form (transformations/interactions) included in the model.

Answer 93

Bias in coefficient estimates when a relevant predictor is left out and correlated with included predictors.

Answer 94

Strong correlation among predictors causing unstable coefficient estimates and large SEs.

Answer 95

0/1 indicator variable used to encode categories.

Answer 96

Baseline group omitted from dummies; other category coefficients are relative to it.

Answer 97

Steps/Answer: fit <- lm(y ~ x, data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 98

Steps/Answer: fit <- lm(y ~ x1 + x2 + x3, data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 99

Steps/Answer: coef(fit) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 100

Steps/Answer: summary(fit)$coefficients # Estimate, SE, t, p Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 101

Steps/Answer: yhat <- fitted(fit); e <- resid(fit) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 102

Steps/Answer: confint(fit, level=0.95) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 103

Steps/Answer: plot(fit) # residuals-fitted, QQ, scale-location, leverage Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 104

Steps/Answer: lm(y ~ x + I(x^2), data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 105

Steps/Answer: lm(y ~ x + I(x^2) + I(x^3), data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 106

Steps/Answer: df$xc <- df$x - mean(df$x) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 107

Steps/Answer: df$xz <- scale(df$x) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 108

Steps/Answer: library(lmtest); bptest(fit) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 109

Steps/Answer: library(sandwich); library(lmtest); coeftest(fit, vcov=vcovHC(fit, type='HC1')) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 110

Steps/Answer: lm(y ~ x1 * x2, data=df) # includes x1,x2,x1:x2 Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 111

Steps/Answer: lm(y ~ factor(group), data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 112

Steps/Answer: df$group <- relevel(factor(df$group), ref='A') Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 113

Steps/Answer: predict(fit, newdata=new_df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 114

Steps/Answer: predict(fit, newdata=new_df, interval='prediction', level=0.95) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 115

Steps/Answer: predict(fit, newdata=new_df, interval='confidence', level=0.95) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 116

Steps/Answer: qqnorm(resid(fit)); qqline(resid(fit)) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 117

Steps/Answer: plot(fitted(fit), resid(fit)); abline(h=0) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 118

Steps/Answer: plot(resid(fit), type='l') Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 119

Steps/Answer: library(car); vif(fit) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 120

Steps/Answer: lm(log(y) ~ x1 + x2, data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 121

Steps/Answer: lm(y ~ log(x1) + x2, data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 122

Steps/Answer: anova(fit) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 123

Steps/Answer: anova(fit_small, fit_large) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 124

Steps/Answer: fit <- lm(y ~ x, data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 125

Steps/Answer: fit <- lm(y ~ x1 + x2 + x3, data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 126

Steps/Answer: coef(fit) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 127

Steps/Answer: summary(fit)$coefficients # Estimate, SE, t, p Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 128

Steps/Answer: yhat <- fitted(fit); e <- resid(fit) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 129

Steps/Answer: confint(fit, level=0.95) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 130

Steps/Answer: plot(fit) # residuals-fitted, QQ, scale-location, leverage Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 131

Steps/Answer: lm(y ~ x + I(x^2), data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 132

Steps/Answer: lm(y ~ x + I(x^2) + I(x^3), data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 133

Steps/Answer: df$xc <- df$x - mean(df$x) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 134

Steps/Answer: df$xz <- scale(df$x) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 135

Steps/Answer: library(lmtest); bptest(fit) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 136

Steps/Answer: library(sandwich); library(lmtest); coeftest(fit, vcov=vcovHC(fit, type='HC1')) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 137

Steps/Answer: lm(y ~ x1 * x2, data=df) # includes x1,x2,x1:x2 Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 138

Steps/Answer: lm(y ~ factor(group), data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 139

Steps/Answer: df$group <- relevel(factor(df$group), ref='A') Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 140

Steps/Answer: predict(fit, newdata=new_df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 141

Steps/Answer: predict(fit, newdata=new_df, interval='prediction', level=0.95) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 142

Steps/Answer: predict(fit, newdata=new_df, interval='confidence', level=0.95) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 143

Steps/Answer: qqnorm(resid(fit)); qqline(resid(fit)) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 144

Steps/Answer: plot(fitted(fit), resid(fit)); abline(h=0) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 145

Steps/Answer: plot(resid(fit), type='l') Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 146

Steps/Answer: library(car); vif(fit) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 147

Steps/Answer: lm(log(y) ~ x1 + x2, data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 148

Steps/Answer: lm(y ~ log(x1) + x2, data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 149

Steps/Answer: anova(fit) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 150

Steps/Answer: anova(fit_small, fit_large) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 151

Steps/Answer: fit <- lm(y ~ x, data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 152

Steps/Answer: fit <- lm(y ~ x1 + x2 + x3, data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 153

Steps/Answer: coef(fit) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 154

Steps/Answer: summary(fit)$coefficients # Estimate, SE, t, p Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 155

Steps/Answer: yhat <- fitted(fit); e <- resid(fit) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 156

Steps/Answer: confint(fit, level=0.95) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 157

Steps/Answer: plot(fit) # residuals-fitted, QQ, scale-location, leverage Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 158

Steps/Answer: lm(y ~ x + I(x^2), data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 159

Steps/Answer: lm(y ~ x + I(x^2) + I(x^3), data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 160

Steps/Answer: df$xc <- df$x - mean(df$x) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 161

Steps/Answer: df$xz <- scale(df$x) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 162

Steps/Answer: library(lmtest); bptest(fit) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 163

Steps/Answer: library(sandwich); library(lmtest); coeftest(fit, vcov=vcovHC(fit, type='HC1')) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 164

Steps/Answer: lm(y ~ x1 * x2, data=df) # includes x1,x2,x1:x2 Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 165

Steps/Answer: lm(y ~ factor(group), data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 166

Steps/Answer: df$group <- relevel(factor(df$group), ref='A') Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 167

Steps/Answer: predict(fit, newdata=new_df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 168

Steps/Answer: predict(fit, newdata=new_df, interval='prediction', level=0.95) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 169

Steps/Answer: predict(fit, newdata=new_df, interval='confidence', level=0.95) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 170

Steps/Answer: qqnorm(resid(fit)); qqline(resid(fit)) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 171

Steps/Answer: plot(fitted(fit), resid(fit)); abline(h=0) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 172

Steps/Answer: plot(resid(fit), type='l') Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 173

Steps/Answer: library(car); vif(fit) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 174

Steps/Answer: lm(log(y) ~ x1 + x2, data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 175

Steps/Answer: lm(y ~ log(x1) + x2, data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 176

Steps/Answer: anova(fit) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 177

Steps/Answer: anova(fit_small, fit_large) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 178

Steps/Answer: fit <- lm(y ~ x, data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 179

Steps/Answer: fit <- lm(y ~ x1 + x2 + x3, data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 180

Steps/Answer: coef(fit) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 181

Steps/Answer: summary(fit)$coefficients # Estimate, SE, t, p Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 182

Steps/Answer: yhat <- fitted(fit); e <- resid(fit) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 183

Steps/Answer: confint(fit, level=0.95) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 184

Steps/Answer: plot(fit) # residuals-fitted, QQ, scale-location, leverage Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 185

Steps/Answer: lm(y ~ x + I(x^2), data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 186

Steps/Answer: lm(y ~ x + I(x^2) + I(x^3), data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 187

Steps/Answer: df$xc <- df$x - mean(df$x) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 188

Steps/Answer: df$xz <- scale(df$x) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 189

Steps/Answer: library(lmtest); bptest(fit) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 190

Steps/Answer: library(sandwich); library(lmtest); coeftest(fit, vcov=vcovHC(fit, type='HC1')) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 191

Steps/Answer: lm(y ~ x1 * x2, data=df) # includes x1,x2,x1:x2 Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 192

Steps/Answer: lm(y ~ factor(group), data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 193

Steps/Answer: df$group <- relevel(factor(df$group), ref='A') Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 194

Steps/Answer: predict(fit, newdata=new_df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 195

Steps/Answer: predict(fit, newdata=new_df, interval='prediction', level=0.95) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 196

Steps/Answer: predict(fit, newdata=new_df, interval='confidence', level=0.95) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 197

Steps/Answer: qqnorm(resid(fit)); qqline(resid(fit)) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 198

Steps/Answer: plot(fitted(fit), resid(fit)); abline(h=0) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 199

Steps/Answer: plot(resid(fit), type='l') Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 200

Steps/Answer: library(car); vif(fit) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 201

Steps/Answer: lm(log(y) ~ x1 + x2, data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 202

Steps/Answer: lm(y ~ log(x1) + x2, data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 203

Steps/Answer: anova(fit) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 204

Steps/Answer: anova(fit_small, fit_large) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 205

Steps/Answer: fit <- lm(y ~ x, data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 206

Steps/Answer: fit <- lm(y ~ x1 + x2 + x3, data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 207

Steps/Answer: coef(fit) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 208

Steps/Answer: summary(fit)$coefficients # Estimate, SE, t, p Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 209

Steps/Answer: yhat <- fitted(fit); e <- resid(fit) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 210

Steps/Answer: confint(fit, level=0.95) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 211

Steps/Answer: plot(fit) # residuals-fitted, QQ, scale-location, leverage Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 212

Steps/Answer: lm(y ~ x + I(x^2), data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 213

Steps/Answer: lm(y ~ x + I(x^2) + I(x^3), data=df) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 214

Steps/Answer: df$xc <- df$x - mean(df$x) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 215

Steps/Answer: df$xz <- scale(df$x) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 216

Steps/Answer: library(lmtest); bptest(fit) Warning: Always check assumptions/diagnostics before interpreting p-values.

Answer 217

False. Linear = linear in β. Curves can be modeled with transformations/polynomials. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 218

False. β1 is average effect on conditional mean; individuals vary by ε. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 219

Not necessarily. Normality mainly affects exact inference; linearity/independence often more critical. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 220

Often leaves β unbiased but invalidates SE/t-tests/CIs unless corrected. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 221

False. R² ≠ causality; can be high with confounding or misspecification. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 222

Residuals sum to ~0 by construction; you can still violate assumptions. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 223

False. p-value depends on SE and sample size; examine effect size & CI. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 224

More predictors can overfit; adjusted R²/CV preferred. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 225

Intercept is value at x=0; if x=0 not in data it’s extrapolation. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 226

OVB can bias coefficients even if fit looks good. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 227

Regression estimates association; causality needs stronger design assumptions. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 228

Independence is probabilistic; clustering/time dependence breaks it. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 229

False. Linear = linear in β. Curves can be modeled with transformations/polynomials. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 230

False. β1 is average effect on conditional mean; individuals vary by ε. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 231

Not necessarily. Normality mainly affects exact inference; linearity/independence often more critical. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 232

Often leaves β unbiased but invalidates SE/t-tests/CIs unless corrected. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 233

False. R² ≠ causality; can be high with confounding or misspecification. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 234

Residuals sum to ~0 by construction; you can still violate assumptions. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 235

False. p-value depends on SE and sample size; examine effect size & CI. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 236

More predictors can overfit; adjusted R²/CV preferred. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 237

Intercept is value at x=0; if x=0 not in data it’s extrapolation. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 238

OVB can bias coefficients even if fit looks good. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 239

Regression estimates association; causality needs stronger design assumptions. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 240

Independence is probabilistic; clustering/time dependence breaks it. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 241

False. Linear = linear in β. Curves can be modeled with transformations/polynomials. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 242

False. β1 is average effect on conditional mean; individuals vary by ε. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 243

Not necessarily. Normality mainly affects exact inference; linearity/independence often more critical. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 244

Often leaves β unbiased but invalidates SE/t-tests/CIs unless corrected. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 245

False. R² ≠ causality; can be high with confounding or misspecification. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 246

Residuals sum to ~0 by construction; you can still violate assumptions. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 247

False. p-value depends on SE and sample size; examine effect size & CI. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 248

More predictors can overfit; adjusted R²/CV preferred. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 249

Intercept is value at x=0; if x=0 not in data it’s extrapolation. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 250

OVB can bias coefficients even if fit looks good. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 251

Regression estimates association; causality needs stronger design assumptions. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 252

Independence is probabilistic; clustering/time dependence breaks it. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 253

False. Linear = linear in β. Curves can be modeled with transformations/polynomials. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 254

False. β1 is average effect on conditional mean; individuals vary by ε. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 255

Not necessarily. Normality mainly affects exact inference; linearity/independence often more critical. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 256

Often leaves β unbiased but invalidates SE/t-tests/CIs unless corrected. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 257

False. R² ≠ causality; can be high with confounding or misspecification. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 258

Residuals sum to ~0 by construction; you can still violate assumptions. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 259

False. p-value depends on SE and sample size; examine effect size & CI. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 260

More predictors can overfit; adjusted R²/CV preferred. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 261

Intercept is value at x=0; if x=0 not in data it’s extrapolation. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 262

OVB can bias coefficients even if fit looks good. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 263

Regression estimates association; causality needs stronger design assumptions. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 264

Independence is probabilistic; clustering/time dependence breaks it. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 265

False. Linear = linear in β. Curves can be modeled with transformations/polynomials. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 266

False. β1 is average effect on conditional mean; individuals vary by ε. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 267

Not necessarily. Normality mainly affects exact inference; linearity/independence often more critical. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 268

Often leaves β unbiased but invalidates SE/t-tests/CIs unless corrected. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 269

False. R² ≠ causality; can be high with confounding or misspecification. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 270

Residuals sum to ~0 by construction; you can still violate assumptions. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 271

False. p-value depends on SE and sample size; examine effect size & CI. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 272

More predictors can overfit; adjusted R²/CV preferred. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 273

Intercept is value at x=0; if x=0 not in data it’s extrapolation. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 274

OVB can bias coefficients even if fit looks good. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 275

Regression estimates association; causality needs stronger design assumptions. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 276

Independence is probabilistic; clustering/time dependence breaks it. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 277

False. Linear = linear in β. Curves can be modeled with transformations/polynomials. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 278

False. β1 is average effect on conditional mean; individuals vary by ε. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 279

Not necessarily. Normality mainly affects exact inference; linearity/independence often more critical. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 280

Often leaves β unbiased but invalidates SE/t-tests/CIs unless corrected. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 281

False. R² ≠ causality; can be high with confounding or misspecification. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 282

Residuals sum to ~0 by construction; you can still violate assumptions. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 283

False. p-value depends on SE and sample size; examine effect size & CI. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 284

More predictors can overfit; adjusted R²/CV preferred. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 285

Intercept is value at x=0; if x=0 not in data it’s extrapolation. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 286

OVB can bias coefficients even if fit looks good. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 287

Regression estimates association; causality needs stronger design assumptions. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 288

Independence is probabilistic; clustering/time dependence breaks it. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 289

False. Linear = linear in β. Curves can be modeled with transformations/polynomials. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 290

False. β1 is average effect on conditional mean; individuals vary by ε. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 291

Not necessarily. Normality mainly affects exact inference; linearity/independence often more critical. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 292

Often leaves β unbiased but invalidates SE/t-tests/CIs unless corrected. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 293

False. R² ≠ causality; can be high with confounding or misspecification. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 294

Residuals sum to ~0 by construction; you can still violate assumptions. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 295

False. p-value depends on SE and sample size; examine effect size & CI. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 296

More predictors can overfit; adjusted R²/CV preferred. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 297

Intercept is value at x=0; if x=0 not in data it’s extrapolation. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 298

OVB can bias coefficients even if fit looks good. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 299

Regression estimates association; causality needs stronger design assumptions. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 300

Independence is probabilistic; clustering/time dependence breaks it. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 301

False. Linear = linear in β. Curves can be modeled with transformations/polynomials. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 302

False. β1 is average effect on conditional mean; individuals vary by ε. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 303

Not necessarily. Normality mainly affects exact inference; linearity/independence often more critical. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 304

Often leaves β unbiased but invalidates SE/t-tests/CIs unless corrected. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 305

False. R² ≠ causality; can be high with confounding or misspecification. How they trick you: they swap precise statistical meaning for everyday meaning.

Answer 306

Residuals sum to ~0 by construction; you can still violate assumptions. How they trick you: they swap precise statistical meaning for everyday meaning.

Introduction to Statistical Modeling Flashcards

(330 cards)