Chapter 1 Flashcards by Phú Nguyễn

Định nghĩa ‘dữ liệu bảng’ (panel data) là gì?

Đây là loại dữ liệu thu thập từ nhiều cá thể nhất định trong một khoảng thời gian, cung cấp nhiều quan sát cho mỗi cá thể.

How well did you know this?

Not at all

Perfectly

Trong ký hiệu $y_{it}$ của dữ liệu bảng, chỉ số ‘i’ và ‘t’ đại diện cho điều gì?

Chỉ số ‘i’ đại diện cho cá nhân (hoặc đối tượng chéo), và ‘t’ đại diện cho thời gian.

How well did you know this?

Not at all

Perfectly

Dữ liệu bảng vi mô (Micro-panel) có đặc điểm gì về mối quan hệ giữa chiều thời gian (T) và số cá thể (N)?

Chiều thời gian (T) nhỏ hơn rất nhiều so với số cá thể (N), hay $T \ll N$.

How well did you know this?

Not at all

Perfectly

Dữ liệu bảng vĩ mô (Macro-panel) có đặc điểm gì về mối quan hệ giữa chiều thời gian (T) và số cá thể (N)?

Chiều thời gian (T) tương đương hoặc xấp xỉ bằng số cá thể (N), hay $T \simeq N$.

How well did you know this?

Not at all

Perfectly

Thế nào là một tập dữ liệu bảng cân bằng (balanced panel)?

Là tập dữ liệu mà tất cả các cá thể đều được quan sát trong cùng một số giai đoạn thời gian.

How well did you know this?

Not at all

Perfectly

Thế nào là một tập dữ liệu bảng không cân bằng (unbalanced panel)?

Là tập dữ liệu mà chiều thời gian quan sát ($T_i$) khác nhau giữa các cá thể.

How well did you know this?

Not at all

Perfectly

Ưu điểm đầu tiên của việc sử dụng dữ liệu bảng là gì?

Cung cấp nhiều quan sát hơn, giúp ước lượng tham số chính xác hơn và cải thiện hiệu quả của mô hình kinh tế lượng.

How well did you know this?

Not at all

Perfectly

Tại sao dữ liệu bảng cho phép xây dựng các giả thuyết hành vi thực tế hơn so với dữ liệu chéo?

Vì nó kết hợp được cả sự khác biệt giữa các cá nhân và sự biến động theo thời gian.

How well did you know this?

Not at all

Perfectly

Dữ liệu bảng giúp khám phá quan hệ động tốt hơn dữ liệu chéo hay chuỗi thời gian ngắn như thế nào?

Nó cung cấp nhiều biến thiên giữa các cá thể, giúp giảm đa cộng tuyến giữa các biến trễ.

How well did you know this?

Not at all

Perfectly

Phương trình tổng quát của mô hình dữ liệu bảng tuyến tính là gì?

$y_{it} = \alpha_i + x_{it}\beta_i + \epsilon_{it}$.

How well did you know this?

Not at all

Perfectly

Trong mô hình dữ liệu bảng $y_{it} = \alpha_i + x_{it}\beta + \epsilon_{it}$, thành phần $\alpha_i$ được gọi là gì?

$\alpha_i$ là hằng số riêng cho từng cá thể, hay còn gọi là tác động không quan sát được (unobserved effect).

How well did you know this?

Not at all

Perfectly

Mô hình OLS gộp (Pooled OLS) bỏ qua đặc điểm quan trọng nào của dữ liệu bảng?

Nó bỏ qua sự khác biệt về tính chất hoặc đặc trưng riêng của các đối tượng (cá thể).

How well did you know this?

Not at all

Perfectly

Phương trình của mô hình OLS gộp (Pooled OLS) là gì?

$y_{it} = \alpha + x_{it}\beta + \epsilon_{it}$.

How well did you know this?

Not at all

Perfectly

Giả định chính của mô hình Pooled OLS về ảnh hưởng của biến độc lập lên biến phụ thuộc là gì?

Ảnh hưởng của biến độc lập lên biến phụ thuộc là như nhau giữa tất cả các đối tượng và ở tất cả các thời điểm.

How well did you know this?

Not at all

Perfectly

Trong mô hình có tác động không quan sát được, thành phần sai số $\epsilon_{it}$ được gọi là gì?

Sai số đặc trưng riêng (idiosyncratic errors).

How well did you know this?

Not at all

Perfectly

Theo cách tiếp cận truyền thống, $\alpha_i$ được gọi là ‘tác động ngẫu nhiên’ (random effect) khi nào?

Khi nó được xem là một biến ngẫu nhiên.

How well did you know this?

Not at all

Perfectly

Theo cách tiếp cận truyền thống, $\alpha_i$ được gọi là ‘tác động cố định’ (fixed effect) khi nào?

Khi nó được xem là một tham số riêng biệt cần ước lượng cho từng cá thể.

How well did you know this?

Not at all

Perfectly

Theo cách tiếp cận hiện đại (Wooldridge), ‘tác động ngẫu nhiên’ (random effect) được định nghĩa dựa trên mối quan hệ nào?

Nó được định nghĩa là không có tương quan giữa các biến giải thích quan sát được và tác động không quan sát được $\alpha_i$, tức là $cov(x_{jit}, \alpha_i) = 0$.

How well did you know this?

Not at all

Perfectly

Theo cách tiếp cận hiện đại, ‘tác động cố định’ (fixed effect) được định nghĩa dựa trên mối quan hệ nào?

Nó cho phép tồn tại tương quan bất kỳ giữa tác động không quan sát được $\alpha_i$ và các biến giải thích quan sát được.

How well did you know this?

Not at all

Perfectly

Nếu nghi ngờ có tương quan giữa tác động cá thể và biến giải thích, ta nên ưu tiên mô hình nào?

Nên ưu tiên mô hình tác động cố định (Fixed Effect Model - FEM) hoặc sử dụng kiểm định để lựa chọn.

How well did you know this?

Not at all

Perfectly

Ước lượng OLS trong mô hình tác động cố định còn có tên gọi khác là gì?

Ước lượng bình phương tối thiểu với biến giả (LSDV - Least Squares Dummy Variable).

How well did you know this?

Not at all

Perfectly

Phương pháp nào có thể dùng để ước lượng mô hình tác động cố định mà không cần thêm các biến giả?

Phép biến đổi trong nhóm (within transformation).

How well did you know this?

Not at all

Perfectly

Phép biến đổi ‘within transformation’ loại bỏ thành phần nào ra khỏi phương trình hồi quy?

Study These Flashcards

Nó loại bỏ tác động cố định riêng của từng cá thể ($\alpha_i$) ra khỏi phương trình.

Phương trình của mô hình tác động cố định sau khi thực hiện biến đổi ‘within’ là gì?

Study These Flashcards

$y_{it} - \bar{y}i = \beta_1(x{1it} - \bar{x}{1i}) + … + (u{it} - \bar{u}_i)$.

Ước lượng LSDV (hay ước lượng 'within') của tham số $\beta$ trong mô hình tác động cố định có đặc tính gì?

Nó là ước lượng không chệch (unbiased) và vững (consistent).

Lệnh R nào trong gói `plm` được sử dụng để chạy mô hình tác động cố định (FEM)?

`plm(formula, data = mydata, model = "within")`.

Trong kết quả R của mô hình 'within', 'Balanced Panel: n = 10, T = 20, N = 200' có ý nghĩa gì?

Dữ liệu là một bảng cân bằng với 10 cá thể (n), mỗi cá thể được quan sát trong 20 năm (T), tổng cộng 200 quan sát (N).

Lệnh R `fixef(fem)` dùng để làm gì?

Dùng để trích xuất các giá trị ước lượng của tác động cố định riêng lẻ (các $\hat{\alpha}_i$) từ một mô hình FEM đã hồi quy.

Thành phần sai số tổng hợp trong mô hình tác động ngẫu nhiên (REM) bao gồm những gì?

Bao gồm hiệu ứng cá thể ngẫu nhiên và nhiễu đặc trưng riêng: $\nu_{it} = \alpha_i + \epsilon_{it}$.

Giả định quan trọng nhất của mô hình tác động ngẫu nhiên (REM) là gì?

Các hiệu ứng cá thể $\alpha_i$ không tương quan với các biến giải thích $x_{it}$.

Tại sao mô hình tác động ngẫu nhiên (REM) cần được ước lượng bằng phương pháp bình phương tối thiểu tổng quát (GLS)?

Vì thành phần sai số tổng hợp ($\nu_{it}$) gây ra hiện tượng phương sai thay đổi và tự tương quan, vi phạm giả định của OLS.

Khi tác động cá thể $\alpha_i$ là tác động cố định (tương quan với $x_{it}$), ước lượng GLS sẽ bị làm sao?

Ước lượng GLS sẽ bị chệch (biased) và không vững (inconsistent).

Trong R, lệnh nào được sử dụng để ước lượng mô hình tác động ngẫu nhiên (REM)?

`plm(formula, data = mydata, model = "random")`.

Trong R, phép biến đổi nào thường được sử dụng để thực hiện ước lượng GLS cho mô hình tác động ngẫu nhiên?

Biến đổi theo Swamy-Arora.

Để lựa chọn giữa mô hình tác động cố định (FEM) và OLS gộp, ta sử dụng kiểm định nào?

Kiểm định F cho các tác động cá thể (F test for individual effects).

Trong kiểm định F để chọn giữa FEM và OLS, giả thuyết không ($H_0$) là gì?

$H_0$: Tất cả các tác động cá thể đều bằng nhau (hay bằng 0), nghĩa là mô hình OLS gộp là phù hợp.

Lệnh R để thực hiện kiểm định F lựa chọn giữa FEM và OLS là gì?

`pFtest(fem, ols)`.

Nếu p-value của kiểm định F (lựa chọn giữa FEM và OLS) rất nhỏ, ta nên kết luận gì?

Bác bỏ $H_0$, có nghĩa là các tác động cá thể có ý nghĩa thống kê và mô hình FEM tốt hơn OLS.

Để lựa chọn giữa mô hình tác động ngẫu nhiên (REM) và OLS gộp, ta sử dụng kiểm định nào?

Kiểm định nhân tử Lagrange của Breusch-Pagan (Breusch-Pagan Lagrange Multiplier Test).

Trong kiểm định Breusch-Pagan để chọn giữa REM và OLS, giả thuyết không ($H_0$) là gì?

$H_0$: Phương sai của các tác động cá thể bằng 0 ($\sigma^2_\alpha = 0$), nghĩa là không có hiệu ứng ngẫu nhiên và mô hình OLS gộp là đủ.

Lệnh R để thực hiện kiểm định Breusch-Pagan lựa chọn giữa REM và OLS là gì?

`plmtest(ols, type="bp")`.

Nếu p-value của kiểm định Breusch-Pagan rất nhỏ, ta nên chọn mô hình nào?

Bác bỏ $H_0$, kết luận rằng có hiệu ứng ngẫu nhiên và mô hình REM tốt hơn OLS gộp.

Kiểm định nào được sử dụng để lựa chọn giữa mô hình tác động cố định (FEM) và tác động ngẫu nhiên (REM)?

Kiểm định Hausman.

Ý tưởng cốt lõi của kiểm định Hausman là gì?

So sánh sự khác biệt giữa hai ước lượng $\hat{\beta}_{LSDV}$ (từ FEM) và $\hat{\beta}_{GLS}$ (từ REM) để kiểm tra giả thuyết $H_0$.

Giả thuyết không ($H_0$) của kiểm định Hausman là gì?

$H_0$: Không có tương quan giữa tác động không quan sát được $\alpha_i$ và các biến giải thích ($Cov(\alpha_i, x_{jit}) = 0$).

Nếu giả thuyết không ($H_0$) của kiểm định Hausman đúng, mô hình nào hiệu quả hơn?

Mô hình tác động ngẫu nhiên (REM) hiệu quả hơn vì nó có phương sai nhỏ hơn.

Nếu giả thuyết không ($H_0$) của kiểm định Hausman bị bác bỏ, điều này có nghĩa là gì?

Có tương quan giữa $\alpha_i$ và các biến giải thích, do đó ước lượng REM bị chệch và không vững; ta phải chọn mô hình FEM.

Trong kiểm định Hausman, nếu khoảng cách giữa $\hat{\beta}_{LSDV}$ và $\hat{\beta}_{GLS}$ là 'lớn' và có ý nghĩa thống kê, ta nên chọn mô hình nào?

Mô hình tác động cố định (FEM).

Lệnh R để thực hiện kiểm định Hausman là gì?

`phtest(fem, rem)`.

Giả sử kết quả kiểm định Hausman có p-value = 0.3119. Kết luận rút ra là gì?

P-value lớn (> 0.05), do đó không bác bỏ $H_0$. Mô hình tác động ngẫu nhiên (REM) được ưu tiên hơn vì nó hiệu quả hơn.

Mô hình _____ bỏ qua sự khác biệt về đặc trưng của các đối tượng và gộp toàn bộ dữ liệu để chạy hồi quy.

OLS gộp (Pooled OLS)

Dưới giả định $Cov(\alpha_i, x_{jit}) \ne 0$, chỉ có ước lượng _____ là không chệch và vững.

Tác động cố định (FEM / LSDV)

Dưới giả định $Cov(\alpha_i, x_{jit}) = 0$, cả hai ước lượng FEM và REM đều vững, nhưng ước lượng _____ hiệu quả hơn.

Tác động ngẫu nhiên (REM / GLS)

Mục tiêu của kiểm định F trong lựa chọn mô hình dữ liệu bảng là so sánh mô hình _____ với mô hình OLS gộp.

Tác động cố định (FEM)

Mục tiêu của kiểm định Breusch-Pagan trong lựa chọn mô hình dữ liệu bảng là so sánh mô hình _____ với mô hình OLS gộp.

Tác động ngẫu nhiên (REM)

Trong gói `plm` của R, để khai báo dữ liệu là dữ liệu bảng, ta sử dụng hàm nào?

`pdata.frame(data, index=c("individual_id", "time_id"))`.

Chapter 1 Flashcards

(56 cards)