Giới thiệu về mô hình var, OLS và các kiểm định Hausman trong dữ liệu mảng (Panel Data)

Giới thiệu tổng quát về mô hình var, OLS và các kiểm định Hausman trong dữ liệu mảng (Panel Data) thường được sử dụng trong nghiên cứu định lượng ở phần mềm eviews.

Tham khảo thêm các bài viết khác:

+ Phân tích định tính là gì? Các phương pháp phân tích định tính

+ Phương pháp dự báo là gì? Các phương pháp dự báo thường dùng

1. Giới thiệu về dữ liệu mảng Panel Data

Panel Data là bộ dữ liệu bao gồm cả hai chiều không gian và thời gian.

Mô hình hồi tác động cố định (Fixed-effects) và tác động ngẫu nhiên (random-effects) được sử dụng trong phân tích dữ liệu bảng (đôi khi còn được gọi là dữ liệu dài: longitudinal data). Dữ liệu bảng là sự kết hợp của dữ liệu chéo (cross-section) và dữ liệu thời gian (time series). Để thu thập dữ liệu bảng, chúng ta phải thu thập nhiều đối tượng (units) giống nhau trong cùng một hoặc nhiều thời điểm. Chẳng hạn, chúng ta có thể thu thập các dữ liệu của cùng các cá nhân, công ty, trường học, thành phố, quốc gia… trong giai đoạn từ năm 2000 đến 2014.

Sử dụng dữ liệu bảng có hai ưu điểm lớn như:

i) Dữ liệu bảng cho các kết quả ước lượng các của tham số trong mô hình tin cậy hơn;

ii) Dữ liệu bảng cho phép chúng ta xác định và đo lường tác động mà những tác động này không thể được xác định và đo lường khi sử dụng sử dụng chéo hoặc dữ liệu thời gian.

2. Cách lựa chọn mô hình cho dữ liệu bảng

Câu hỏi đặt ra là mô hình nào sẽ là mô hình dữ liệu phù hợp: Pooled OLS, FE hay RE. Sự phù hợp của ước lượng tác động ngẫu nhiên và tác động cố định được kiểm chứng trên cơ sở so sánh với ước lượng thô.

Cụ thể, ước lượng tác động cố định được kiểm chứng bằng kiểm định F với giả thuyết H0 cho rằng tất cả các hệ số vi đều bằng 0 (nghĩa là không có sự khác biệt giữa các đối tượng hoặc các thời điểm khác nhau). Bác bỏ giả thuyết H0 với mức ý nghĩa cho trước (mức ý nghĩa 5% chẳng hạn) sẽ cho thấy ước lượng tác động cố định là phù hợp.

Đối với ước lượng tác động ngẫu nhiên, phương pháp nhân tử Lagrange (LM) với kiểm định Breusch-Pagan được sử dụng để kiểm chứng tính phù hợp của ước lượng (Baltagi, 2008 trang 319). Theo đó, giả thuyết H0 cho rằng sai số của ước lượng thô không bao gồm các sai lệch giữa các đối tượng var(vi) = 0 (hay phương sai giữa các đối tượng hoặc các thời điểm là không đổi).

Bác bỏ giả thuyết H0, cho thấy sai số trong ước lượng có bao gồm cả sự sai lệch giữa các nhóm, và phù hợp với ước lượng tác động ngẫu nhiên.

Kiểm định Hausman sẽ được sử dụng để lựa chọn phương pháp ước lượng phù hợp giữa hai phương pháp ước lượng tác động cố định và tác động ngẫu nhiên (Baltagi, 2008 trang 320; Gujarati, 2004 trang 652). Giả thuyết H0 cho rằng không có sự tương quan giữa sai số đặc trưng giữa các đối tượng (vi) với các biến giải thích Xit trong mô hình. Ước lượng RE là hợp lý theo giả thuyết H0 nhưng lại không phù hợp ở giả thuyết thay thế. Ước lượng FE là hợp lý cho cả giả thuyết H0 và giả thuyết thay thế. Tuy nhiên, trong trường hợp giả thuyết H0 bị bác bỏ thì ước lượng tác động cố định là phù hợp hơn so với ước lượng tác động ngẫu nhiên.

Ngược lại, chưa có đủ bằng chứng để bác bỏ H0 nghĩa là không bác bỏ được sự tương quan giữa sai số và các biến giải thích thì ước lượng tác động cố định không còn phù hợp và ước lượng ngẫu nhiên sẽ ưu tiên được sử dụng.

Bạn đã biết cách xây dựng thang đo likert phù hợp với mục đích nghiên cứu hay chưa? Hay làm thế nào thiết kế số lượng câu hỏi và cấp độ đánh giá phù hợp cho các đối tượng. Tham khảo thêm chi tiết ở bài viết về thang đo likert này nhé!

3. Mô hình Pooled ols

Mô hình POOL thực chất là mô hình pooled ols bình thường, điều này xảy ra khi chúng ta sử dụng dữ liệu bảng như một đám mây dữ liệu bình thường không phân biệt theo năm và như vậy khi hồi quy mô hình POOL chính là mô hình pooled ols.

Điều này cho thấy nếu như mô hình POOL thực sự phù hợp với dữ liệu hơn 2 mô hình sau thì việc chúng ta sử dụng phân tích bằng mô hình FEM, REM không còn nhiều ý nghĩa. Điều đó dẫn đến trường hợp lúc này chúng ta chỉ cần xem xét mô hình OLS cho dữ liệu có được và thực hiện các kiểm định bình thường ( 8 giả định OLS).

Đây là một cách giải thích cho sự thiếu vắng các kiểm định trong các nghiên cứu về dữ liệu bảng khi mà các nhà nghiên cứu cần tập trung vào các mô hình FEM, REM để phân tích. Mặc khác, đây cũng là gợi ý cho các kiểm định phát hiện các vấn đề trước khi quyết định phân tích theo các mô hình khác nhau.

4. Mô hình Var (Mô hình vectơ tự hồi quy)

Giới thiệu mô hình Var ( tự hồi quy vector) là mô hình bao gồm hệ phương trình, không phân biệt biến độc lập và biến phụ thuộc.

Việc sử dụng mô hình Var bắt buộc các chuỗi dữ liệu đưa vào phải là chuỗi dừng, nếu chưa dừng thì lấy sai phân khi nào dừng thì thôi. Trung trâm nghiên cứu định lượng hôm nay giới thiệu cho các bạn cách thực hành mô hình Var trên EViews

Về bản chất VAR thật ra là sự kết hợp của 2 phương pháp: tự hồi quy đơn chiều (univariate autoregression-AR) và hệ phương trình ngẩu nhiên (simultanous equations-SEs). VAR hay ở chỗ nó lấy ưu điểm của AR là rất dễ ước lượng bằng phương pháp tối thiểu hóa phần dư (OLS) nó lấy ưu điểm của SEs là ước lượng nhiều biến trong cùng 1 hệ thống. Và đồng thời nó khắc phục nhược điểm của SEs là nó không cần quan tâm đến tính nội sinh của các biến kinh tế (endogeneity). Tức là các biến kinh tế vĩ mô thường mang tính nội sinh khi chúng tác động qua lại lẫn nhau. Thuộc tính này làm cho phương pháp cổ điển hồi quy bội dùng 1 phương trình hồi quy nhiều khi bị sai lệch khi ước lượng. Đây là những lý do cơ bản khiến VAR trở nên phổ biến trong nghiên cứu kinh tế vĩ mô. Nó cũng chính là nền tảng cho nghiên cứu về sự cùng hợp nhất (cointegration) của Engle và Granger (1983, 1987) giành giải nobel năm 2003.

5. Giới thiệu về kiểm định Hausman

Kiểm định Hausman là một kiểm tra giả định thống kê trong kinh tế lượng được đặt theo tên của James Durbin, De-Min Wu và Jerry A. Hausman. Thuật toán này sử dụng để so sánh hai phương pháp ước lượng FEM và REM.

Hay nói cách khác để xem xét mô hình FEM hay REM phù hợp hơn, ta sử dụng kiểm định Hausman. Thực chất kiểm định Hausman để xem xét có tồn tại tự tương quan giữa εi và các biến độc lập hay không.

Kiểm định Hausman nhằm mục đích xác định mô hình tác động cố định hay ngẫu nhiên là phù hợp trong mô hình dữ liệu bảng. Kiểm định này nhằm xác định sai số ui có tương quan với các biến giải thích hay không. Giả thuyết H0 của mô hình cho rằng không có tương quan giữa sai số và cái biến giải thích. Để thực hiện kiểm định này, đầu tiên bạn chạy mô hình tác động cố định (Lệnh xtreg y x1, fe) sau đó lưu các kết quả ước lượng lại (Lệnh store fixed), sau đó chạy mô hình tác động ngẫu nhiên (Lệnh xtreg y x1, re) và cũng lưu kết quả lại (Lệnh store random).

Nếu kiểm định hausman trong eviews, thì kiểm định chi square cũng được sử dụng rất nhiều trong spss. Tuy nhiên, hiện bạn chưa vẫn còn chua thể chạy được kiểm định chi bình phương spss? Vậy thì có thể bạn đã mắc phải một số sai sót nhỏ trong quá trình thực hiện. Xem ngay một số lưu ý khi chạy chi square test trong spss để kịp thời khắc phục

Treên đây là các mô hình dữ liệu trong phần mềm Spss, nếu bạn cần xử lí số liệu trên phần mềm Eview hãy liên hệ ngay với Hotline Luận văn 1080 để được hỗ trợ trực tiếp.