Lý thuyết về đa cộng tuyến

16 573 0
Lý thuyết về đa cộng tuyến

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Analytical Methods 11/30/2007 Nguyễn Trọng Hoài 1 Multicollinearity: Đacộng tuyến trong mô hình Bài giảng 10 1.Đacộng tuyến? Analytical Methods 11/30/2007 Nguyễn Trọng Hoài 2 Giảđịnh ban đầuOLS Giảđịnh: Các biến độclập không có mốiquanhệ tuyến tính chính xác (exact linear relationship)  Nếu điềunàyxảy ra thì sẽ có hiệntượng đacộng tuyến, đólàhiệntượng các biến độclập trong mô hình phụ thuộclẫn nhau và thể hiện đượcdướidạng hàm số. Ví dụ Đacộng tuyến chính xác:  X2 X3 X4  10 50 52  15 75 75  18 90 97  24 120 129  X2 và X3 có mốiquanhệ tuyếntínhchính xác - X3 = 5X2 Analytical Methods 11/30/2007 Nguyễn Trọng Hoài 3 Ví dụ (tt) Giả sử chúng ta ướclượng hàm tiêu dùng. Y = tiêu dùng, X 2 = thu nhậpvà X 3 = củacải Y = β 1 + β 2 X 2 + β 3 X 3 X 3 = 5X 2 Y = β 1 + β 2 X 2 + β 3 5X 2 Y = β 1 + (β 2 + 5β 3 )X 3 Ví dụ (tt) Chúng ta có thểướclượng (β 2 + 5β 3 ) nhưng không ướclượng riêng từng hệ số hồiqui  Không thể có nghiệmduynhấtchotừng hệ số hồiqui (xemlại cách tính các hệ số hồiqui).  Như vậycáchệ số hồiqui sẽ không xác định được.  Sai số chuẩncủacáchệ số hồiqui làmột vô cùng lớn. Analytical Methods 11/30/2007 Nguyễn Trọng Hoài 4 Các lọai đacộng tuyến Đacộng tuyếnchínhxácthường rấtítkhixảy ra trong thựctế (perfect/exact collinearity)  Trừ trường hợp chúng ta rơivàobẫybiếngiả (dummy trap – chúng ta sẽ giớithiệusau) Đa công tuyến không chính xác thường hay xảy ra trong thựctế (Near collinearity) (khi các biến độclậptương quan khá cao):  Trường hợpthứ hai chúng ta có thểướclượng các hệ số hồiqui. Đacộng tuyến Nhậndạng hình học Nghiên cứu tình huống Analytical Methods 11/30/2007 Nguyễn Trọng Hoài 5 2. Nguồngốccủa Multicollinearity Nguồngốc Đacộng tuyến Do phương pháp thu thậpdữ liệu  các giá trị củacácbiến độclậpphụ thuộc lẫn nhau trong mẫu, nhưng không phụ thuộclẫn nhau trong tổng thể.  Cỡ mẫunhỏ xu hướng quan hệ bị thiên lệch  Ví dụ: mốiquanhệ tiêu dùng máy lạnh và tổng chi tiêu và số kwh ở thành thị/nông thôn. Analytical Methods 11/30/2007 Nguyễn Trọng Hoài 6 Nguồngốc Multicollinearity Dạng hàm mô hình:  Ví dụ: hồiqui dạng các biến độclập đượcbình phương (dạng hàm) sẽ xảyrađacộng tuyếnvà đặcbiệtkhiphạmvi giátrị ban đầucủabiến độc lậplànhỏ. Các biến độclậpvĩ mô được quan sát theo dữ liệuchuỗithờigian Ví dụ: Nhậpkhẩuquốcgiaphụ thuộcvàoGDP và CPI (các chỉ số này đượcthuthậptừ dự liệuchuỗi thờigian). 3. Hệ quảđacộng tuyến Analytical Methods 11/30/2007 Nguyễn Trọng Hoài 7 Hệ quả Đacộng tuyến chính xác/hòan hảo  Chúng ta không thểướclượng đượcmôhình  Các phầnmềm máy tính sẽ báo các tín hiệu sau  “Matrix singular”: ma trậnkhácthường mà máy tính không thể thựchiện đượckhiướclượng các hệ số hồiqui  “Exact collinearity encounted”: trường hợp đa cộng tuyếnhoànhảo(chínhxác) Hệ quả Hệ quả khi có đacộng tuyến không hoàn hảo  (1) Ướclượng OLS vẫnBLUE  Ướclượng không chệch  Phương sai củahệ sốướclượng vẫn đạt minimum nhưng so vớigiátrị của ướclượng thì lạiquálớn.  Coi lạigiảđịnh 3.2 Î 3.7 trong Ramanathan Analytical Methods 11/30/2007 Nguyễn Trọng Hoài 8 Hệ quả  (2) Sai số chuẩncủacáchệ số sẽ lớn.  Khoảng tin cậylớnvàthống kê t ít ý nghĩa.  Các ướclượng không hiệuquả.  Dễ sai lầmkhikhôngcócơ sở bác bỏ giả thiết “không” và điềunàycóthể không đúng. Hệ quả thựctiễn  (3) R 2 rấtcaochodùthống kê t ít ý nghĩa  Tạisaohệ số xác định lạicao?  Không có nhiềunhững biến đổikhácbiệtgiữacác biếnsốđộclập vì chúng thựcsự có mốiquanhệ với nhau  Dễ dàng bác bỏ giả thuyết“không”củathống kê F và cho rằng mô hình ướclượng có gía trị Analytical Methods 11/30/2007 Nguyễn Trọng Hoài 9 Hệ quả thựctiễn  (4) Các ướclượng và sai số chuẩn của ướclượng rấtnhạycảmvớisự thay đổicủadữ liệu  Chỉ cầnmộtsự thay đổinhỏ trong mẫu dữ liệu(tăng cỡ mẫu)  Chỉ cầnthayđổimột/vài biến độclập Ví dụ Xem kếtquảướclượng hàm tiêu dùng:  Y = 24.77 + 0.94X 2 - 0.04X 3  t (3.67) (1.14) (-0.53)  R 2 =0.96, F = 92.40  X 2 : thu nhập  X 3 : củacải  R 2 rấtcaogiải thích 96% biến đổicủahàm tiêu dùng Analytical Methods 11/30/2007 Nguyễn Trọng Hoài 10 Ví dụ  Không có biến độclậpnàocóý nghĩa (thống kê t quá thấp).  Có mộtbiếnsaidấu.  Giá trị thống kê F rấtcaodẫn đếnbácbỏ giả thuyết “không” và cho rằng mô hình ướclượng có ý nghĩa.  Biếnthunhậpvàcủacảitương quan rấtmạnh với nhau do đókhôngthể nào ướclượng được tác động biên chính xác cho thu nhậphoặc củacải lên tiêu dùng. Ví dụ Thựchiệnhồiqui X 3 theo X 2  X 3 = 7.54 + 10.19X 2  (0.26) ( 62.04) R 2 = .99  Hầunhư chúng ta có đacộng tuyếnrất cao giữaX 2 và X 3 Hồi qui tiêu dùng theo thu nhập:  Y = 24.45 + 0.51X 2  (3.81) (14.24) R 2 = 0.96 [...]... cấu trúc mô hình Nguyễn Trọng Hoài 15 Analytical Methods 11/30/2007 Lọai trừ đa cộng tuyến Sử dụng sai phân cho các biến của mô hình Sai phân làm cho vấn đề đa cộng tuyến có thể nhẹ đi Quay trở lại ví dụ hàm tiêu dùng Thu nhập và của cải có mối quan hệ khá chặt chẽ và do đó không tránh khỏi đa cộng tuyến Lọai trừ đa cộng tuyến Chúng ta muốn ước lượng Yt = β1 + β2X2t + β3X3t+ et Ứng với t-1 Yt-1 = β1... cộng tuyến giữa hai biến độc lập trong mô hình 5 Các giải pháp khắc phục Đa cộng tuyến Nguyễn Trọng Hoài 13 Analytical Methods 11/30/2007 Không lọai trừ đa cộng tuyến Khi t > 2 và dấu kỳ vọng đúng R2 của mô hình cao hơn R2 của mô hình hồi qui phụ Khi xây dựng mô hình sử dụng để dự báo chứ không phải kiểm định Lọai trừ đa cộng tuyến Bỏ bớt biến độc lập Lưu lại biến quan tâm Lọai bỏ biến có tương quan... kê và điều này có nghĩa là có đa cộng tuyến trong mô hình Nguyễn Trọng Hoài 12 Analytical Methods 11/30/2007 Các phương pháp nhận biết (4) Thừa số tăng phương sai (Variance inflation factor-VIF) VIF = 1/(1-rij2) rij2 là hệ số tương quan giữa hai biến độc lập trong mô hình Khi rij tăng làm VIF tăng và làm tăng mức độ đa cộng tuyến Rule of thumb >= 10 có hiện tượng đa cộng tuyến giữa hai biến độc lập trong... quan tâm Nguyễn Trọng Hoài 14 Analytical Methods 11/30/2007 Lọai trừ đa cộng tuyến Bổ sung dữ liệu hoặc tìm dữ liệu mới Tìm mẫu dữ liệu khác hoặc gia tăng cỡ mẫu Nếu mẫu lớn hơn mà vẫn còn multicollinearity thì vẫn có giá trị vì mẫu lớn hơn sẽ làm cho phương sai nhỏ hơn và hệ số ước lượng chính xác hơn so với mẫu nhỏ Lọai trừ đa cộng tuyến Thay đổi dạng mô hình Mô hình kinh tế lượng có nhiều dạng hàm... nên có ý nghĩa thống kê, nhưng trước lúc đó trong mô hình đầu thì không có ý nghĩa 4 Nhận dạng đa cộng tuyến Nguyễn Trọng Hoài 11 Analytical Methods 11/30/2007 Các dấu hiệu từ hồi qui (1) R2 cao và thống kê t thấp (2) Tương quan tuyến tính mạnh giữa các biến độc lập Xây dựng ma trận hệ số tương quan cặp Xét về ý nghĩa kinh tế các biến có khả năng tương quan cao Các phương pháp nhận biết (3) Thực hiện . làm VIF tăng và làm tăng mức độ đacộng tuyến  Rule of thumb >= 10 có hiệntượng đacộng tuyếngiữahaibiến độclập trong mô hình 5. Các giảiphápkhắc phục Đacộng tuyến Analytical Methods 11/30/2007 Nguyễn. lọai đacộng tuyến Đacộng tuyếnchínhxácthường rấtítkhixảy ra trong thựctế (perfect/exact collinearity)  Trừ trường hợp chúng ta rơivàobẫybiếngiả (dummy trap – chúng ta sẽ giớithiệusau) Đa công tuyến. 1 Multicollinearity: Đacộng tuyến trong mô hình Bài giảng 10 1.Đacộng tuyến? Analytical Methods 11/30/2007 Nguyễn Trọng Hoài 2 Giảđịnh ban đầuOLS Giảđịnh: Các biến độclập không có mốiquanhệ tuyến tính

Ngày đăng: 26/05/2014, 21:56

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan