Hiện tượng Đa Cộng Tuyến

20 352 1
Hiện tượng Đa Cộng Tuyến

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Trong mô hình phân tích hồi quy bội, chúng ta đã giả thiết giữa các biến giải thích của mô hình không có đa cộng tuyến. Nhưng giả thuyết đó bị vi phạm thì hậu quả sẽ như thế nào và làm thế nào để phát hiện đa cộng tuyến và các biện pháp khắc phục hiện tượng này.Trong bài thảo luận này, nhóm em đã nghiên cứu về bản chất, nguyên nhân, hậu quả, các cách phát hiện đa cộng tuyến và một số biện pháp khắc phục hiện tượng đa cộng tuyến.

MỤC LỤC LỜI NÓI ĐẦU Trong mô hình phân tích hồi quy bội, giả thiết biến giải thích mô hình đa cộng tuyến Nhưng giả thuyết bị vi phạm hậu làm để phát đa cộng tuyến biện pháp khắc phục tượng Trong thảo luận này, nhóm em nghiên cứu chất, nguyên nhân, hậu quả, cách phát đa cộng tuyến số biện pháp khắc phục tượng đa cộng tuyến Bài thảo luận nhóm 11 bao gồm phần chính: Phần I: Cơ sở lý thuyết Phần II: Bài tập minh họa Do tầm hiểu biết hạn chế, số nguyên nhân chủ quan khách quan khác nên thảo luận chúng em nhiều sai sót, mong thầy bạn góp ý để thảo luận chúng em hoàn thiện Chúng em xin chân thành cảm ơn thầy Nguyễn Đức Minh tạo hội cho chúng em để nghiên cứu đề tài I Nhóm 11 CƠ SỞ LÝ THUYẾT Bản chất nguyên nhân tượng đa cộng tuyến 1.1 Bản chất tượng đa cộng tuyến Đa cộng tuyến xảy hay nhiều biến giải thích có liên quan với Xét hàm hồi quy đa bội : Trong trường hợp lý tưởng biến môi trường hồi quy bội tương quan với nhau, biến chứa thông tin riêng , thông tin không chứa biến khác Trong thực hành trường hợp xảy tượng đa cộng tuyến Có hai loại tượng đa cộng tuyến: Đa cộng tuyến toàn phần đa cộng tuyến không toàn phần Đa cộng tuyến toàn phần xảy biến giải thích tồn λ , λ3 , , λ k không đồng thời cho: λ X 2i + λ3 X 3i + + λ k X ki = ∀i , Hiện tượng đa cộng tuyến không toàn phần xảy biến giải thích tồn λ , λ3 , , λ k không đồng thời cho: λ X 2i + λ3 X 3i + + λ k X ki + vi = ∀i , Trong sai số ngẫu nhiên Trong thực tế, tượng đa cộng tuyến toàn phần xảy 1.2 Nguyên nhân gây tượng đa cộng tuyến - Chọn biến độc lập có mối quan hệ nhân hay có tương quan cao - Số quan sát nhỏ số biến độc lập - Cách thu thập mẫu: mẫu đặc trưng cho tổng thể - Chọn biến có độ biến thiên nhỏ Ước lượng có đa cộng tuyến hoàn hảo Nhóm 11 Khi có đa cộng tuyến hoàn hảo hệ số hồi quy không xác định sai số tiêu chuẩn vô hạn Xét mô hình hồi quy biến , sử dụng dạng độ lệch chuẩn đó: ; ; Thì mô hình hồi quy biến viết lại dạng: (1.1) Theo tính toán chương hồi quy bội ta thu ước lượng: (1.2) (1.3) Giả sử số khác không, thay điều kiện vào (1.2) ta được: (1.4) Là biểu thức không xác định Tương tự ta không xác định Vì lại thu kết (1.4) Lưu ý đến ý nghĩa giải thích điều cho ta tốc độ thay đổi trung bình Y thay đổi đơn vụ không đổi Nhưng điều có nghĩa tách ảnh hưởng khỏi mẫu cho Trong kinh tế lượng điều phá hủy toàn ý định tách ảnh hưởng riêng biến lên biến phụ thuộc Thí dụ: thay vào (1.1.) ta được: Trong đó: Áp dụng công thức tính ước lượng phương pháp bình phương nhỏ ta được: Như dù ước lượng cách dy xác định từ phương trình ẩn Như vậy, trường hợp đa cộng tuyến hoàn hảo, thừa nhận lời giải thích cho hệ số hồi quy riêng, ta lại nhận lời giải thích cho tổ hợp tuyến tính hệ số Chú ý Nhóm 11 trường hợp đa cộng tuyến hoàn hảo phương sai sai số tiêu chuẩn ước lượng vô hạn Ước lượng có đa cộng tuyến không hoàn hảo Đa cộng tuyến hoàn hảo trường hợp đặc biệt xảy Trong số liệu liên quan đến chuỗi thời gian, thường xảy đa cộng tuyến không hoàn hảo Xét mô hình (1.1) Ta giả thiết có đa cộng tuyến không hoàn hảo theo nghĩa: Trong nhiễu ngẫu nhiên cho Trong trường hợp theo phương pháp bình phương nhỏ ta dễ dàng tìm Chẳng hạn: (1.5) Trong trường hợp ta lý để nói (1.5) không ước lượng Hậu tượng đa cộng tuyến Trong trường hợp đa cộng tuyến toàn phần: hệ số hồi quy mẫu không xác định độ lệch tiêu chuẩn vô hạn Trong trường hợp đa cộng tuyến không toàn phần: xác định hệ số hồi quy mẫu dẫn đến hậu sau: Phương sai độ lệch tiêu chuẩn hệ số hồi quy mẫu lớn 4.1 Xét mô hình hồi quy dạng: Theo công thức tính phương sai hiệp phương sai, ta có: (1.6) (1.7) (1.8) Trong đó, hệ số tương quan Nhóm 11 Từ (1.6)(1.7), ta thấy tăng dần đến phương sai ước lượng tăng đến vô hạn (1.8) tăng dần đến tăng giá trị tuyệt đối 4.2 Khoảng tin cậy hệ số hồi quy mẫu lớn Khoảng tin cậy 95% cho biết là: Trong đó: Viết lại khoảng tin cậy 95% cho là: (1.9) (1.10) Từ (1.9) (1.10) chứng tỏ gần tới khoảng tin cậy cho tham số rộng Do đó, trường hợp đa cộng tuyến gần hoàn hảo số liệu mẫu thích hợp với tập giả thiết khác Vì thế, xác suất chấp nhận giả thuyết sai tăng lên 4.3 Tỷ số T ý nghĩa Khi kiểm định giả thuyết , ta sử dụng tỷ số so sánh giá trị t ước lượng với giá trị tới hạn t Nhưng có đa cộng tuyến gần hoàn hảo sai số tiêu chuẩn ước lượng cao, vậy, làm cho tỷ số t nhỏ Kết làm tăng khả chấp nhận giả thiết 4.4 Hệ số xác định bội cao t nhỏ Ta xét mô hình hồi quy k biến sau: Trong trường hợp có đa cộng tuyến gần hoàn hảo, ta tìm thấy hệ số góc riêng ý nghĩa mặt thống kê sở kiểm định t Nhưng lại cao, nên kiểm định F, ta bác bỏ giả thuyết: Mâu thuẫn tín hiệu đa cộng tuyến 4.5 Dấu ước lượng hệ số hồi quy ước lượng bình 4.6 Nhóm 11 phương nhỏ trở nên nhạy cảm với thay đổi nhỏ số liệu Dấu ước lượng hệ số hồi quy sai Khi có tượng đa cộng tuình Trong trường hợp vậy, việc bỏ biến cần cân nhắc cẩn thận sai lệch bỏ biến cộng tuyến với việc tăng phương sai ước lượng hệ số biến mô hình 6.2 Thu thập liệu lấy mẫu Vì đa cộng tuyến đặc trưng mẫu nên có mẫu khác liên quan đến biến mẫu ban đầu mà cộng tuyến không nghiêm trọng Điều làm chi phí cho việc lấy mẫu khác chấp nhận thực tế Việc thu thập thêm số liệu, tăng cỡ mẫu làm giảm tình nghiêm trọng đa cộng tuyến 6.3 Sử dụng sai phân cấp Xét mối liên hệ Y với theo thời gian sau: (1.11) Trong t thời gian Phương trình với t với t-1 nghĩa là: (1.12) Từ (1.11) (1.12) ta được: Đặt: Nhóm 11 Ta được: (1.13) Mô hình (1.13) thường làm giảm tính nghiêm trọng đa cộng tuyếntương quan cao nghĩa sai phân chúng tương quan cao Tuy nhiên, biện pháp phát sinh số vấn đề số hạng (1.13) không thoả mãn giả thiết mô hình hồi quy tuyến tính cổ điển nhiễu không tương quan Vì biện pháp sửa chữa lại làm tồi tệ Sử dụng thông tin tiên nghiệm 6.4 Xét hàm hồi quy sau: (1.14) Trong đó: Y: biến phụ thuộc : nhiễu X, Z biến giải thích : tham số cần ước lượng Lấy ln vế (1.14), được: Đặt: ; ; ; Ta được: (1.15) Giả sử từ nguồn thông tin mà ta biết mối quan hệ biến phụ thuộc thay vào (1.15) ta được: Đặt , ta được: Nhờ có thông tin tiên nghiệm giúp làm giảm số biến độc lập từ biến , xuống biến => giảm khả có tượng đa cộng tuyến => khắc phục tượng đa cộng tuyến Các biện pháp khắc phục khác 6.5 Ngoài ra, để khắc phục tượng đa cộng tuyến, ta sử dụng biện pháp sau: - Giảm tương quan hồi quy đa thức Hồi quy thành phần Nhóm 11 10 - Sử dụng ước lượng từ bên Tóm lại, biện pháp nêu giải vấn đề đa cộng tuyến phụ thuộc vào chất của tập số liệu tính nghiêm trọng vấn đề đa cộng tuyến II BÀI TẬP MINH HỌA: Cho số liệu sau: Với Y 70 65 90 95 110 115 Nhóm 11 X 80 100 120 140 160 180 Z 81 100,9 127,3 142,5 163,3 187,6 11 120 140 155 150 Y 165 180 175 165 195 190 200 185 170 205 Trong đó: 200 220 240 260 X 280 300 320 340 360 380 400 420 440 460 205,2 220,1 243,5 268,6 Z 279,8 300,2 322,6 344,2 366,1 380,9 410,6 429,8 437,7 469,2 Y: chi phí tiêu dùng (triệu đồng/năm) X: thu nhập (triệu đồng/năm) Z: tiền tích lũy (triệu đồng) Hãy phát hiện tượng đa cộng tuyến tìm biện pháp khắc phục tượng đa cộng tuyến, với Ước lượng mô hình hồi quy mẫu Dependent Variable: Y Method: Least Squares Sample: 20 Included observations: 20 Variable Coefficient Std Error t-Statistic Prob C X Z 51.76164 0.047137 0.301076 8.949858 0.954802 0.947533 5.783516 0.049368 0.317748 0.0000 0.9612 0.7545 R-squared Adjusted R-squared S.E of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic) 0.891157 Mean dependent var 0.878352 S.D dependent var 15.32253 Akaike info criterion 3991.258 Schwarz criterion -81.34007 Hannan-Quinn criter 69.59442 Durbin-Watson stat 0.000000 Từ bảng eviews ta suy mô hình hồi quy mẫu: Nhóm 11 12 147.0000 43.93177 8.434007 8.583366 8.463163 0.898257 Ý nghĩa hệ số hồi quy: = 0,047137: Khi tiền tích lũy không thay đổi, thu nhập năm tăng lên triệu đồng chi phí tiêu dùng trung bình năm tăng 47137 nghìn đồng =0,301076: Khi thu nhập năm không thay đổi, tiền tích lũy tăng lên triệu đồng chi phí tiêu dùng trung bình năm tăng 301076 nghìn đồng Phát hiện tượng đa cộng tuyến 2.1 cao tỷ số t thấp Với ta có: Từ bảng eviews suy ra: (1) Thống kê t hệ số ứng với X: (2) Thống kê t hệ số ứng với Y: (3) Từ (1)(2)(3), suy mô hình hồi quy có tượng đa cộng tuyến 2.2 Hệ số tương quan biến giải thích cao X 1.000000 0.999516 X Z Z 0.999516 1.000000 Từ bảng eviews ta thấy: suy mô hình có tượng đa cộng tuyến 2.3 Sử dụng hồi quy phụ  Xét hồi quy biến X theo biến Z Dependent Variable: X Method: Least Squares Sample: 20 Included observations: 20 Variable Coefficient Std Error t-Statistic Prob C Z -1.836735 0.991906 2.166529 0.007278 -0.847778 136.2855 0.4077 0.0000 R-squared Adjusted R-squared S.E of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic) 0.999032 0.998978 3.782516 257.5337 -53.93295 18573.75 0.000000 Mean dependent var S.D dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter Durbin-Watson stat Từ bảng số liệu trên, ta có: Nhóm 11 13 270.0000 118.3216 5.593295 5.692868 5.612733 2.446074 Với suy ra: (5)  Kết luận: Từ (5) suy mô hình có tượng đa cộng tuyến 2.4 Sử dụng nhân tử phóng đại VIF Suy mô hình hồi quy có tượng đa cộng tuyến 2.5 Độ đo Theil Hệ số tương quan biến Y X, Z Y 1.000000 0.943669 0.944003 Y X Z X 0.943669 1.000000 0.999516 Z 0.944003 0.999516 1.000000 Ta tính được: Mà Do độ đo Theil mức độ đa cộng tuyến 0,889869 Khắc phục tượng đa cộng tuyến 3.1 Bỏ biến  Xét hồi quy biến Y theo biến X Dependent Variable: Y Method: Least Squares Sample: 20 Included observations: 20 Variable Nhóm 11 Coefficient Std Error t-Statistic 14 Prob C X 52.39850 0.350376 R-squared Adjusted R-squared S.E of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic) 0.890511 0.884428 14.93497 4014.962 -81.39928 146.4000 0.000000 8.501926 0.028958 6.163133 12.09959 Mean dependent var S.D dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter Durbin-Watson stat 0.0000 0.0000 147.0000 43.93177 8.339928 8.439501 8.359366 0.975344 Từ bảng eviews, suy ra:  Xét hồi quy biến Y theo biến Z Dependent Variable: Y Method: Least Squares Sample: 20 Included observations: 20 Variable Coefficient Std Error t-Statistic Prob C Z 51.67506 0.347831 8.529696 0.028654 6.058254 12.13889 0.0000 0.0000 R-squared Adjusted R-squared S.E of regression Sum squared resid Log likelihood F-statistic Prob(F-statistic) 0.891142 0.885094 14.89189 3991.830 -81.34150 147.3527 0.000000 Mean dependent var S.D dependent var Akaike info criterion Schwarz criterion Hannan-Quinn criter Durbin-Watson stat 147.0000 43.93177 8.334150 8.433723 8.353588 0.887869 Từ bảng eviews suy ra:  Kết luận: Ta thấy: Như vậy, trường hợp ta loại bỏ biến X khỏi mô hình để khắc phục tượng đa cộng tuyến Thu thập thêm liệu 3.2 Ta tiến hành thu thập thêm liệu với Nhóm 11 3.3 3.4 3.5 Y X Z 3.6 3.7 3.8 81 3.9 3.10 3.11 15 Nhóm 11 10 3.12 3.13 3.14 12 3.15 3.16 3.17 14 3.18 3.19 3.20 1 16 3.21 3.22 3.23 1 18 3.24 3.25 3.26 20 3.27 3.28 3.29 22 3.30 3.31 3.32 24 3.33 3.34 3.35 26 3.36 3.37 3.38 27 3.39 3.40 3.41 30 3.42 3.43 3.44 32 3.45 3.46 3.47 34 3.48 3.49 3.50 36 3.51 3.52 3.53 38 16 Nhóm 11 3.54 3.55 3.56 41 3.57 3.58 3.59 42 3.60 3.61 3.62 43 3.63 3.64 3.65 46 3.66 3.67 3.68 49 3.69 3.70 3.71 50 3.72 3.73 3.74 52 3.75 3.76 3.77 53 3.78 3.79 3.80 55 3.81 3.82 3.83 27 3.84 3.85 3.86 23 3.87 3.88 3.89 28 3.90 3.91 3.92 25 3.93 3.94 3.95 21 17 3.96 3.97 3.98 29 3.99 3.100 3.101 22 3.102 3.103 3.104 27 3.105 3.106 3.107 26 3.108 3.109 3.110 27 3.111 3.112 3.113 28 3.114 3.115 3.116 26 3.117 3.118 3.119 23 3.120 3.121 3.122 2 29 3.123 3.124 3.125 Nhóm 11 20 18 3.126 3.127 Ta có bảng eviews với sau: 3.128 Dependent Variable: Y 3.132 3.129 Sample: 40 3.130 3.131 3.135 3.133 Included observations: 40 3.136 3.141 3.146 Variabl e 3.151 3.156 3.161 C 3.137 3.142 3.147 Coe 3.138 3.143 3.148 Std 3.134 3.139 3.144 3.140 3.145 3.149 t- 3.150 Pr fficient Error Statistic ob 3.152 3.153 3.154 3.155 3.157 3.158 3.159 3.160 3.162 62.6 3.163 10.01 3.164 6.252 3.165 0.0 1650 514 185 000 3.167 0.01 3.168 0.755 3.169 0.014 3.170 0.9 3.166 X 3.171 Z 3.176 3.181 3.186 Rsquare d 0651 681 095 888 3.172 0.03 3.173 0.075 3.174 0.397 3.175 0.6 0160 3.177 3.182 873 3.178 3.183 3.187 0.74 3.188 503 3.179 3.184 Mean dependent 4583 var 933 3.180 3.185 3.189 15 5.9750 3.190 Adjuste d Rsquare d 3.191 0.73 3.192 S.D dependent 0776 var 3.193 43 55220 3.194 S.E of regress 3.195 22.5 3.196 ion Akaike info 9783 criterion 3.197 9.1 45623 3.198 Sum square d resid 3.202 Log likeliho od 3.206 Fstatistic 3.199 188 3.201 9.2 94.49 3.200 3.203 - 3.204 Schwarz criterion Hannan-Quinn 3.205 9.1 Durbin-Watson 3.209 1.6 179.9125 criter 3.207 53.9 3.208 72289 91422 3047 stat 22300 3.210 Prob(F statistic 3.211 0.00 ) 3.215 0000 3.212 3.213 3.214 Từ bảng số liệu eviews, ta có: , thấy rằng, tượng đa cộng tuyến khắc phục so với ban đầu 3.216 3.217 KẾT LUẬN Khi nghiên cứu tượng đa cộng tuyến, thấy mô hình hồi quy thực tế thường xảy tượng đa cộng tuyến Vì vậy, nghiên cứu mô hình kinh tế, cần phải kiểm tra lại mô hình trước tiến hành phân tích nhằm phát tượng đa cộng tuyến tìm biện pháp khắc phục Từ đó, tránh hậu đa cộng tuyến gây 3.218 Để khắc phục tượng đa cộng tuyến có nhiều cách khác nhau, nhiên biện pháp lại có ưu, nhược điểm khác nhau, vậy, việc lựa chọn biện pháp để giải vấn đề đa cộng tuyến phụ thuộc vào chất của tập số liệu tính nghiêm trọng vấn đề đa cộng tuyến ... biến khác Trong thực hành trường hợp xảy tượng đa cộng tuyến Có hai loại tượng đa cộng tuyến: Đa cộng tuyến toàn phần đa cộng tuyến không toàn phần Đa cộng tuyến toàn phần xảy biến giải thích tồn... khả có tượng đa cộng tuyến => khắc phục tượng đa cộng tuyến Các biện pháp khắc phục khác 6.5 Ngoài ra, để khắc phục tượng đa cộng tuyến, ta sử dụng biện pháp sau: - Giảm tương quan hồi quy đa thức... có: , thấy rằng, tượng đa cộng tuyến khắc phục so với ban đầu 3.216 3.217 KẾT LUẬN Khi nghiên cứu tượng đa cộng tuyến, thấy mô hình hồi quy thực tế thường xảy tượng đa cộng tuyến Vì vậy, nghiên

Ngày đăng: 17/10/2017, 14:49

Từ khóa liên quan

Mục lục

  • LỜI NÓI ĐẦU

  • I. CƠ SỞ LÝ THUYẾT

    • 1. Bản chất và nguyên nhân của hiện tượng đa cộng tuyến

    • 2. Ước lượng khi có đa cộng tuyến hoàn hảo.

    • 3. Ước lượng khi có đa cộng tuyến không hoàn hảo

    • 4. Hậu quả của hiện tượng đa cộng tuyến

    • 5. Phát hiện hiện tượng đa cộng tuyến

    • 6. Biện pháp khắc phục hiện tượng đa cộng tuyến

    • II. BÀI TẬP MINH HỌA: Cho số liệu sau: Với

      • 1. Ước lượng mô hình hồi quy mẫu

      • 2. Phát hiện hiện tượng đa cộng tuyến

      • 3. Khắc phục hiện tượng đa cộng tuyến

      • 3.216. KẾT LUẬN

Tài liệu cùng người dùng

Tài liệu liên quan