bài tập về môn kinh tế lượng

12 1.2K 1
bài tập về môn kinh tế lượng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Dự đoán bằng ARIMA Ths Nguyễn Khánh Duy SỬ DỤNG MÔ HÌNH ARIMA ĐỂ DỰ BÁO CHUỖI DỮ LIỆU THỜI GIAN SỐ LIỆU DÙNG: Chỉ số VNIndex 1/14/2010 536.8800 1/15/2010 540.9500 1/18/2010 522.7800 1/19/2010 511.2400 1/20/2010 495.7200 1/21/2010 516.4400 1/22/2010 509.1900 1/25/2010 499.0800 1/26/2010 489.8400 1/27/2010 498.7300 1/28/2010 481.9700 1/29/2010 474.1000 2/01/2010 476.7500 2/02/2010 490.1200 2/03/2010 496.8600 2/04/2010 484.6700 2/05/2010 481.4900 2/08/2010 482.9300 2/09/2010 489.6200 2/10/2010 490.3200 2/11/2010 496.2500 2/12/2010 495.6700 2/15/2010 488.8600 2/16/2010 486.9700 2/17/2010 486.8600 2/18/2010 492.9900 2/19/2010 505.3400 2/22/2010 513.1900 2/23/2010 504.5200 2/24/2010 492.8900 2/25/2010 497.5000 2/26/2010 494.3100 3/01/2010 502.5700 3/02/2010 505.0400 3/03/2010 510.9300 3/04/2010 512.7200 3/05/2010 517.0000 3/08/2010 520.7500 3/09/2010 526.2800 3/10/2010 526.2800 3/11/2010 528.9000 3/12/2010 528.0100 3/15/2010 538.0100 3/16/2010 526.0600 3/17/2010 519.9000 3/18/2010 515.2400 3/19/2010 520.1400 3/22/2010 515.7100 3/23/2010 512.2100 3/24/2010 511.0500 3/25/2010 507.8500 Dự đoán bằng ARIMA Ths Nguyễn Khánh Duy 3/26/2010 505.5100 3/29/2010 506.7000 3/30/2010 504.7100 3/31/2010 501.8500 4/01/2010 500.3100 4/02/2010 510.3800 4/05/2010 514.1700 4/06/2010 517.4800 4/07/2010 516.2100 4/08/2010 515.7200 4/09/2010 517.0600 4/12/2010 522.1200 4/13/2010 521.0400 4/14/2010 518.5700 4/15/2010 521.4900 4/16/2010 NA 4/19/2010 NA 4/20/2010 NA 4/21/2010 NA 4/22/2010 NA 4/23/2010 NA 4/26/2010 NA 4/27/2010 NA 4/28/2010 NA 4/29/2010 NA 4/30/2010 NA * KIỂM ĐỊNH TÍNH DỪNG CỦA CHUỖI DỮ LIỆU THỜI GIAN: BẰNG KIỂM ĐỊNH UNNIT ROOT TESTS CHỌN: LEVEL Null Hypothesis: VNINDEX has a unit root Exogenous: Constant Lag Length: 1 (Automatic based on SIC, MAXLAG=10) t-Statistic Prob.* Augmented Dickey-Fuller test statistic -2.763419 0.0693 Test critical values: 1% level -3.536587 5% level -2.907660 10% level -2.591396 *MacKinnon (1996) one-sided p-values. Augmented Dickey-Fuller Test Equation Dependent Variable: D(VNINDEX) Method: Least Squares Date: 04/16/10 Time: 12:04 Sample (adjusted): 1/18/2010 4/15/2010 VÌ Prob* =0.0693>0.05 => chưa dừng CHỌN SAI PHÂN BẬC 1 Null Hypothesis: D(VNINDEX) has a unit root Exogenous: Constant Dự đoán bằng ARIMA Ths Nguyễn Khánh Duy Lag Length: 2 (Automatic based on SIC, MAXLAG=10) t-Statistic Prob.* Augmented Dickey-Fuller test statistic -6.628763 0.0000 Test critical values: 1% level -3.540198 5% level -2.909206 10% level -2.592215 *MacKinnon (1996) one-sided p-values. Augmented Dickey-Fuller Test Equation Dependent Variable: D(VNINDEX,2) Method: Least Squares Date: 04/16/10 Time: 12:02 Sample (adjusted): 1/20/2010 4/15/2010 Vì prob*=0.000<0.05 => sai phân bậc 1 của chuỗi dừng. Ta có sơ đồ Line- sympol: 470 480 490 500 510 520 530 540 550 2010M01 2010M02 2010M03 2010M04 VNINDEX QUY TRÌNH CHỌN LỰA MÔ HÌNH ARIMA Vào correlogram, chọn Level: Date: 04/16/10 Time: 12:10 Dự đoán bằng ARIMA Ths Nguyễn Khánh Duy Sample: 1/14/2010 4/30/2010 Included observations: 66 Autocorrelation Partial Correlation AC PAC Q-Stat Prob . |******| . |******| 1 0.849 0.849 49.804 0.000 . |***** | .*| . | 2 0.681 -0.144 82.351 0.000 . |**** | . |*. | 3 0.572 0.120 105.69 0.000 . |**** | . |*. | 4 0.547 0.211 127.35 0.000 . |**** | .*| . | 5 0.493 -0.137 145.23 0.000 . |*** | .*| . | 6 0.403 -0.069 157.39 0.000 . |** | . | . | 7 0.314 -0.002 164.89 0.000 . |** | .*| . | 8 0.223 -0.153 168.74 0.000 . |*. | .*| . | 9 0.110 -0.183 169.69 0.000 . | . | .*| . | 10 -0.005 -0.079 169.69 0.000 . | . | . |** | 11 -0.024 0.231 169.73 0.000 . | . | . |*. | 12 0.010 0.089 169.74 0.000 . | . | . | . | 13 0.018 -0.018 169.77 0.000 . | . | . | . | 14 -0.022 0.034 169.81 0.000 .*| . | .*| . | 15 -0.086 -0.126 170.46 0.000 .*| . | . | . | 16 -0.116 -0.053 171.66 0.000 .*| . | . | . | 17 -0.124 -0.045 173.07 0.000 .*| . | . | . | 18 -0.104 0.049 174.08 0.000 .*| . | . | . | 19 -0.093 -0.051 174.89 0.000 Như vậy, chuỗi VNINDEX chưa dừng, ta có thể lấy sai phân bậc một của chuỗi này. Thử xem đồ thị Correlogram của chuỗi sai phân bậc 1: Included observations: 65 Autocorrelation Partial Correlation AC PAC Q-Stat Prob . | . | . | . | 1 0.052 0.052 0.1816 0.670 .*| . | .*| . | 2 -0.115 -0.118 1.0964 0.578 **| . | **| . | 3 -0.270 -0.262 6.2342 0.101 . |** | . |** | 4 0.276 0.312 11.690 0.020 . | . | .*| . | 5 -0.012 -0.131 11.701 0.039 . | . | . | . | 6 0.056 0.068 11.930 0.064 . |*. | . |** | 7 0.089 0.273 12.525 0.085 . |*. | . | . | 8 0.189 0.034 15.259 0.054 . | . | . | . | 9 -0.053 0.023 15.480 0.079 **| . | .*| . | 10 -0.234 -0.181 19.816 0.031 .*| . | **| . | 11 -0.166 -0.206 22.038 0.024 . |*. | . | . | 12 0.079 -0.002 22.553 0.032 . |*. | .*| . | 13 0.089 -0.081 23.220 0.039 . | . | . |*. | 14 0.053 0.077 23.457 0.053 . | . | . | . | 15 -0.056 0.023 23.732 0.070 .*| . | .*| . | 16 -0.077 -0.085 24.253 0.084 .*| . | . | . | 17 -0.137 -0.007 25.966 0.075 . | . | . | . | 18 -0.031 0.007 26.057 0.098 . | . | . | . | 19 0.022 -0.003 26.102 0.127 Như vậy sau khi lấy sai phân bậc một chuỗi đã dừng :  d=1, AC tắt nhanh về 0 sau 1 độ trễ  q=1, PAC giảm nhanh về 0 sau 1 độ trễ: Dự đoán bằng ARIMA Ths Nguyễn Khánh Duy  p=1  có thể sử dụng mô hình ARIMA(1,1,1) ƯỚC LƯỢNG VÀ KIỂM ĐỊNH VỚI MÔ HÌNH ARIMA LS d(vnindex) c MA(1) AR(1) Dependent Variable: D(VNINDEX) Method: Least Squares Date: 04/16/10 Time: 12:17 Sample (adjusted): 1/18/2010 4/15/2010 Included observations: 64 after adjustments Convergence achieved after 12 iterations MA Backcast: 1/15/2010 Variable Coefficient Std. Error t-Statistic Prob. C -0.238893 0.907915 -0.263123 0.7933 AR(1) -0.817981 0.115031 -7.110947 0.0000 MA(1) 0.848986 0.125722 6.752899 0.0000 R-squared 0.121473 Mean dependent var -0.304063 Adjusted R-squared 0.092668 S.D. dependent var 7.508551 S.E. of regression 7.152191 Akaike info criterion 6.818455 Sum squared resid 3120.384 Schwarz criterion 6.919653 Log likelihood -215.1906 Hannan-Quinn criter. 6.858322 F-statistic 4.217190 Durbin-Watson stat 1.698170 Kiểm định Q_statistics: Date: 04/16/10 Time: 12:18 Sample: 1/18/2010 4/15/2010 Included observations: 64 Q-statistic probabilities adjusted for 2 ARMA term(s) Autocorrelation Partial Correlation AC PAC Q-Stat Prob . |*. | . |*. | 1 0.139 0.139 1.2861 **| . | **| . | 2 -0.226 -0.250 4.7596 .*| . | .*| . | 3 -0.196 -0.133 7.4167 0.006 . |** | . |** | 4 0.251 0.272 11.858 0.003 . | . | .*| . | 5 0.006 -0.175 11.860 0.008 . | . | . |*. | 6 0.022 0.152 11.895 0.018 . |*. | . |** | 7 0.145 0.227 13.447 0.020 . |*. | . | . | 8 0.186 0.036 16.063 0.013 .*| . | . | . | 9 -0.082 0.016 16.577 0.020 **| . | .*| . | 10 -0.225 -0.161 20.534 0.008 .*| . | **| . | 11 -0.205 -0.273 23.877 0.005 . |*. | . |*. | 12 0.138 0.114 25.420 0.005 Nhìn vào hình trên ta thấy sai số là ngẫu nhiên.( vì nằm trong giới hạn) Dự đoán bằng ARIMA Ths Nguyễn Khánh Duy Kiểm định Histogram-Normality Test 0 2 4 6 8 10 12 14 -20 -15 -10 -5 0 5 10 15 Series: Residuals Sample 1/18/2010 4/15/2010 Observations 64 Mean 0.017054 Median -0.042554 Maximum 15.62478 Minimum -18.94623 Std. Dev. 7.037728 Skewness -0.303746 Kurtosis 3.014685 Jarque-Bera 0.984697 Probability 0.611189 Vì prob =0.611189 > 0.05  có phân phối chuẩn. Như vậy, sai số của mô hình ARIMA(1,1,1) là một chuỗi dừng và nó có phân phối chuẩn. Sai số này là nhiễu trắng. THỰC HIỆN DỰ BÁO VÀ TÌM RMSE CỦA MÔ HÌNH ARIMA(1,1,1): Vào forecast: 440 460 480 500 520 540 560 1/18 1/22 1/28 2/03 2/09 2/15 2/19 2/25 3/03 3/09 3/15 3/19 3/25 3/31 4/06 4/12 4/16 VNINDEXF_111 ± 2 S.E. Forecast: VNINDEXF_111 Actual: VNINDEX Forecast sample: 1/14/2010 4/30/2010 Adjusted sample: 1/18/2010 4/16/2010 Included observations: 64 Root Mean Squared Error 6.982550 Mean Absolute Error 5.489680 Mean Abs. Percent Error 1.088243 Theil Inequality Coefficient 0.006897 Bias Proportion 0.000006 Variance Proportion 0.002165 Covariance Proportion 0.997829 Ta thấy RMSE =6.982 . Dự đoán bằng ARIMA Ths Nguyễn Khánh Duy Mean Abs. percent Error =1.08 < 10% => tốt Theil inequality coeficient = 0.006 < 0.55 => tốt SO SÁNH MÔ HÌNH ARIMA(1,1,2) VỚI ARIMA(1,1,1) LS D(vnindex) c MA(1) MA(2) AR(1) Dependent Variable: D(VNINDEX) Method: Least Squares Date: 04/16/10 Time: 12:34 Sample (adjusted): 1/18/2010 4/15/2010 Included observations: 64 after adjustments Convergence achieved after 22 iterations MA Backcast: 1/14/2010 1/15/2010 Variable Coefficient Std. Error t-Statistic Prob. C -0.180829 1.201721 -0.150475 0.8809 AR(1) -0.873398 0.065469 -13.34062 0.0000 MA(1) 1.234270 0.131986 9.351525 0.0000 MA(2) 0.377840 0.119909 3.151053 0.0025 R-squared 0.196284 Mean dependent var -0.304063 Adjusted R-squared 0.156099 S.D. dependent var 7.508551 S.E. of regression 6.897663 Akaike info criterion 6.760704 Sum squared resid 2854.665 Schwarz criterion 6.895634 Log likelihood -212.3425 Hannan-Quinn criter. 6.813860 F-statistic 4.884424 Durbin-Watson stat 2.127172 Prob(F-statistic) 0.004190 Inverted AR Roots 87 0 2 4 6 8 10 12 14 16 -15 -10 -5 0 5 10 15 Series: Residuals Sample 1/18/2010 4/15/2010 Observations 64 Mean 0.011974 Median 0.151253 Maximum 16.46816 Minimum -16.58250 Std. Dev. 6.731419 Skewness -0.475120 Kurtosis 3.410376 Jarque-Bera 2.856975 Probability 0.239671 PROB =0.23>0.05 => TỐT Dự đoán bằng ARIMA Ths Nguyễn Khánh Duy Date: 04/16/10 Time: 12:36 Sample: 1/18/2010 4/15/2010 Included observations: 64 Q-statistic probabilities adjusted for 3 ARMA term(s) Autocorrelation Partial Correlation AC PAC Q-Stat Prob .*| . | .*| . | 1 -0.075 -0.075 0.3818 **| . | **| . | 2 -0.241 -0.248 4.3416 .*| . | .*| . | 3 -0.126 -0.179 5.4388 . |** | . |*. | 4 0.245 0.166 9.6478 0.002 . | . | . | . | 5 0.005 -0.024 9.6495 0.008 .*| . | . | . | 6 -0.114 -0.047 10.596 0.014 . |** | . |** | 7 0.214 0.289 13.987 0.007 . | . | . | . | 8 0.061 0.038 14.266 0.014 . | . | . |*. | 9 0.010 0.121 14.273 0.027 **| . | .*| . | 10 -0.209 -0.087 17.687 0.013 .*| . | **| . | 11 -0.151 -0.314 19.513 0.012 . |*. | . | . | 12 0.173 0.073 21.934 0.009 . | . | **| . | 13 -0.035 -0.210 22.038 0.015 . |*. | . |*. | 14 0.105 0.111 22.965 0.018 .*| . | . | . | 15 -0.099 0.038 23.803 0.022 . | . | .*| . | 16 0.016 -0.087 23.826 0.033 => Sai số ngẫu nhiên 440 460 480 500 520 540 560 1/18 1/22 1/28 2/03 2/09 2/15 2/19 2/25 3/03 3/09 3/15 3/19 3/25 3/31 4/06 4/12 4/16 VNINDEXF_1 ± 2 S.E. Forecast: VNINDEXF_1 Actual: VNINDEX Forecast sample: 1/14/2010 4/30/2010 Adjusted sample: 1/18/2010 4/16/2010 Included observations: 64 Root Mean Squared Error 6.678633 Mean Absolute Error 5.035281 Mean Abs. Percent Error 0.999563 Theil Inequality Coefficient 0.006596 Bias Proportion 0.000003 Variance Proportion 0.012723 Covariance Proportion 0.987274 Ta thấy các điều kiện cần thiết của một mô hình ARIMA dự đoán thì ARIMA(1,1,2) đều thõa mãn. =>Ta sẽ đi so sánh RMSE của 2 mô hình, mô hình nào có RMSE nhỏ hơn sẽ là mô hình thích hợp hơn trong trường hợp này. (0.6982>0.667) Ta còn có thể so sánh 2 đồ thị sau để thấy rõ điều đó: Dự đoán bằng ARIMA Ths Nguyễn Khánh Duy ARIMA(1,1,2) -20 -10 0 10 20 -20 -10 0 10 20 30 1/18 1/22 1/28 2/03 2/09 2/15 2/19 2/25 3/03 3/09 3/15 3/19 3/25 3/31 4/06 4/12 Residual Actual Fitted ARIMA(1,1,1) -20 -10 0 10 20 -20 -10 0 10 20 30 1/18 1/22 1/28 2/03 2/09 2/15 2/19 2/25 3/03 3/09 3/15 3/19 3/25 3/31 4/06 4/12 Residual Actual Fitted Đồ thị Fitted của ARIMA(1,12) chính xác so với Actual hơn của ARIMA(1,1,1) Vậy ta chọn mô hình ARIMA(1,1,2) để dự doán. Dự đoán bằng ARIMA Ths Nguyễn Khánh Duy THỰC HIỆN DỰ BÁO XA HƠN: 1/15/2010 536.88 1/18/2010 540.95 1/19/2010 522.78 529.01 7.42 1/20/2010 511.24 528.63 7.46 1/21/2010 495.72 498.57 8.07 1/22/2010 516.44 500.26 7.71 1/25/2010 509.19 516.72 7.55 1/26/2010 499.07 510.65 7.42 1/27/2010 489.84 491.64 7.74 1/28/2010 498.73 491.94 7.48 1/29/2010 481.97 498.31 7.34 2/01/2010 474.10 478.55 7.49 2/02/2010 476.75 470.63 7.74 2/03/2010 490.12 480.06 7.33 2/04/2010 496.86 491.95 7.60 2/05/2010 484.67 499.36 7.55 2/08/2010 481.49 478.80 7.51 2/09/2010 482.93 482.86 7.46 2/10/2010 489.62 482.19 7.31 2/11/2010 490.32 492.32 7.39 2/12/2010 496.25 489.11 7.34 2/15/2010 495.67 498.67 7.36 2/16/2010 488.86 494.28 7.33 2/17/2010 486.97 487.08 7.38 2/18/2010 486.86 486.57 7.33 2/19/2010 492.99 486.90 7.30 2/22/2010 505.34 494.66 7.36 2/23/2010 513.19 508.74 7.64 2/24/2010 504.51 514.38 7.55 2/25/2010 492.89 501.19 7.38 2/26/2010 497.5 489.90 7.64 3/01/2010 494.31 499.83 7.34 3/02/2010 502.56 492.32 7.33 3/03/2010 505.04 505.68 7.38 3/04/2010 510.93 504.70 7.41 3/05/2010 512.72 512.70 7.35 3/08/2010 517 512.61 7.35 3/09/2010 520.75 518.17 7.33 3/10/2010 526.27 521.47 7.36 3/11/2010 526.92 527.60 7.37 3/12/2010 528.89 526.59 7.32 3/15/2010 538.01 529.40 7.31 3/16/2010 526.06 540.67 7.46 3/17/2010 519.9 521.11 7.45 3/18/2010 515.24 519.25 7.55 3/19/2010 520.13 513.79 7.33 3/22/2010 515.71 521.97 7.33 3/23/2010 512.21 513.57 7.33 3/24/2010 511.05 511.48 7.36 3/25/2010 507.85 510.79 7.30 3/26/2010 505.51 506.64 7.31 [...]... 500.98 499.93 513.55 514.25 518.28 515.41 515.56 517.41 523.42 520.13 517.81 522.53 7.32 7.30 7.30 7.32 7.31 7.45 7.44 7.32 7.31 7.30 7.31 7.35 7.31 7.31 7.31 (Ghi chú:Chỉ số VNIndex ngày 16/4/2010 thực tế là 522.03, sai số dự đoán là: 0.5) VNINDEXF_1 550 540 530 520 510 500 490 480 470 460 2010M01 2010M02 2010M03 2010M04 2010M02 2010M03 2010M04 550 540 530 520 510 500 490 480 470 460 2010M01 VNINDEX . :  d=1, AC tắt nhanh về 0 sau 1 độ trễ  q=1, PAC giảm nhanh về 0 sau 1 độ trễ: Dự đoán bằng ARIMA Ths Nguyễn Khánh Duy  p=1  có thể sử dụng mô hình ARIMA(1,1,1) ƯỚC LƯỢNG VÀ KIỂM ĐỊNH VỚI. 7.31 4/19/2010 4/20/2010 4/21/2010 4/22/2010 4/23/2010 4/26/2010 4/27/2010 4/28/2010 4/29/2010 4/30/2010 (Ghi chú:Chỉ số VNIndex ngày 16/4/2010 thực tế là 522.03, sai số dự đoán là: 0.5) 460 470 480 490 500 510 520 530 540 550 2010M01 2010M02 2010M03

Ngày đăng: 03/07/2014, 17:47

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan