Mô hình Arima và ứng dụng

55 321 0
Mô hình Arima và ứng dụng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI 2 KHOA TOÁN ====== LƢƠNG THỊ THOA MÔ HÌNH ARIMA VÀ ỨNG DỤNG KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC Chuyên ngành: Toán ứng dụng HÀ NỘI - 2015 TRƢỜNG ĐẠI HỌC SƢ PHẠM HÀ NỘI 2 KHOA TOÁN ====== LƢƠNG THỊ THOA MÔ HÌNH ARIMA VÀ ỨNG DỤNG KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC Chuyên ngành: Toán ứng dụng Ngƣời hƣớng dẫn khoa học TS. TRẦN TRỌNG NGUYÊN HÀ NỘI - 2015 LỜI CẢM ƠN Trong quá trình nghiên cứu khóa luận"Mô hình ARIMA và ứng dụng" với sự cố gắng của bản thân và sự giúp đỡ nhiệt tình của các thầy cô trong tổ Toán ứng dụng, các bạn sinh viên khoa Toán em đã hoàn thành khóa luận này. Em xin chân thành cảm ơn sự giúp đỡ quý báu của các thầy cô trong tổ Toán ứng dụng, trƣờng đại học sƣ phạm Hà Nội 2 và các bạn sinh viên đã tạo điều kiện cho em trong suốt thời gian làm khóa luận. Đặc biệt, em xin bày tỏ lòng biết ơn sâu sắc tới thầy hƣớng dẫn, Tiến sĩ Trần Trọng Nguyên, ngƣời đã hƣớng dẫn em tận tình và đóng góp ý kiến quý báu cho em trong quá trình thực hiện và hoàn thành khóa luận này. Hà Nội, ngày 2 tháng 5 năm 2015 Sinh viên Lƣơng Thị Thoa LỜI CAM ĐOAN Khóa luận này là kết quả của bản thân em trong quá trình học tập và nghiên cứu. Bên cạnh đó em đƣợc sự quan tâm của các thầy cô trong khoa Toán. Đặc biệt là sự hƣớng dẫn của thầy: Trần Trọng Nguyên. Trong khi nghiên cứu hoàn thành khóa luận này em có tham khảo một số tài liệu đã ghi trong phần tài liệu tham khảo. Em xin cam đoan kết quả của khóa luận này không có sự trùng lặp với kết quả của tác giả khác. Hà Nội, ngày 2 tháng 5 năm 2015 Sinh viên Lƣơng Thị Thoa MỤC LỤC LỜI MỞ ĐẦU .............................................................................................. 1 1. Lí do chọn đề tài ....................................................................................... 1 2. Mục đích nghiên cứu ................................................................................ 1 3. Đối tƣợng và phạm vi nghiên cứu ............................................................ 2 4. Phƣơng pháp và công cụ nghiên cứu ........................................................ 2 5. Khái quát về nội dung và phạm vi nghiên cứu ......................................... 2 CHƢƠNG 1. KIẾN THỨC CHUẨN BỊ ...................................................... 3 1.1. Biến ngẫu nhiên và quy luật phân phối xác suất ................................... 3 1.1.1. Biến ngẫu nhiên một chiều .................................................................. 3 1.1.1.1. Định nghĩa biến ngẫu nhiên ...................................................... 3 1.1.1.2. Hàm phân phối xác suất ............................................................ 3 1.1.2. Biến ngẫu nhiên hai chiều ................................................................... 3 1.1.2.1. Định nghĩa ................................................................................. 3 1.1.2.2. Hàm phân phối xác suất ............................................................ 3 1.1.2.3. Sự độc lập của hai biến ngẫu nhiên ........................................... 4 1.1.3. Biến ngẫu nhiên nhiều chiều ............................................................... 4 1.1.3.1. Định nghĩa ................................................................................. 4 1.1.3.2. Hàm phân phối xác suất ........................................................... 4 1.1.3.3. Tính độc lập của nhiều biến ngẫu nhiên .................................... 5 1.1.4. Một số đặc trƣng của biến ngẫu nhiên. ................................................ 5 1.1.4.1. Kỳ vọng .................................................................................... 5 1.1.4.2. Phƣơng sai ................................................................................. 6 1.1.4.3. Hiệp phƣơng sai ....................................................................... 6 1.1.4.4. Hệ số tƣơng quan ...................................................................... 6 1.1.5. Một số quy luật phân phối ................................................................... 7 1.1.5.1. Quy luật phân phối chuẩn.......................................................... 7 1.1.5.2. Quy luật Khi bình phƣơng........................................................ 7 1.2. Phân tích hồi quy ................................................................................... 8 1.2.1. Mô hình hồi quy tuyến tính hai biến ................................................... 8 1.2.2. Hàm hồi quy tổng thể .......................................................................... 9 1.2.3. Hàm hồi quy mẫu ................................................................................ 9 1.2.4. Phƣơng pháp ƣớc lƣợng OLS ............................................................ 10 1.3. Giới thiệu về chuỗi thời gian và toán tử trễ ......................................... 11 1.3.1. Chuỗi thời gian .................................................................................. 11 1.3.2. Toán tử trễ ......................................................................................... 12 1.4. Quá trình ngẫu nhiên dừng và không dừng ......................................... 12 1.5. Hàm tự tƣơng quan và hàm tự tƣơng quan riêng................................. 14 1.5.1. Hàm tự tƣơng quan ............................................................................ 14 1.5.2. Hàm tự tƣơng quan riêng ................................................................... 14 1.6. Nhiễu trắng và bƣớc ngẫu nhiên .......................................................... 15 1.6.1. Nhiễu trắng ........................................................................................ 15 1.6.2. Bƣớc ngẫu nhiên ................................................................................ 15 CHƢƠNG 2. MÔ HÌNH ARIMA VÀ ỨNG DỤNG ................................ 17 2.1. Mô hình ARIMA ................................................................................. 17 2.1.1. Quá trình trung bình trƣợt (MA) ....................................................... 17 2.1.2. Quá trình tự hồi quy (AR – Autoregressive Process) ........................ 17 2.1.3. Quá trình trung bình trƣợt tự hồi quy ARMA ................................... 18 2.1.4. Quá trình trung bình trƣợt, tích hợp tự hồi quy ARIMA ................... 19 2.1.5. Dự báo ............................................................................................... 19 2.1.5.1. Dự báo quá trình AR(p) .......................................................... 19 2.1.5.2. Dự báo quá trình MA (q)......................................................... 20 2.1.5.3. Dự báo quá trình ARMA(p,q) ................................................. 21 2.1.5.4. Dự báo quá trình ARIMA(p,d,q) ............................................. 21 2.1.6. Kiểm định nghiệm đơn vị .................................................................. 22 2.1.7. Phƣơng pháp Box – Jenkins. ............................................................. 24 2.1.7.1. Định dạng mô hình – xác định tham số p, d, q ........................ 24 2.1.7.2. Ƣớc lƣợng mô hình ................................................................. 30 2.1.7.3. Kiểm định tính thích hợp của mô hình .................................... 32 2.1.7.4. Dự báo và sai số dự báo .......................................................... 35 2.2. Ứng dụng mô hình ARIMA dự báo chỉ số VNINDEX. ...................... 39 2.2.1. Xây dựng mô hình ARIMA cho chuỗi VNINDEX ........................... 39 2.2.2. Ƣớc lƣợng các tham số của mô hình ................................................. 42 2.2.3. Kiểm tra sự phù hợp của mô hình ..................................................... 43 2.2.4. Dự báo giá ......................................................................................... 44 KẾT LUẬN ................................................................................................ 47 DANH MỤC TÀI LIỆU THAM KHẢO ................................................... 48 LỜI MỞ ĐẦU 1. Lí do chọn đề tài Chuỗi thời gian đang đƣợc sử dụng nhƣ một công cụ hữu hiệu để phân tích và dự báo trong kinh tế xã hội cũng nhƣ trong nghiên cứu khoa học. Chính do tầm quan trọng của phân tích chuỗi thời gian, rất nhiều nghiên cứu đã đề xuất các công cụ để phân tích và dự báo chuỗi thời gian. Trong những năm trƣớc, công cụ để phân tích chuỗi thời gian là sử dụng các công cụ thống kê nhƣ hồi quy, phân tích Furie và một vài công cụ khác.Nhƣng hiệu quả nhất là mô hình ARIMA của Box-Jenkins. Từ các công trình ban đầu về chuỗi thời gian, hiện nay mô hình này đang đƣợc dùng rất nhiều để phân tích và dự báo trong các lĩnh vực: kinh tế,tài chính, chứng khoán, giáo dục, thời tiết, dân số,... Nghiên cứu phân tích và dự báo chuỗi thời gian luôn là một bài toán gây đƣợc sự chú ý của các nhà toán học, kinh tế, xã hội học,… Các quan sát trong thực tế thƣờng đƣợc thu thập dƣới dạng chuỗi số liệu. Từ những số liệu này, ngƣời ta có thể rút ra đƣợc những quy luật của một quá trình đƣợc mô tả thông qua chuỗi số liệu. Xuất phát từ thực tế ứng dụng lớn của mô hình ARIMA, em chọn đề tài nghiên cứu về: “MÔ HÌNH ARIMA VÀ ỨNG DỤNG” làm đề tài khóa luận của mình. 2. Mục đích nghiên cứu - Nghiên cứu một số khái niệm và tính chất cơ bản về chuỗi thời gian; các quá trình trung bình trƣợt (MA),quá trình tự hồi quy (AR), quá trình trung bình trƣợt tự hồi quy (ARMA)và quá trình trung bình trƣợt, tích hợp tự hồi quy (ARIMA). -Ứng dụng mô hình ARIMA dự báo chuỗi chỉ số VNINDEX với sự hỗ trợ của phần mềm Eviews. 1 3. Đối tƣợng và phạm vi nghiên cứu - Đối tƣợng nghiên cứu: Mô hình ARIMA - Phạm vi nghiên cứu: Mô hình ARIMA, phƣơng pháp Box – Jenkins, ứng dụng trong dự báo chỉ số VNINDEX 4.Phƣơng pháp và công cụ nghiên cứu - Phƣơng pháp so sánh, phân tích, tổng hợp kiến thức. - Phƣơng pháp phân tích thực nghiệm với dữ liệu thực tế. - Sử dụng phần mềm Excel, Eviews. 5.Khái quát về nội dung và phạm vi nghiên cứu Nội dung của khóa luận này bao gồm 2 chƣơng: - Chƣơng 1. Kiến thức chuẩn bị: Chƣơng này trình bày một số khái niệm và kiến thức cơ bản sẽ đƣợc sử dụng trong chƣơng sau. - Chƣơng 2.Mô hình ARIMA và ứng dụng: Chƣơng này trình bày các lớp mô hình ARIMA và thử nghiệm ứng dụng các mô hình này để dự báo chỉ số VNINDEX. 2 CHƢƠNG 1. KIẾN THỨC CHUẨN BỊ 1.1. Biến ngẫu nhiên và quy luật phân phối xác suất 1.1.1. Biến ngẫu nhiên một chiều 1.1.1.1. Định nghĩa biến ngẫu nhiên Định nghĩa 1.1: Cho (, F, P) là một không gian xác suất. Nếu X là một ánh xạ đo đƣợc từ  vào  thì X đƣợc gọi là một biến ngẫu nhiên (hoặc một đại lƣợng ngẫu nhiên). Nói cách khác: X là một hàm số thực, hữu hạn, xác định trên  sao cho với mỗi x  thì   : X    x  F. 1.1.1.2. Hàm phân phối xác suất Định nghĩa 1.2. Hàm phân phối xác suất của biến ngẫu nhiên X đƣợc ký hiệu và xác định nhƣ sau: FX ( x)  P : X ()  x, x  . Nhƣ vậy hàm phân bố xác suất là sự thu hẹp của độ đo xác suất P lên lớp các khoảng  , x  của đƣờng thẳng thực  . Để cho gọn ta sẽ ký hiệu F ( x)  P( X  x), x  . 1.1.2. Biến ngẫu nhiên hai chiều 1.1.2.1. Định nghĩa Định nghĩa 1.3. Cho không gian xác suất (, F, P) và hai biến ngẫu nhiên X và Y xác định trên nó. Khi đó hệ V  (X,Y) đƣợc gọi là một biến ngẫu nhiên 2-chiều, tức là V là một ánh xạ từ  vào  2 sao cho với mỗi   thì V ( )   X ( ),Y ( ) . 1.1.2.2. Hàm phân phối xác suất Định nghĩa 1.4. (Hàm phân phối đồng thời) Hàm phân phối xác suất đồng thời của một biến ngẫu nhiên 2-chiều V  ( X ,Y ) đƣợc định nghĩa nhƣ sau: 3 F ( x, y)  P  X  x Y  y  , (  x, y  ) . Định nghĩa 1.5. (Các hàm phân phối biên) Nếu F(x,y) là hàm phân phối xác suất đồng thời của biến ngẫu nhiên 2-chiều V  ( X ,Y ) thì các hàm: F ( x, )  P( X  x)  F1 ( x); F ( y, )  P(Y  y )  F2 ( y ) là các hàm phân phối của các biến ngẫu nhiên thành phần tƣơng ứng X và Y. Các hàm này gọi là các hàm phân phối biên của V . 1.1.2.3. Sự độc lập của hai biến ngẫu nhiên Định nghĩa 1.6. Hai biến ngẫu nhiên X và Y đƣợc gọi là độc lập với nhau nếu: F ( x, y)  F1 ( x) F2 ( y)    x, y    . 1.1.3. Biến ngẫu nhiên nhiều chiều 1.1.3.1. Định nghĩa Định nghĩa 1.7. Cho X1, X 2 ,...,Xn là các biến ngẫu nhiên 1-chiều đƣợc xác định trên không gian xác suất (, F, P). Nhờ các biến ngẫu nhiên này, với mỗi   , ta có thể làm phép tƣơng ứng với một điểm X ( )   X1 (), X 2 (),...,X n ()  của không gian Ơ-cơ-lít n-chiều. Ánh xạ   n lập bởi các biến ngẫu nhiên X1, X 2 ,...,Xn đƣợc gọi là một biến ngẫu nhiên n-chiều hoặc một véc-tơ ngẫu nhiên n-chiều. 1.1.3.2. Hàm phân phối xác suất Định nghĩa 1.8. (Hàm phân phối xác suất đồng thời) Hàm phân phối xác suất đồng thời của biến ngẫu nhiên n-chiều đƣợc định nghĩa nhƣ sau: F( x1 , x2 ,...,x n )  P  X 1  x1  X 2  x2  ...  X n  xn  víi (  X i  ), i  (1, n) 4 Định nghĩa 1.9. (Các hàm phân phối biên)  Hàm phân phối biên của một biến Hàm phân phối xác suất của biến X i là Fi ( xi )  P  X1    X 2   ... X i   ... X n     lim F ( x1 , x2 ,..., xn ) với  i  j  x j   Hàm phân phối biên của một số biến Hàm phân phối biên của các biến X i và X j và X k Fijk ( xi , x j , xk )  lim F ( x1, x2 ,..., xn ) xr  r i , j ,k 1.1.3.3. Tính độc lập của nhiều biến ngẫu nhiên Định nghĩa 1.10. Các biến ngẫu nhiên X1, X 2 ,...,Xn đƣợc gọi là độc lập nếu tại mọi điểm  x1, x2 ,..., xn  của  n ta đều có: F ( x1, x2 ,..., xn )  F1 ( x1 ) F2 ( x2 )...Fn ( xn ) . 1.1.4.Một số đặc trƣng của biến ngẫu nhiên. 1.1.4.1.Kỳ vọng Định nghĩa 1.11. (Kỳ vọng toán của biến ngẫu nhiên một chiều) Trên không gian xác suất (, F, P) cho biến ngẫu nhiên X có hàm phân phối xác suất F(x). Kỳ vọng toán của X là một số ký hiệu là E(X) và đƣợc định nghĩa nhƣ sau: E ( X )   xdF ( x) với giả thiết là  x dF ( x) tồn tại.   Định nghĩa 1.12. (Kỳ vọng toán của hàm hai biến ngẫu nhiên) Nếu R   ( X ,Y) trong đó X và Y là hai biến ngẫu nhiên thì: E ( R)  E   X ,Y     xi , y j  Pij i j khi X và Y là hai biến ngẫu nhiên rời rạc và 5 E ( R)  E   X ,Y         ( x, y) f ( x, y)dxdy   khi X và Y là hai biến ngẫu nhiên liên tục với hàm mật độ xác suất đồng thời là f ( x, y) 1.1.4.2. Phương sai Định nghĩa 1.13. Phƣơng sai của biến ngẫu nhiên X đƣợc ký hiệu là V(X) (hoặc var(X)- viết tắt từ tiếng Anh: variance) và đƣợc định nghĩa nhƣ sau:   xi  E ( X )2 P( xi ) với X rời rạc  i 2 2 var( X )  2   ( X )  E  X  E  X         x  E ( X )2 f ( x)d ( x) với X liên tục   1.1.4.3.Hiệp phương sai Định nghĩa 1.14. Hiệp phƣơng sai của hai biến ngẫu nhiên X và Y đƣợc ký hiệu là cov(X,Y) và đƣợc định nghĩa nhƣ sau:   cov( X , Y )  K ( X ,Y )  E  X  E  X   Y  E (Y )   1,1     xi  E ( X )   y j  E (Y )  Pij    i j          x  E ( X ) y  E (Y ) f ( x, y)dxdy   1.1.4.4. Hệ số tương quan Hệ số tƣơng quan cho thông tin về mức độ chặt chẽ của mối quan hệ tuyến tính giữa hai biến, đƣợc định nghĩa nhƣ sau:  ( X ,Y )  Có thể chỉ ra rằng 0   ( X ,Y )  1. 6 cov( X , Y )  x y 1.1.5. Một số quy luật phân phối 1.1.5.1. Quy luật phân phối chuẩn Một biến ngẫu nhiên X đƣợc gọi là tuân theo quy luật chuẩn với kỳ vọng  , phƣơng sai  2 , ký hiệu là: X  N ( , 2 ) nếu nó là biến ngẫu nhiên liên tục với hàm mật độ sau đây: 1 ( x   )2 f ( x)  exp( ) với mọi x. 2 2  2 Quy luật chuẩn hóa N(0,1): Một trƣờng hợp đặc biệt và hữu dụng trong tính toán của họ các phân phối chuẩn là phân phối chuẩn hóa N(0,1)(là phân phối chuẩn với kì vọng bằng 0 và phƣơng sai bằng 1). Biến ngẫu nhiên tuân theo quy luật chuẩn hóa thƣờng đƣợc kí hiệu là U, hàm phân phối của quy luật chuẩn hóa thƣờng đƣợc kí hiệu bởi ( x) , hàm mật độ bởi  ( x) 1.1.5.2. Quy luật Khi bình phương Quy luật Khi bình phƣơng (với k bậc tự do) ký hiệu là  k2 có quan hệ trực tiếp với quy luật chuẩn và đƣợc xác định nhƣ sau: X  U12  U 22    U k2 . trong đó U1,U2,...,Uk là các biến ngẫu nhiên độc lập với nhau và cùng tuân theo quy luật chuẩn hóa, khi đó X tuân theo quy luật Khi bình phƣơng với k bậc tự do. Nếu X   k2 thì E(X) =k, var(X) = 2k. Có thể thấy rằng biến ngẫu nhiên tuân theo quy luật Khi bình phƣơng chỉ nhận giá trị không âm và hàm mật độ của nó là không đối xứng. 7 1.2. Phân tích hồi quy 1.2.1. Mô hình hồi quy tuyến tính hai biến Giả sử X và Y là hai biến của một tổng thể nào đó, mô hình hồi quy tuyến tính hai biến thể hiện mối quan hệ phụ thuộc giữa biến Y và biến X có dạng nhƣ sau: Y  1  2 X  u (1.1) Nhƣ vậy, mô hình hồi quy tuyến tính hai biến bao gồm các thành phần sau:  Các biến số: mô hình hồi quy gồm hai loại biến số: - Biến phụ thuộc: là biến số mà ta đang quan tâm đến giá trị của nó, thƣờng đƣợc kí hiệu là Y và nằm ở vế trái của phƣơng trình. Biến phụ thuộc còn đƣợc gọi là biến được giải thích (explained variable) hay biến phản ứng. - Biến độc lập: là biến số đƣợc cho là có tác động đến biến phụ thuộc, thƣờng đƣợc kí hiệu là X và nằm ở vế bên phải của phƣơng trình. Biến độc lập còn đƣợc gọi là biến giải thích (explanatory variable) hay biến điều khiển (control variable).  Sai số ngẫu nhiên: Sai số ngẫu nhiên,thƣờng đƣợc ký hiệu là u, là yếu tố đại diện cho các yếu tố có tác động đến biến Y, ngoài X. Trong mô hình (1.1) chúng ta không có quan sát về nó, vì thế đôi khi u còn đƣợc gọi là sai số ngẫu nhiên không quan sát đƣợc. Do đó, để hàm hồi quy có ý nghĩa cần đƣa ra giả thiết cho thành phần này. Giả thiết đƣợc đƣa ra là: tại mỗi giá trị của X thì kỳ vọng của u bằng 0: E  u x   0.  Các hệ số hồi quy, bao gồm 1 và 2 , thể hiện mối quan hệ giữa X và Y khi các yếu tố bao trùm trong u là không đổi. 8 1.2.2. Hàm hồi quy tổng thể Với giả thiết E  u x   0, ta có thể biểu diễn lại mô hình hồi quy (1.1) dƣới dạng sau: E (Y X )  1  2 X (1.2) trong đó E (Y X ) là kỳ vọng của biến Y khi biết giá trị của biến X, hay còn gọi là kỳ vọng của Y với điều kiện X. Phƣơng trình (1.2) biểu diễn kỳ vọng của Y với điều kiện X nhƣ một hàm của biến X và do X và Y thể hiện cho tổng thể nên phƣơng trình (1.2) còn đƣợc gọi là hàm hồi quy tổng thể (PRF – population regression function). Khi đó các hệ số hồi quy 1 và 2 còn đƣợc gọi là các tham số của tổng thể, có ý nghĩa nhƣ sau: Các hệ số hồi quy: - 1 đƣợc gọi là hệ số chặn, nó chính bằng giá trị trung bình của biến phụ thuộc Y khi biến độc lập X nhận giá trị bằng 0. -  2 đƣợc gọi là hệ số góc, thể hiện quan hệ giữa biến độc lập và giá trị trung bình của biến phụ thuộc: khi biến độc lập X tăng (giảm) một đơn vị thì giá trị trung bình của biến phụ thuộc Y tăng (giảm)  2 đơn vị. Hệ số có thể nhận giá trịdƣơng, âm hoặc bằng 0. 1.2.3. Hàm hồi quy mẫu Giả sử có mẫu ngẫu nhiên kích thƣớc n bao gồm các quan sát của biến X và biến Y: (Yi, Xi), i=1,2,...,n. Từ mẫu ngẫu nhiên này chúng ta xây dựng các ƣớc lƣợng cho các hệ số hồi quy tổng thể 1 và 2 , ký hiệu là  1 và  2 tƣơng ứng. Khi đó biểu diễn dƣới đây gọi là hàm hồi quy mẫu cho hàm hồi quy tổng thể (1.1):    X. Y   1 2 9 (1.3) Hay có thể viết chi tiết cho từng quan sát nhƣ sau:    X , i  1,2,..., n. Y i   1 2 i (1.3)’ Ký hiệu mũ trên đầu ngụ ý rằng đây là giá trị ƣớc lƣợng từ mẫu chứ không phải giá trị của tổng thể. Cụ thể hơn: ,  đƣợc gọi là hệ số hồi quy mẫu hay hệ số ƣớc lƣợng, là ƣớc - 1 2 lƣợng của các hệ số tổng thể 1 ,  2 tƣơng ứng. - Y i đƣợc tính nhƣ trong (1.3)’ là giá trị ƣớc lƣợng cho giá trị Y khi X=Xi. 1.2.4.Phƣơng pháp ƣớc lƣợng OLS Phƣơng pháp ƣớc lƣợng OLS lần đầu tiên đƣợc giới thiệu bởi Gauss vào những năm cuối thế kỷ 18 (Haper (1974-1976)) và đƣợc sử dụng rộng rãi trong nhiều lĩnh vực. Tuy trong phân tích kinh tế lƣợng nói chung và phân tích hồi quy nói riêng, ngƣời ta đã phát triển thêm các phƣơng pháp ƣớc lƣợng mới, nhƣng OLS vẫn là một phƣơng pháp thông dụng do các ƣu việt của nó. Ngoài ra, ƣớc lƣợng thu đƣợc từ OLS thƣờng đƣợc chon làm cơ sở khi đánh giá chất lƣợng của ƣớc lƣợng thu đƣợc từ các phƣơng pháp khác. Để tìm hiểu phƣơng pháp OLS, ta xét mô hình hồi quy tổng thể: Y  1  2 X  u và ta cần ƣớc lƣợng các hệ số 1 ,  2 . Giả sử có mẫu ngẫu nhiên có kích thƣớc n {(Yi, Xi), i=1,2,...,n} thu đƣợc từ tổng thể, khi đó tại mỗi quan sát ta có: Yi  1  2 X i  u i . (1.4) ,  là các ƣớc lƣợng cần tìm của  ,  với thông tin từ Ký hiệu  1 2 1 2 mẫu trên, khi đó ta có thể viết thành hàm hồi quy mẫu nhƣ sau:    X. Y i   1 2 i 10 (1.5) Gọi sai lệch giữa các giá trị thực tế Yi và giá trị ƣớc lƣợng tƣơng ứng từ hàm hồi quy mẫu Y i là phần dƣ (residuals), ký hiệu bởi ei: ei  Yi  Y i (1.6) ,  sao cho sai lệch tổng hợp Chúng ta muốn xác định các giá trị  1 2 giữa các giá trị thực tế Yi và các giá trị ƣớc lƣợng tƣơng ứng từ hàm hồi quy mẫu (1.4) là nhỏ nhất có thể đƣợc. Sai lệch này có thể đƣợc định nghĩa bởi: (1) Tổng các phần dƣ n e i 1 i (2) Tổng các giá trị tuyệt đối của phần dƣ n e i 1 (3) Tổng bình phƣơng các phần dƣ i n e i 1 2 i Trong phạm vi khóa luận này chúng ta sẽ sử dụng phần mềm Eviews để hỗ trợ cho việc xác định các ƣớc lƣợng OLS. 1.3.Giới thiệu về chuỗi thời gian và toán tử trễ 1.3.1. Chuỗi thời gian Chuỗi thời gian là dãy các quan sát về một biến số nào đó theo thời gian. Thƣờng việc thu thập số liệu bắt đầu ở một thời điểm nhất định, chẳng hạn t=1 và kết thúc ở một thời điểm khác t=n: (Y1,Y2 ,,Yn ) Có thể tìm đƣợc các quan sát (Y2 ,Y1,Y0 ) hoặc các quan sát sau thứ tự n (Yn1,Yn2 ,) - Mẫu quan sát đƣợc có thể đƣợc coi nhƣ một đoạn hữu hạn của một  chuỗi vô hạn Yt   (, Y1 , Y 0 , Y1 , Y2 ,, Yn , Yn 1 , Yn  2 )  Mẫu quan sát Chẳng hạn: 11 Yt = Pt là giá một loại /cổ phiếu ở thời điểm t; Yt = t biến xu thế Yt = c các thành phần của chuỗi là một hằng số -Toán tử nhân: Yt   X t -Toán tử cộng: Yt  X t  Wt 1.3.2. Toán tử trễ  Giả sử có chuỗi {Xt } bây giờ ta tạo ra chuỗi mới  Yt  , Yt  X t 1. Ký hiệu Yt  LX t  X t 1 . L đƣợc gọi là toán tử trễ. L( LX t )  L( X t 1 )  X t 2 . Áp dụng hai lần toán tử trễ ký hiệu là L2 , L2 X t  X t 2 Tổng quát, k là một số nguyên bất kỳ, Lk X t  X t k L( X t )   ( LX t )   X t 1 ; L( X t  Wt )  X t 1  Wt 1; Yt  (a  bL) LX t  aLX t  bL2 X t  aXt 1  bX t 2 (1  1L)(1  2 L) X t  (1  1L  2 L  12 L2 ) X t  (1  (1  2 ) L  12 L2 ) X t  X t  (1  2 ) X t 1  12 X t 2 Một biểu diễn khác (aL+bL2) đƣợc xem nhƣ là đa thức đối với toán tử L. Về mặt đại số, nó tƣơng tự nhƣ đa thức (az+bz2), z là một vô hƣớng. Nếu nhƣ: {Xt }  {c} thì: LX t  X t 1  c; (   L   L2 )c  (     )c. 1.4.Quá trình ngẫu nhiên dừng và không dừng Xét họ các biến ngẫu nhiên Y1, Y2,… trong đó các chỉ số là các thời điểm kế tiếp nhau. Nói chung mỗi biến có một quy luật phân bố xác suất riêng. Họ Y1, Y2,… đƣợc gọi là quá trình ngẫu nhiên. Giả sử rằng đối với 12 mỗi thời điểm, biến số tƣơng ứng nhận một giá trị cụ thể. Khi đó ta có một chuỗi thời gian. Mặc dù chuỗi thời gian chỉ là một phép thử của một quá trình ngẫu nhiên, nhƣng chúng ta cũng gọi chuỗi thời gian là một quá trình ngẫu nhiên, ký hiệu là {Yt với t = 1, 2,…} E(Yt), Var(Yt) là kỳ vọng và phƣơng sai của Yt, có thể Cov(Yi, Yj) ≠ 0. Nói chung đối với mỗi Yt thì kỳ vọng, phƣơng sai và hiệp phƣơng sai là không giống nhau. Chuỗi Yt đƣợc gọi là dừng nếu kì vọng, phƣơng sai, hiệp phƣơng sai không đổi theo thời gian (Engle và Granger, 1987), nghĩa là: E (Yt )   , t (1.7) Var(Yt )  E (Yt   )2   2 , t (1.8)  k  Cov(Yt ,Yt k )  E[(Yt   )(Yt k   )] , ∀t (1.9) Chuỗi Yt đƣợc gọi là chuỗi không dừng nếu nó vi phạm bất kì điều kiện nào nói ở trên. k  k chính là hệ số tƣơng quan Yt và Yt-k. 0 Các  k là một hàm phụ thuộc vào độ dài của trễ, hàm này đƣợc gọi là hàm tự tƣơng quan AFC, ACF (k )  k  Cov(Yt ,Yt k ) Var(Yt ) Điều kiện thứ ba trong định nghĩa chuỗi dừng có nghĩa là hiệp phƣơng sai, do đó hệ số tƣơng quan giữa Yt và Yt+k chỉ phụ thuộc vào độ dài (k) về thời gian giữa t và t+k, không phụ thuộc vào thời điểm t. Chẳng hạn: Cov(Yt, Yt5 ) không đổi thì Cov(Y7 , Y12 )  Cov(Y15 , Y20 )  Cov(Y30 , Y35 )    Cov(Yt , Yt6 ) không đổi. Nhƣng Cov(Yt , Yt 5 ) có thể khác với Cov(Yt , Yt 6 ) 13 1.5. Hàm tự tƣơng quan và hàm tự tƣơng quan riêng 1.5.1. Hàm tự tƣơng quan Ở mục 1.4 đã nhắc đến hàm tự tƣơng quan, sau đây sẽ trình bày khái niệm một cách đầy đủ hơn. “Tự tƣơng quan” đƣợc hiểu nhƣ là sự tƣơng quan giữa các thành phần của dãy số thời gian hoặc không gian. Trong mô hình hồi quy tuyến tính cổ điển, ta giả định rằng không có tƣơng quan giữa các sai số ngẫu nhiên uinghĩa là: Cov(ui , u j )  0 (i  j ) Nói một cách khác, mô hình cổ điển giả định rằng sai số ứng với quan sát nào đó không bị ảnh hƣởng bởi sai số ứng với quan sát khác. Tuy nhiên trong thực tế có thể xảy ra hiện tƣợng mà sai số của các quan sát lại phụ thuộc nhau, nghĩa là: Cov(ui , u j )  0 (i  j ) khi đó xảy ra hiện tƣợng tự tƣơng quan. Hàm tự tƣơng quan (ACF) với độ trễ k, kí hiệu bằng  k , đƣợc xác định nhƣ sau: ACF (k )  k  Cov(Yt , Yt k ) Var(Yt ) 1.5.2. Hàm tự tƣơng quan riêng Hàm tự tƣơng quan riêng (PACF) ký hiệu là ρkk. Trong khi ACF ρk, k = 1,2,..., là hệ số tƣơng quan không điều kiện giữa Yt và Y t-k, nó không tính đến ảnh hƣởng của các quan hệ trung gian Yt-1, Yt-2, ...,Yt-k-1 thì ρkk là hệ số tƣơng quan có điều kiện. kk  Corr(Yt ,Yt k | Yt 1,Yt 2 ,,Yt k 1 ), k=1,2, 14 1.6.Nhiễu trắng và bƣớc ngẫu nhiên 1.6.1. Nhiễu trắng Quá trình 𝑢𝑡 ∞ 𝑡= −∞ đƣợc gọi là nhiễu trắng nếu thành phần của chuỗi có kì vọng bằng 0, phƣơng sai không đổi và không tự tƣơng quan, tức là: E (ut )  0, t (1.10) Var(ut )  2, t (1.11) Cov(u t , ut s )  0, s  0, t (1.12) Đôi khi điều kiện (1.12) đƣợc thay thế bằng điều kiện mạnh hơn: ut, uτ độc lập với nhau, với t ≠ τ. (1.13) Quá trình thỏa mãn (1.10), (1.11) và (1.13) đƣợc gọi là nhiễu trắng độc lập. Nếu các điều kiện (1.10), (1.11) và (1.13) đƣợc thỏa mãn và ut ~ N(0, σ2 ) thì quá trình ngẫu nhiên đƣợc gọi là nhiễu trắng Gauss. Chú ý rằng từ (1.13) suy ra (1.12), điều ngƣợc lại sẽ không đúng. Nhiễu trắng là một chuỗi dừng. 1.6.2.Bƣớc ngẫu nhiên NếuYt  Yt 1  ut , trong đó ut là nhiễu trắng, thì Yt đƣợc gọi là bƣớc ngẫu nhiên E (Yt )  E(Yt 1)  E(ut )  E(Yt 1) Điều này có nghĩa là kỳ vọng của Yt không đổi. Ta hãy xem phƣơng sai của Yt: Y1  Y0  u1 Y2  Y1  u2  Y0  u1  u2 ………………………… Yt  Y0  u1  u2   ut 15 (1.14) Do Y0 là hằng số, các ut không tƣơng quan với nhau, có phƣơng sai không đổi 𝜎 2 , nên: Var(Yt )  t2 , (1.15) Điều trên chứng tỏ Yt là chuỗi không dừng. YY  Yt 1Yt 1  Yt 1ut t t 1 Cov(Yt ,Yt 1 )  Cov(Yt 1,Yt 1 )  0  (t  1) 2 Cov(Yt ,Yt k )  (t  k ) 2 AFC (k )  k  (t  k ) / t với mọi k (1.16) Sai phân bậc nhất của Yt: Yt  Yt  Yt 1  ut . Trong trƣờng hợp này Yt là chuỗi dừng. Dùng toán tử trễ L, ta có Yt  (1  L)Yt Nếu đƣa thêm vào mô hình bƣớc ngẫu nhiên một hằng số, thì Yt đƣợc gọi là bƣớc ngẫu nhiên có bụi (random walk with drift). Yt    Yt 1  ut Yt    ut hay (1  L)Yt    ut E (Yt )  Y0   t ; Var(Yt )  t 2 (1.17) 16 CHƢƠNG 2. MÔ HÌNH ARIMAVÀ ỨNG DỤNG 2.1. Mô hình ARIMA 2.1.1. Quá trình trung bình trƣợt (MA) Yt là quá trình trung bình trƣợt bậc q, nếu Yt có dạng: Yt    ut  1ut 1    qut q , t=1, 2, …,n (2.1) trong đó: utlà nhiễu trắng. Hay (Yt   )  (1  1L    q Lq )ut Hiểnnhiên: E (Yt )   Cov(Yt ,Yt k )  E ((   ut  1ut 1    qut q )(  ut k  1ut k 1  qut k q ))  E (k ut2k  1k 1ut2k 1  2k 2ut2k 2    qqk ut2q )  (k  1k 1  2k 2    qqk ) 2  2 qk ii k , nÕu k  q   k  Cov(Yt , Yt k )    i 0  0, nÕu k > q  (2.2) 0  1 Với bất kỳ các giá trị của (θ1 , θ2 , … , θq ) thì các MA(q) đều là các quá trình dừng. Điều kiện (1.12) đƣợc thỏa mãn. Quá trình MA(q) là khả nghịch khi 1  i  1 , hay tất cả các nghiệm của phƣơng trình đặc trƣng: 1  1z  2 z 2    q z q  0 đều nằm trong vòng tròn đơn vị. Khi đó tồn tại toán tử:  ( L)  (1  1L    q Lq )1 để ut   ( L)(Yt   ). 2.1.2. Quá trình tự hồi quy (AR – Autoregressive Process) Quá trình tự hồi quy bậc p có dạng: 17 Yt  0  1Yt 1  2Yt 2     pYt  p  ut (2.3) Ký hiệu:  ( L)  1  1L  2 L2     p Lp Ta có: ( L)Yt  0  ut (2.4) Điều kiện để quá trình AR(p) hội tụ là 1  i  1, i = 1, 2, …p. Phƣơng trình đặc trƣng đối với AR(p): 1  1z  2 z 2     p z p  0 , có thể viết lại: (1  1z)(1   2 z)(1   p z)  0. Với phƣơng trình trên điều kiện dừng tƣơng đƣơng với điều kiện tất cả các nghiệm𝛼𝑖 , i = 1,2,…,p đều nằm trong vòng tròn đơn vị. E (Yt )    0 (1  1 2     p ) AFC (k )   k  E((Yt   )(Yt k   )) Yt    1 (Yt 1   )  2 (Yt 2   )     p (Yt  p   )  ut Nhân hai vế (Yt – μ) với (Yt-k – μ), sau đó lấy kì vọng ta đƣợc phƣơng trình Yule-Walker:  1 t 1  2 t 2     p t  p , k   k=1,2,... 2  1 t 1  2 t 2     p t  p   , k=0 k  1k 1  2 k 2     p k  p , k = 1,2,... (2.5) (2.6) 2.1.3. Quá trình trung bình trƣợt tự hồi quy ARMA Cơ chế sản sinh ra Y không chỉ là AR hoặc MA mà có thể kết hợp cả hai yếu tố này. Khi kết hợp cả hai yếu tố, mô hình đƣợc gọi là mô hình trung bình trƣợt tích hợp tự hồi quy ARMA. Yt là quá trình ARMA(1,1) nếu Y có thể biểu diễn dƣới dạng: Yt    1Yt 1  0ut  1ut 1 trong đó: ut là nhiễu trắng. Tổng quát, Yt là quá trình ARMA(p,q) nếu Y có biểu diễn dƣới dạng: Yt    1Yt 1  ...   pYt  p  0ut  1ut 1  qut q 18 (2.7) 2.1.4.Quá trình trung bình trƣợt, tích hợp tự hồi quy ARIMA Một chuỗi thời gian có thể dừng hoặc không dừng. Chuỗi không dừng đƣợc gọi là tích hợp bậc 1, đƣợc kí hiệu là I(1), nếu sai phân bậc nhất là chuỗi dừng. Chuỗi đƣợc gọi là tích hợp bậc d, nếu sai phân bậc d là chuỗi dừng, ký hiệu là I(d). Nếu d = 0 thì chuỗi xuất phát là chuỗi dừng. Nếu chuỗi Yt tích hợp bậc d, áp dụng mô hình ARMA(p,q) cho chuỗi sai phân bậc d thì có quá trình ARIMA(p,d,q). Trong ARIMA(p,d,q), d là số lần lấy sai phân chuỗi Yt để đƣợc một chuỗi dừng, p là bậc tự hồi quy, q là bậc trung bình trƣợt, p và q là bậc tƣơng ứng của chuỗi dừng. AR(p) là trƣờng hợp đặc biệt của ARIMA(p,d,q) với d = 0, q = 0. MA(q) là trƣờng hợp đặc biệt của ARIMA(p,d,q) với d = 0 và p =0. ARIMA(2,1,2) – nghĩa là chuỗi Yt có sai phân bậc 1 là chuỗi dừng, chuỗi sai phân dừng này có thể biễu diễn dƣới dạng ARMA(2,2): Yt    1Yt 1  2Yt 2  0ut  1ut 1  2ut 2 trong đó ut là nhiễu trắng. Nhƣ vậy nếu biết các tham số p, q, d khi đó ta có thể mô hình hóa đƣợc chuỗi. Vấn đề đặt ra là xác định p, q, d và các tham số 𝜃,  . 2.1.5. Dự báo 2.1.5.1. Dự báo quá trình AR(p) Yt là quá trình tự hồi quy bậc p, Yt có dạng: Yt  0  1Yt 1  2Yt 2     pYt  p  ut Đặt  1 1  F  0    0 2 3   p 1  p  0  1 0  0 0  khi đó:     0 0  1 0  0 0  0 19  Y t  s    f11( s 1) (Yt 1   )  f12( s 1) (Yt 2   )    f1(ps 1) (Yt  p   )  ut  s   1ut  s 1   2ut  s 2     s 1ut 1 , (2.8) fik(j) là phần tử (i,k) của Fj,  j đƣợc cho bởi phần tử (1,1) của Fj:  j  f11( j ) . Khi dự báo, các số hạng chứa ut+j đƣợc bỏ qua. Sai số dự báo là:  Yt s  Y t s   1ut s1   2ut s2  ...   s1ut 1 Cách đơn giản nhất của dự báo là sử dụng phƣơng pháp đệ quy:  Y t 1    1 (Yt   )  2 (Yt 1   )     p (Yt  p1   ),   Y t 2    1 (Y t 1   )  2 (Yt 1   )     p (Yt  p2   ),     Y t s    1 (Y t s1   )  2 (Y t s2   )     p (Y t s p   ),  Y k  Yk với k  n . 2.1.5.2. Dự báo quá trình MA (q) Yt là quá trình trung bình trƣợt bậc q, Yt có dạng: Yt    ut  1ut 1    qut q , t=1,2,n Hay (Yt   )  ut  1ut 1    qut q , t=1,2,n (Yt   )  (1  1L    q Lq )ut (2.9)  1  1L     q Lq 1 Khi đó: Y t  s     (Y   ). s L 1  1L     q Lq t 1  1L     q Lq  Xét Ls s  s 1L  s 2 L2    q Lq s neáu s=1,2,...,q  neáu s=q+1,q+2,... 0  Y t s    ( s   s1L   s2 L2    q Lqs )u t 20 (2.10) (2.11) ut  (Yt   )  1ut 1  2ut 2    qut q . (2.12) Dự báo dài hơn q thời kì đơn giản chỉ là trung bình không điều kiện dàng buộc. 2.1.5.3. Dự báo quá trình ARMA(p,q) Ta xem xétquá trình dừng và khả nghịch ARMA(p,q): (1  1L  2 L2   p Lp )(Yt   )  (1  1L  2 L2    q Lq )ut (2.13) Ta có:  Y t 1    1 (Yt   )  2 (Yt 2   )     p (Yt  p1   )  1u1  2u2   qut q1  ut  Yt  Yt (2.14) Giá trị dự báo thời kì s sẽ là:  (Y t  s   )       1 (Y t  s 1   )   2 (Y t  s 2   )     p (Y t  s  p   )    + sut   s 1ut 1     qut  s q , s  1,2,, q     s  q  1, q  2,   1 (Y t  s 1   )   2 (Y t  s 2   )     p (Y t  s  p   ),  (2.15) Y k  Yk với k  t 2.1.5.4. Dự báo quá trình ARIMA(p,d,q) Yt là chuỗi tích hợp bậc d, tức là sai phân bậc d của Yt là quá trình dừng, đặt Yt   d (Yt ) ,p là bậc tự hồi quy của Yt  và q là bậc trung bình trƣợt, khi đó chúng ta có mô hình ARIMA(p,d,q). (1  1L  2 L2     p Lp )(Yt    )  (1  1L  2 L2    q Lq )ut (2.16) (2.16) chính là mô hình ARMA(p,q) đối với chuỗi Yt  (Barlett, 1946). Khi dự báo, ngƣời ta dự báo cho chuỗi Yt  sau đó dự báo cho chuỗi Yt. 21 2.1.6. Kiểm định nghiệm đơn vị Kiểm định nghiệm đơn vị là kiểm định quan trọng khi phân tích tính dừng của chuỗi thời gian. Bằng cách dùng kiểm định nghiệmđơn vị có thể kết luận chuỗi có tuân theo bƣớc ngẫu nhiên hay không dừng. Việc tìm ra kiểm nghiệm đơn vị là một trong các phát hiện quan trọng của kinh tế học hiện đại những năm 80 của thế kỷ 20. Với đề tài này em xin trình bày kiểm nghiệm Dickey-Fuller Kiểm nghiệm Dickey-Fuller Dickey-Fuller (1979) đã nghiên cứu quá trình AR(1): Yt  Yt 1  ut (2.17) trong đó Y0 là giá trị xác định hữu hạn, u t  IID .Nếu nhƣ  = 1, khi đó Yt là một bƣớc ngẫu nhiên. Yt là một chuỗi không dừng. Do đó để kiểm định tính dừng của Yt ta sẽ kiểm định giả thuyết: H 0 :   1; H1 :   1 (2.18) Ta biến đổi Yt  Yt  Yt 1  (  1)Yt 1  ut . Yt   Yt 1  ut . Bây giờ giả thuyết (1.11) tƣơng đƣơng với H 0 :   0; H1 :   0. (2.19) Nếu H0 đƣợc chấp nhận thì: Yt  Yt  Yt 1  ut . Khi đó Yt là chuỗi dừng vì ut là IID. Để tìm ra chuỗi Yt là dừng hay không dừng thì hoặc là sẽ ƣớc lƣợng (2.17) và kiểm định giả thuyết   0 ; hoặc là ƣớc lƣợng (1.12) và kiểm định giả thuyết   0 . Trong cả hai mô hình này đều không dùng đƣợc tiêu chuẩn T (Student – test) ngay trong trƣờng hợp mẫu lớn vì Yt có thể là chuỗi không dừng. Dickey-Fuller (DF) đã đƣa ra tiêu chuẩn để kiểm định sau đây dựa trên phân phối giới hạn. 22 H0 :   1 (Chuỗi là không dừng) H1 :   1 (Chuỗi dừng) Ta ƣớc lƣợng mô hình (2.17),   (  1) Se( ) có phân phối DF. Nếu nhƣ:   (  1) Se( )    thì bác bỏ H0. Trong trƣờng hợp này chuỗi là chuỗi dừng. Tiêu chuẩn DF đƣợc áp dụng cho các mô hình sau đây: Yt   Yt 1  ut (2.20) Yt  1   Yt 1  ut (2.21) Yt  1  2t   Yt 1  ut (2.22) Đối với các mô hình trên, giảthuyết cần kiểm định là: H 0 :   0; H1 :   0 (Chuỗi không dừng – hay nghiệm đơn vị) Dickey và Fuller đã chứng tỏ rằng phân bố giới hạn và các giá trị tới   hạn của thống kê (   )n   n có thể tìm đƣợc với giả thiết u t  IID và ngay cả trƣờng hợp ut là quá trình tự hồi quy. Giả sử rằng Yt cho bởi (2.17) và (2.19); ut là quá trình dừng, tự hồi quy bậc q: ut  1ut 1  2ut 2    qut q   t , (2.23)  t  IID (2.22) sẽ có dạng: Yt  1  2t   Yt 1  1ut 1  2ut 2    qut q   t , (2.24) ut  Yt  Yt 1 thay vào (2.24) đƣợc: Yt  1  2t   Yt 1  1 (Yt 1  Yt 2 )  2 (Yt 2  Yt 3 )    q (Yt q  Yt q1 )   t , q Yt  1   2t   Yt 1   i Yt 1  t (2.25) i 1 23 Tiêu chuẩn DF áp dụng cho (2.25) đƣợc gọi là tiêu chuẩn ADF (Augumented Dickey – Fuller). 2.1.7.Phƣơng pháp Box – Jenkins. Mô hình ARIMA đƣợc sử dụng khá phổ biến trong dự báo ngắn hạn. Lý do là mô hình này chỉ dùng các giá trị trong quá khứ của chính biến số cần dự báo. Do sử dụng chỉ những thông tin trong quá khứ nên mô hình thích hợp với dự báo ngắn hạn. ARIMA không thích hợp để dự báo chính sách. Mô hình ARIMA đôi khi đƣợc coi là mô hình phi lý thuyết vì nó không dựa trên một lý thuyết kinh tế nào. Có hai phƣơng pháp cơ bản để đánh giá sự phù hợp của mô hình ARIMA để mô tả một chuỗi thời gian cho trƣớc: phƣơng pháp Box-jenkins và phƣơng pháp lựa chọn tổ hợp các tham số (p,q). Box và Jenkins (1974) đã đƣa ra một tập hợp các bƣớc, các thủ tục ƣớc lƣợng mô hình ARIMA cho một chuỗi thời gian. Phƣơng pháp này đã trở nên phổ biến trong nhiều lĩnh vực: kinh tế, y thuật, kĩ thuật,… và đƣợc gọi là phƣơng pháp Box-Jenkins. Phƣơng pháp Box-Jenkins gồm có 3 bƣớc: định dạng mô hình; ƣớc lƣợng các tham số và kiểm định. Ba bƣớc trên đƣợc lặp lại cho đến khi nào đƣợc một mô hình tốt. 2.1.7.1. Định dạng mô hình – xác định tham số p, d, q Định dạng mô hình tức là phải tìm ra các tham số p,d và q. Công việc này rất khó khăn cả về lý thuyết và thực hành. Để tìm đƣợc d phải dùng kiểm định JB, kiểm định nghiệm đơn vị DF hoặc ADF. Nếu chuỗi ban đầu không dừng, khi đó ta tính sai phân cấp I. Tiếp tục kiểm định tính dừng. Từ chuỗi dừng nhận đƣợc, ta phải tìm các giá trị p và q, hay nói cách khác đi phải định dạng mô hình ARMA cho 24 chuỗi dừng. Có rất nhiều phƣơng pháp để tìm đƣợc p và q. Không có phƣơng pháp nào là tối ƣu tuyệt đối. a) Lược đồ tương quan và tự tương quan Dùng lƣợc đồ tƣơng quan và tự tƣơng quan riêng là phƣơng pháp hiệu quả để xác định p và q. Lƣợc đồ vẽ ACF và PACF theo độ dài của trễ. Đồng thời cũng vẽ đƣờng phân giải chỉ khoảng tin cậy 95% cho giá trị bằng 0 của hệ sô tự tƣơng quan ( Bartlett, 1946) và hệ số tự tƣơng quan riêng (± 1,96/ n). Dựa trên các lƣợc đồ này ta biết đƣợc các hệ số tƣơng quan và các hệ số tự tƣơng quan riêng khác không với mức ý nghĩa 5%. Từ đó có thể đƣa ra các đoán nhận chuỗi dừng, các giá trị p, q của các quá trình AR(p) và MA(q). Do  kk đo mức độ kết hợp giữa Yt và Yt-k sau khi đã loại bỏ ảnh hƣởng của Yt 1,,Yt k 1 do đó nếu  pp  0 và kk  0 với k > p và i , i = 1, 2, …, giảm theo hàm mũ hoặc theo hình sin thì ta có quá trình AR(p). Nếu các ii , i = 1, 2, …, giảm dần theo hàm mũ hoặc hàm sin, q  0, k  0 với k > q thì có quá trình MA(q), … 25 Bảng 1: Bậc p, q của ARIMA ARIMA (p,d,0) AFC PAFC Giảm dạng mũ hoặc giảm kk  0 với k > p hình sin (0,d,q) k  0 với k > q Giảm dạng mũ hoặc giảm hình sin (1,d,1) 1  0 11  0 Sau đó giảm dạng mũ hoặc Sau đó giảm dạng mũ hoặc (1,d,2) hình sin hình sin 1, 2  0 11  0 Sau đó giảm dạngmũ hoặc Sau đó giảm dạng mũ hoặc (2,d,1) hình sin hình sin 1  0 11, 22  0 Sau đó giảm dạng mũ hoặc Sau đó giảm dạng mũ hoặc (2,d,2) hình sin hình sin 1, 2  0 11, 22  0 Sau đó giảm dạng mũ hoặc Sau đó giảm dạng mũ hoặc hình sin hình sin Nhƣ vậy phƣơng pháp này Box-Jenkins tính toán các hệ số tƣơng quan mẫu SACF và hệ số tƣơng quan riêng mẫu SPACF, so sánh với các giá trị lý thuyết ACF và PACF. Nếu có sự phù hợp giữa chúng với nhau thì các tham số của mô hình sẽ đƣợc ƣớc lƣợng. Ƣu điểm chủ yếu của phƣơng pháp này là áp dụng một cách hệ thống các bƣớc trong quá trình xây dựng mô hình. Nhƣợc điểm của phƣơng pháp này là trong quá trình xem xét một 26 cách trực giác SACF và SPACF để xác định p và q. Kết quả sẽ mang tính chủ quan. b)Tiêu chuẩn Akaike, Schwarz Phƣơng pháp Box-Jenkinslà phƣơng pháp phổ biến nhất. Bên cạnh đó ngƣời ta còn dùng một số phƣơng pháp khác, kết hợp nhiều phƣơng pháp khác nhau để chuẩn đoán p và q của mô hình sau khi tham số đã đƣợc xác định. Một ý tƣởng là ngƣời ta có thể đánh đổi một hoặc nhiều độ trễ của AR(p) với một vài độ trễ của MA(q) bằng cách xem xét chi phí về mặt thông tin đối với số tham số đƣợc cực tiểu vẫn đảm bảo sự phù hợp của mô hình. Tiêu chuẩn hiển nhiên để so sánh các mô hình là phƣơng sai của phần dƣ. Kí hiệu phần dƣ của mô hình ARMA(p,q) là et ( p, q) . Ƣớc lƣợng phƣơng sai của phần dƣ tƣơng ứng:   p ,q 1 n    et ( p, q ) n t 1 (2.26) Nếu dựa vào phƣơng sai phần dƣ để xem xét thì hiển nhiên mô hình có nhiều tham số hơn càng phù hợp vì mỗi một tham số đƣa thêm sẽ làm cho mô hình mềm dẻo hơn trong việc sấp xỉ với số liệu quan sát. Tuy nhiên nếu sử dụng quá nhiều tham số để mô tả phần MA thì khả năng dự báo ngoài mẫu sẽ kém đi. Chẳng hạn, có thể đƣa vào số tham số bằng số quan sát, khi đó. Các phần dƣ sẽ bằng không, ƣớc lƣợng của phƣơng sai bằng không. Nhƣng mô hình nhƣ vậy sẽ không phù hợp vì mô hình hóa là việc mô tả đơn giản hóa thực tế, ta đã biểu diễn n điểm qua n điểm khác. Mô hình có quá nhiều tham số sẽ không phù hợp với thực tế. Trƣờng hợp khác, nếu mô hình có quá ít tham số, hiển nhiên sẽ là không phù hợp. 27 Vì những điều nói trên nên tiêu chuẩn chỉ dựa trên phƣơng sai có những khiếm khuyết nhất định. Ngƣời ta sẽ đƣa ra một số tiêu chuẩn khác để khắc phục tình trạng quá nhiều tham số. Ở đây sẽ đƣa ra tiêu chuẩn thông tin Akaike, Schwarz và tiêu chuẩn Akaike hiệu chỉnh. Akaike (1974) đề xuất tiêu chuẩn AIC (4): 2 AIC ( p, q)  ln( ( p, q))  2( p  q) n . AIC ( p1, q1 )  min AIC ( p, q), p  P, q  Q. (2.27) Khi đó p1 và q1 là các giá trị thích hợp của p và q. Số hạng đầu tiên trong AIC(p,q) đo độ phù hợp dựa vào phƣơng sai của sai số ƣớc lƣợng đƣợc. Số hạng thứ hai là mức phạt đối với mô hình với số hệ số lớn. Đƣa thêm số hạng thứ hai nhằm khắc phục tình trạng quá nhiều tham số. Tuy nhiên tiêu chuẩn này có thể đƣa ra số tham số nhiều hơn một so với tham số cực tiểu và nó phụ thuộc vào số liệu có phân bố chuẩn hay không. Bằng phƣơng pháp mô phỏng Monte Carlo, Ngƣời ta đã chỉ ra rằng tiêu chuẩn AIC có xu hƣớng dẫn đến quá nhiều tham số. Schwarz (1978) đƣa ra một tiêu chuẩn BIC (Bayesian Information Criterion): 2 BIC ( p, q)  ln( ( p, q))  ( p  q)ln(n) n (2.28) Lƣợng phát trong (2.28) lớn hơn nên tiêu chuẩn Schwarz có xu hƣớng dẫn đến lựa chọn mô hình có tham số nhỏ hơn AIC. Tiêu chuẩn AIC hiệu chỉnh AICC (Correctet Akaike Infomation Criterion): 2 AICC ( p, q)  ln( ( p, q))  2( p  q  1) (n  p  q  2) (2.29) AICC hiệu chỉnh là ƣớc lƣợng chệch của AIC. AICC đƣợc dùng cho mẫu nhỏ. Khi kích thƣớc mẫu lớn thì hai tiêu chuẩn này là nhƣ nhau. 28 Trong hai tiêu chuẩn trên các tập P và Q đều chƣa biết. Hannan (1980) chỉ ra rằng nếu p0 và q0 là các giá trị đúng thì p1  p0 ; q1  q0 Trên cơ sở hai tiêu chuẩn này Jefferys (1961), Poskitt và Tremayne (1987) đƣa ra ý tƣởng về xây dựng một lớp mô hình. Cơ sở của quan niệm này là mặc dù p1 và q1 đã đƣợc xác định, nhƣng chƣa chắc đã là các giá trị thực của mô hình và cần phải xem xét thêm bằng các tiêu chuẩn khác đối với các giá trị lân cận của p1 và q1. Các tác giả trên đƣa ra: 1 R  exp( n{BIC ( p1, q1 )  BIC ( p, q)}) 2 (2.30) Tremayne đề nghị rằng nếu R < 10 thì không đủ chứng cớ để loại bỏ mô hình đã chọn bằng thủ tục Akaike và thủ tục Schwarz. Nếu với những cặp (p,q) mà 1  R  10 thì các cặp này cần phải đƣợc xem xét nhƣ (p1,q1). Nhƣ vậy có thể có một lớp các mô hình ARMA(p,q) mà 1  R  10 cần phải cân nhắc thêm bằng các tiêu chuẩn khác. Nếu gọi k là số tham số của mô hình, ta có k AIC  k AICC  kBIC . BIC là ƣớc lƣợng vững. Nó sẽ cho xác định đƣợc khá chính xác các tham số của mô hình. Kết quả nhận đƣợc theo tiêu chuẩn này sẽ thỏa mãn AIC, AICC. Trên thực tế thƣờng ta chỉ có mẫu có kích thƣớc giói hạn, nên tính vững của ƣớc lƣợng ít có ý nghĩa. c)Kiểm nghiệm nhân tử Lagrange (LM) Kiểm định LM đƣợc sử dụng để kiểm định tự tƣơng quan, kiểm định giả thuyết về nhiều điều kiện ràng buộc đối với các hệ số hồi quy, mục này sẽ sử dụng kiểm định LM để kiểm định mô hình ARMA. Giả thiết: H0: Dạng của mô hình ARMA(p,q). Giả thiết đối có hai dạng sau đây: HA: Dạng của mô hình ARMA(p+r,q) HB: Dạng của mô hình ARMA(p,q+s) 29 Để kiểm định các cặp giả thiết trên, trƣớc hết phải ƣớc lƣợng mô hình ARMA(p,q) đối với chuỗi dừng Y*t( Y*t – là chuỗi Yt nếu Ytlà chuỗi dừng. Nếu Yt không phải là chuỗi dừng thì Y*t sẽ là chuỗi sai phân tƣơng ứng). Từ kết quả thu đƣợc ta có các phần dƣ et.  H0: Dạng của mô hình ARMA(p,q) HB: Dạng của mô hình ARMA (p+r,q). Để kiểm định giả thiết này phải ƣớc lƣợng mô hình ARMA(p+r,q), tức là: et    0ut  1ut 1    qut q  1Yt 1  2Yt 2  ...   pYt  p  1Yt  p1 2Yt  p2     pYt  pr   t (2.31) Từ kết quả ƣớc lƣợng thu đƣợc R2, nếu (n  p  r ) R2  2 (r ) thì H0 bị bác bỏ.  H0 : Dạng của mô hình ARMA(p,q) HA : Dạng của mô hình ARMA(p,q+s) et    0ut  1ut 1    qut q  q1ut q1    t qsut qs  1Yt 1 2Yt 2     pYt  p   t (2.32) Từ kết quả ƣớc lƣợng thu đƣợc R 2  2 (s) thì H0 bị bác bỏ. Ngoài tiêu chuẩn χ2 ở trên còn có thể dùng tiêu chuẩn F để kiểm định dựa trên mô hình hồi quy có điều kiện ràng buộc. 2.1.7.2. Ước lượng mô hình Sau khi định dạng mô hình, ra biết đƣợc d-bậc của sai phân đối với chuỗi xuất phát để thu đƣợc một chuỗi dừng. Đối với chuỗi dừng này ta cũng đã biết các giá trị của p và q. Vấn đề tiếp theo là ƣớc lƣợng các tham số  và  của mô hình ARMA(p,q). Có một số phƣơng pháp để ƣớc lƣợng. 30 (a) Phƣơng pháp sử dụng các ƣớc lƣợng Yule-Walker trong các phƣơng trình YW. Dựa vào các SPACF và hệ phƣơng trình YW để tìm ra ƣớc lƣợng của quá trình AR. Đối với mô hình ARMA phƣơng trình YW cũng đƣợc sử dụng để ƣớc lƣợng các hệ số của AR. Các hệ số của quá trình MA đƣợc ƣớc lƣợng bằng cách khác. (b) Phƣơng pháp OLS: Phƣơng pháp này ƣớc lƣợng các tham số bằng cực tiểu hóa tổng bình phƣơng các phần dƣ. Nếu chỉ có AR thì OLS dẫn đến các ƣớc lƣợng tuyến tính. Nếu có cả MA thì OLS dẫn đến ƣớc lƣợng phi tuyến và phải dùng các phƣơng pháp số. Sử dụng các phƣơng trình YW hay phƣơng pháp OLS thƣờng chỉ để tính các giá trị ban đầu của các tham số dùng trong phƣơng pháp ƣớc lƣợng hợp lí cực đại. (c) Phƣơng pháp ƣớc lƣợng hợp lý cực đại MLE (Svetlozar,Stefan,Frank, Sergio, Teo Jasi, 2007): Phƣơng pháp này cực đại hóa logarit hàm hợp lý gắn với mô hình đã định dạng. Để sử dụng đƣợc phƣơng pháp này phải có giả thiết về phân bố của yếu tố ngẫu nhiên. Thông thƣờng giả thiết: ut  N (0, 2 ) Sau đây sẽ trình bày phƣơng pháp MLE. Xét trƣờng hợp biến ngẫu nhiên ut có phân phối IID và hàm mật độ xác suất có dạng N (0, 2 ) . Yt  0  1Yt 1  2Yt 2     pYt  p  ut  1ut 1    qut q ; ut  N (0, 2 ); ut  Yt  0  1Yt 1  2Yt 2     pYt  p  1ut 1    qut q ; f (ut )  (2 )1 2 exp(ut2 2). (2.33) Ký hiệu T là kích thƣớc của mẫu sau khi bỏ đi các quan sát không có do các yếu tố trễ của AR và MA; et là các phần dƣ, khi đó logarit cơ số e của hàm hợp lý có dạng: 31  T T 1 T 2 2 ln L( , , Yt )   ln(2 )  ln( )  2  et 2 2 2 t 1       ( 0 , 1, 2 ,, p , 1, 2 ,, q ) 2 (2.34) et  Yt   0   1Yt 1   2Yt 2     pYt  p   1et 1     qet q Quá trình ƣớc lƣợng sẽ đƣợc thực hiện theo phƣơng pháp lặp, quá trình sẽ kết thúc khi chênh lệch ƣớc lƣợng các hệ số giữa hai bƣớc kế tiếp nhau không đáng kể. 2.1.7.3. Kiểm định tính thích hợp của mô hình Giả thiết cơ bản trong mô hình ARIMA là yếu tố ngẫu nhiên ut-phần không giải thích đƣợc của Yt với các thông tin đã biết trong quá khứ Yt-1 , Yt-2 và ut-1, ut-2 ,…-không có giải thích (đầy đủ hay từng phần) hoặc dự báo từ các thông tin trong quá khứ. Về mặt toán học có nghĩa là ut là nhiễu trắng. Do đó cần phải kiểm định giả thiết “ut là nhiễu trắng”, tức là:   2 , s=t E (ut )  0, E (us , ut )   0 , s  t Vẽ lƣợc đồ tƣơng quan SACF và SPACF cho phần dƣ. Nếu SACF và SPACF không có thành phần có ý nghĩa thống kê thì ut tƣơng tự với nhiễu trắng. Khi đó mô hình là chấp nhận đƣợc. Trƣờng hợp ngƣợc lại - có phần tử có ý nghĩa thống kê - thì phần dƣ có chứa những thông tin mà mô hình chƣa tách ra khỏi số liệu đƣợc, hay trong phần dƣ còn thông tin. Có một số kiểm định khác dựa vào hệ số tƣơng quan của các phần dƣ. Kiểm định đƣợc ƣa thích là kiểm định Khi bình phƣơng dựa trên thống kê Q của Box-Pierce-BP (1970). H 0 :  ,1   ,2     ,k  0 ; H1 : có ít nhất  ,i  0 2 Q  n   ,i ; k (2.35) i 1 32    ,i là hệ số tự tƣơng quan mẫ bậc i của phần dƣ;n là kích thƣớc mẫu. k đƣợc chọn đủ lớn sao cho ảnh hƣởng của hệ số tự tƣơng quan bậc cao có thể đƣợc bỏ qua, các hệ số này đƣợc giả thiết là dần tới không. Trên thực tế có thể tính Q với một vài giá trị của k. Nếu ut là nhiễu trắng thì Q có phân bố tiệm cận  2 với bậc tự do (k-q-p). Tính toán giá trị Q, so sánh với giá trị tới hạn. Nếu giá trị của Q lớn hơn giá trị tới hạn thì bác bỏ giả thuyết H0 về phần dƣ không tƣơng quan. Q chỉ có phân bố tiệm cận Khi bình phƣơng, cho nên trong trƣờng hợp mẫu nhỏ, phân bố của Q có thể hoàn toàn khác Khi bình phƣơng. Trong trƣờng hợp mẫu nhỏ, thống kê Ljung-Box (1978) phù hợp hơn: 2 Q  n(n  2) (n  i)   ,i k  (2.36) i 1 Q* có phân bố Khi bình phƣơng, k bậc tự do. Tuy nhiên nếu kích thƣớc mẫu là quá nhỏ, tiêu chuẩn LB có mức tin cậy thấp, có thể không phát hiện ra sai lầm định dạng của mô hình. Hai tiêu chuẩn trên chỉ kiểm định không có tự tƣơng quan của các phần dƣ mà không phải kiểm định sự độc lập. Granger và Anderson đã đƣa ra một số thí dụ trong đó các phần dƣ không tƣơng quan trong khi bình phƣơng phần dƣ lại tƣơng quan có ý nghĩa thống kê. McLeod và Li đã kiểm định giả thuyết: H 0 : 22 ,1  22 ,2    22 ,k  0, 2 Q  n(n  2) (n  i )   2 ,i . k  2 (2.37) i 1 2 Trong đó   2 ,k là hệ số tự tƣơng quan mẫu bậc k của bình phƣơng phần dƣ. 33 Một tiêu chuẩn khác dựa vào hệ số tƣơng quan riêng của bình phƣơng phần dƣ: 2 Q M  n(n  2) (n  i)   2 ,i , k (2.38) i 1 2  2 .i là bình phƣơng hệ số tƣơng quan riêng bậc i của phần dƣ. QM có phân bố tiệm cận Khi bình phƣơng với (k-p-q) bậc tự do. Các kết quả mô phỏng của Monti (1994) chỉ ra rằng QM phù hợp trong trƣờng hợp mẫu nhỏ. Kiểm định tính phân bố chuẩn (Jarque, Bera, 1980) Phƣơng pháp MLE đƣợc sử dụng với giả thiết ut có phân bố IID, trong các phần trên ta giả thiết rằng ut có phân bố chuẩn hóa. Bây giờ ta phải kiểm định giả thiết này. Ngƣời ta sử dụng kiểm định Jarque-Bera (JB). Do phân bố chuẩn là đối xứng hình chuông, nên momen cấp ba phải bằng không và momen cấp bốn 4  3 2 , 2  Var(ut ) . Độ đo của mô mem cấp ba hay hệ số bất đối xứng S(Skewness) của các phần dƣ đƣợc tính: 1 n et3 S   3 n t 1  (2.39) Ƣớc lƣợng Momen cấp bốn hay hệ số nhọn K: 1 n et4 (  4  1), n t 1 3  trong đó: n là kích thƣớc mẫu,  - ƣớc lƣợng của  . K (2.40) Với giả thiết ut phân bố chuẩn, khi đó S và K có phân bố tiệm cận chuẩn, trung bình bằng không và phƣơng sai bằng 6/n và 8/(3n) tƣơng ứng với Jarque-Bera kiểm định giả thiết: H0: ut có phân bố chuẩn hay 3 4  0 và 3  0. 3 4 34 2 n n  et3  Thống kê mẫu 1     3  có phân bố tiệm cận  2 (1) 6 t 1    2 n n  et4  2     4  3  có phân bố tiệm cận  2 (1) . 24 t 1    2  1 n  et3 2 1 n  et4     1  2  n     3      4  3      6 t 1    24 t 1   (2.41) có phân bố tiệm cận  2 (2) . Nếu với một mẫu cụ thể,   2 (2) thì H0 bị bác bỏ. 2.1.7.4. Dự báo và sai số dự báo Giả sử số liệu quan sát đến thời kỳ n(t) đƣợc thu thập dƣới dạng tập hợp thông tin It  {Y :   t} . Cần dự báo giá trị trong tƣơng lai ở thời kỳ h(t+h), Yt+h.  Giả sử đã ƣớc lƣợng đƣợc đƣờng hồi quy mẫu Y t (giả thiết Yt là dừng, tức là ta đã có ARMA(p,q). Giá trị trong tƣơng lai Yt+h tính tại thời điểm t,   dựa vào đƣờng Y t ký hiệu là Y t (h) . Có ba giá trị cần phải tính toán (Schwarz, 1978):  -Giá trị Y t (h) -Sai số dự báo -Phƣơng sai của sai số dự báo. Et (Yt h )  E (Yt h It )  E (Yt h Yt 1,Yt 2 ,) (2.42)   Ƣớc lƣợng của Yt+h là Y t (h) . Y t (h) cần phải có sai số dự báo bình phƣơng trung bình (MSE) đạt cực tiểu:   MSE (Y t (h))  E[(Yt h  Y t (h)]2   E[(Yt h  Et (Yt h )  Et (Yt h )  Y t (h) 2 ] Khai triển biểu thức trên dễ dàng nhận thấy 35 (2.43)  E[(Yt h  Et (Yt h ))( Et (Yt h )  Y t (h)2 )]=0  do Yt h  Et (Yt h ) chỉ phụ thuộc vào ut 1, ut 2 ,, ut h , Et (Yt h  Y (h)) chỉ phụ thuộc vào Yt ,Yt-1,   Khi đó MSE (Y t (h))  E (Yt h  Et (Yt h ))2  E ( Et (Yt h )  Y t (h)) 2   MSE ( Et (Yt h )  E ( Et (Yt h )  Y t (h))2   Nếu Y t (h)  Et (Yt h ) thì MSE (Y t (h)) đạt cực tiểu. Et (Yt h ) là ƣớc lƣợng tốt nhất theo nghĩa có sai số bình phƣơng trung bình cực tiểu. Dự báo tuyến tính tốt nhất: Bây giờ ta sẽ tìm dự báo tuyến tính với Yt,Yt-1,.., và ut, ut-1,... đã biết. Giả sử rằng Yt là chuỗi dừng và khả nghịch, ta có:  Yt h   iut hi (2.44) i 0 trong đó { i } là chuỗi các hằng số thỏa mãn   i 0 i  .  Dự báo Y t (h) là tuyến tính và chỉ sử dụng các thông tin Yt,Yt-1,...     hoặc các ut, ut-1,... ta có Y t (h)   jut  j . Ta ƣớc lƣợng các trọng số i j 0  sao cho cự tiểu MSE (Y t (h)) :   MSE (Y t (h))  E[(Yt  h  Y t (h)) 2 ]   E[( iu t hi   j u t  j ]2   i 0 j 0   E[( iu t hi   ( j h   j )u t  j ) 2 ] h 1  i 0 j 0    i 2 2   ( j  h   j ) 2 h 1  i 0 j 0 36 (2.45)   MSE (Y t (h)) đạt cực tiểu với j   j h . Dự báo với sai số bình phƣơng trung bình cực tiểu của Yt+h là:  Et (Yt h )  Y t (h),    Y t (h)   h jut  j   jut h j j 0 (2.46) j h  Sai số dự báo ở bƣớc h là: et (h)  Yt h  Et ((Y t ))   i 0 j h   iut hi   j ut h j h 1   iut hi (2.47) i 0  Var(et (h))   i2 2  MSE (Y t (h)) h 1 (2.48) i 0 Có bốn chú ý: h  0  Var (Yt ) , tức là phƣơng sai dự báo ở bƣớc - Var(et (h))   h sẽ dần đến phƣơng sai không điều kiện của Yt khi h   .  - Các i ,i và  i đƣợc tính đệ quy nên Y t (h) (2.46) đƣợc sử dụng cho dự báo nếu tất cả các ut-i , i=0, i=1,... Trừ khi mô hình chỉ có MA, ut-i , i=0,1,...q là đủ để ƣớc lƣợng. - Đối với t =1,2,... tìm ut từ: p q i 1 i 1 ut  Yt  iYt i iut  j t=1,2,...,n Các giá trị ban đầu là Y0 ,Y-1,…,Y-p và ε0 ,ε-1,… Đối với mô hình dừng j  và khả nghịch, thì j   0 . Do đó trong (2.47) có thể bỏ qua j đối với j đủ lớn. 37 - Thay cho tổng vô hạn (2.47) có thể sử dụng phép đệ quy ARMA cho p   q   dự báo: Y t (h)   i Y t (h  i )   j et (h  j ) , h=1,2,... i 0 j 0  trong đó: Y t (h-i)=Yt+h-i , i  h ;  et h j j  h e t (h-j) =   0 j=0,1,...,h-1 Dự báo khoảng:  Y t (h) nói ở trên là dự báo điểm cho Yt+h. Cần phải tìm khoảng tin cậy cho giá trị dự báo. Trƣớc hết giả thiết rằng mô hình ƣớc lƣợng vẫn đúng trong tƣơng lai.  Do dự báo Y t (h) là tốt hợp tuyến tính của các nhiễu ut, phân bố của  Y t (h) và sai số dự báo et(h) đƣợc xác định bởi phân bố của ut. Giả thiết rằng: ut  ( IID) N (0, 2 ) (2.49) h 1 Ta có et (h)  N (0,  i2 2 ) . Tuy nhiên et(h), h=1,2,... không độc lập. i 1 Phân bố của sai số đƣợc chuẩn hóa là: h 1 et (h) 2  N (0,1);  (h)    2j .  ( h) j 0 Khoảng tin cậy đối xứng (1   ) cho Hay (2.50) et (h) e ( h) là: u1 2  t u  ( h)  (h) 1 2  Yt h  Y t (h) u1 2   u1 2  ( h)   Y t   (h)u1 2  Yt h  Y t   (h)u1 2 38 (2.51) Khoảng trên đƣợc gọi là khoảng dự báo (1   )100% bƣớc h. Độ dài của khoảng sai số dự báo tăng khi h tăng vì  (h) tăng theo h. 2.2. Ứng dụng mô hình ARIMA dự báo chỉ số VNINDEX. Tại thị trƣờng Việt Nam chỉsố VNINDEX phản ánh rủi ro hệ thống vì vậy việc dự báo sự tăng giảm của chỉ số VNINDEX cũng đồng thời giúp các nhà đầu tƣ nhận biết chiều hƣớng biến động giá của các cổ phiếu trên thị trƣờng này. 2.2.1. Xây dựng mô hình ARIMA cho chuỗi VNINDEX Nguồn số liệu đƣợc lấy từ trang web cophieu68.vn. Một trang web tin cậy chuyên cung cấp số liệu về thị trƣờng chứng khoán Việt Nam. Dữ liệu dc lấy là giá đóng của của mỗi phiên giao dịch VNINDEX từ ngày 02/01/2013 đến ngày 20/04/1015 bao gồm 567 số liệu. Trong Eviews vẽ đồ thị của chuỗi VNINDEX bằng lệnh: View -> Graph -> Line and simbol: Hình 1: Đồ thị chuỗi VNINDEX Chuỗi VNINDEX có các giá trị tuyệt đối lớn và rất biến động 39 Tiến hành kiểm nghiệm đơn vị cho chuỗi VNINDEX: Trong Eviews từ chuỗi VNINDEX chọn View -> Unit root test trong mục test stype chọn kiểu kiểm nghiệm ADF ta có kết quả cho bởi hình 2: Hình 2: Kiểm định ADF cho chuỗi VNINDEX Theo kiểm định ADF ta thấy  qs  2,409436    tại cả 3 mức ý nghĩa ∝= 1%, 5%, 10%. Vậy chuỗi VNINDEX chƣa dừng. Để khắc phục tính dừng ta lấy sai phân bậc nhất bằng cách gõ: genr dVNINDEX = d(VNINDEX) và tiến hành kiểm định ADF nhƣ với chuỗi gốc , kết quả thể hiện trong hình 3: Hình 3: Kiểm định ADF cho chuỗi DVNINDEX Theo kiểm định ADF ta thấy  qs  23.00151    tại cả 3 mức ý nghĩa ∝= 1%, 5%, 10%. Vậy chuỗi DVNINDEX là chuỗi dừng. 40 Tiếp đó thực hiện tính toán các hệ số tự tƣơng quan và tự tƣơng quan riêng của chuỗi sai phân và quan sát các biểu đồ tự tƣơng quan, tự tƣơng quan riêng. Thực hiện trong Eviews nhƣ sau: View -> correlogram và chọn 30 thời kỳ trễ. Ta đƣợc nhƣ hình 4: Hình 4: Đồ thị của hàm ACF và PACF của chuỗi DVNINDEX Theo đồ thị ở hình 4, tại độ trễ k=3 AC và PAC đạt cực đại sau đó giảm mạnh xuống và đồ thị có xu hƣớng nằm gọn trong hai đƣờng giới hạn. Do đó p và q có thể nhận các giá trị là 3. Mô hình ARIMA có thể có là ARIMA (3,1,3) 41 2.2.2. Ƣớc lƣợng các tham số của mô hình Trong phần mềm Eviews các bƣớc thực hiện ƣớc lƣợng tham số của mô hình ARIMA nhƣ sau: =>Trên thanh menu chọnQuick -> Estimate Equation. =>Nhập các thông số cần ƣớc lƣợng vào mục Equation Speccification. Hình 5: Các thông số cho mô hình ARIMA(3,1,3) =>Chọn phƣơng pháp bình phƣơng tối thiểu ta thu đƣợc kết quả ƣớc lƣợng nhƣ sau: 42 Hình 6: Kết quả ƣớc lƣợng các thông số của mô hình. Từ kết quả này cho ta một số thông tin nhƣ sau: => Mô hình ARMA(3,3) có dạng nhƣ sau: VNINDEX t  0,766126VNINDEX t 3  0,820957ut 3 =>Thống kê Durbin-Watson DW=1,939138 ≈ 2 cho thấy sai số của ƣớc lƣợng là không tƣơng quan. 2.2.3. Kiểm tra sự phù hợp của mô hình Ta tiến hành kiểm tra sự phù hợp của mô hình thông qua việc kiểm định tính ngẫu nhiên của sai số ƣớc lƣợng đƣợc. Để làm việc này trên phần mềm Eviews ta thực hiện lần lƣợt các bƣớc sau: =>Từ màn hình kết quả ƣớc lƣợng, chọn View ->Residual test -> Correlogram -> Q-Statistics. =>Phân tích biểu đồ tự tƣơng quan và tự tƣơng quan riêng của sai số ƣớc lƣợng đƣợc. Kết quả cho thấytất cả các hệ số tự tƣơng quan mẫu đều 43 nằm trong hai đƣờng giới hạn. Điều này chúng tỏ sai số của ƣớc lƣợng là hoàn toàn ngẫu nhiên. Do vậy mô hình này là phù hợp. Hình 7: Biểu đồ ACF và PACF cho sai số ƣớc lƣợng. 2.2.4. Dự báo giá Mở rộng bộ dữ liệu: Proc -> Structure/Resize Current Page Chọn Dated – regular frequency: Start date: 1; End date: 572 Trong mô hình ƣớclƣợng chọn: Forecast -> Forecast name: vnindef ; S.E (optional): se. Ta có biểu đồ sau: 44 Hình 8: Biểu đồ dự báo Kết quả dự báo: Hình 9: Kết quả dự báo Giá trị thực tế là: 45 Hình 10: Kết quả thực tế Từ kết quả dự báo và kết quả thực tế ta có bảng so sánh sau: Ngày Giá trị thực tế Giá trị dự báo Sai số(%) 21/04/2015 562.2 564.9867 0.4957 22/04/2015 562.5 564.9765 0.4403 23/04/2015 561.2 564.5403 0.5952 24/04/2015 565.8 564.5505 0.2208 27/04/2015 562.4 564.5583 0.2069 Giá trị dự báo gần đúng với giá trị thực tế, mô hình là phù hợp. 46 KẾT LUẬN Mô hình ARIMA có rất nhiều ứng dụng trong thực tế, đặc biệt là trong vấn đề dự báo. Dự báo đƣợc một số chỉ tiêu kinh tế vĩ mô, chỉ số thị trƣờng, giá cả tạo cơ sở cho các nhà hoạch định chính sách đƣa ra chính sách, định hƣớng phát triển, chiến lƣợc phát triển công ty. Mô hình ARIMA tỏ ra dự báo trong ngắn hạn khá hiệu quả. Nó thƣờng đƣợc sử dụng dự báo chỉ số giá tiêu dùng theo tháng, giá của một số mặt hàng xuất khẩu: giá cà phê, sản lƣợng xuất khẩu của một số mặt hàng xuất khẩu. Bên cạnh những ƣu điểm của mô hình thì nó cũng có nhƣợc điểm nhất định nhƣ: khi chuỗi thời gian phi tuyến thì mô hình ARIMA không dự báo đƣợc. Trong bài luận văn này, em đã đã làm đƣợc những việc nhƣ sau: trình bày lý thuyết các lớp mô hình ARIMA,lý thuyết về phƣơng pháp phân tích chuỗi thời gian Box-Jenkins; ứng dụng của mô hình ARIMA dựa trên phƣơng pháp Box-Jenkins, cùng với sự hỗ trợ của phần mềm Eviews để dự báo chỉ số VNINDEX. Với lƣợng kiến thức còn hạn chế và khoảng thời gian có hạn những vấn đề em trình bày trên đây mới chỉ là những kiến thức cũng nhƣ những kết quả dự báo bƣớc đầu. Rõ ràng rằng các kết quả dự báo đã trình bày vẫn chƣa đƣa ra đƣợc những kết quả thực sự đáng tin cậy để phục vụ,áp dụng thực tiễn. Trong tƣơng lai, em sẽ tiếp tục nghiên cứu bài toán dự báo bằng phƣơng pháp chuỗi thời gian để có thể tìm ra phƣơng pháp dự báo tốt hơn và có thể áp dụng đƣợc. 47 DANH MỤC TÀI LIỆU THAM KHẢO  Sách giáo trình: [1]Phạm Thế Anh (2013), Kinh tế lƣợng ứng dụng phân tích chuỗi thời gian, Nxb Lao động. [2]Nguyễn Quang Dong (2014), Giáo trình Kinh tế lƣợng, Nxb Đại học Kinh tế quốc dân. [3] Nguyễn Minh Dũng(2014), Dự báo giá chứng khoán bằng phƣơng pháp chuỗi thời gian, luận văn Thạc sĩ Toán học, Trƣờng Đại học Khoa học tự nhiên. [4]Trần Trọng Nguyên (2013), Giáo trình lý thuyết xác suất, Nxb Đại học Kinh tế quốc dân.  Trang web: [5]www.cophieu68.vn. 48 [...]... DF áp dụng cho (2.25) đƣợc gọi là tiêu chuẩn ADF (Augumented Dickey – Fuller) 2.1.7.Phƣơng pháp Box – Jenkins Mô hình ARIMA đƣợc sử dụng khá phổ biến trong dự báo ngắn hạn Lý do là mô hình này chỉ dùng các giá trị trong quá khứ của chính biến số cần dự báo Do sử dụng chỉ những thông tin trong quá khứ nên mô hình thích hợp với dự báo ngắn hạn ARIMA không thích hợp để dự báo chính sách Mô hình ARIMA. .. kinh tế, y thuật, kĩ thuật,… và đƣợc gọi là phƣơng pháp Box-Jenkins Phƣơng pháp Box-Jenkins gồm có 3 bƣớc: định dạng mô hình; ƣớc lƣợng các tham số và kiểm định Ba bƣớc trên đƣợc lặp lại cho đến khi nào đƣợc một mô hình tốt 2.1.7.1 Định dạng mô hình – xác định tham số p, d, q Định dạng mô hình tức là phải tìm ra các tham số p,d và q Công việc này rất khó khăn cả về lý thuyết và thực hành Để tìm đƣợc d... Mô hình ARIMA đôi khi đƣợc coi là mô hình phi lý thuyết vì nó không dựa trên một lý thuyết kinh tế nào Có hai phƣơng pháp cơ bản để đánh giá sự phù hợp của mô hình ARIMA để mô tả một chuỗi thời gian cho trƣớc: phƣơng pháp Box-jenkins và phƣơng pháp lựa chọn tổ hợp các tham số (p,q) Box và Jenkins (1974) đã đƣa ra một tập hợp các bƣớc, các thủ tục ƣớc lƣợng mô hình ARIMA cho một chuỗi thời gian Phƣơng... tích hợp bậc d, áp dụng mô hình ARMA(p,q) cho chuỗi sai phân bậc d thì có quá trình ARIMA( p,d,q) Trong ARIMA( p,d,q), d là số lần lấy sai phân chuỗi Yt để đƣợc một chuỗi dừng, p là bậc tự hồi quy, q là bậc trung bình trƣợt, p và q là bậc tƣơng ứng của chuỗi dừng AR(p) là trƣờng hợp đặc biệt của ARIMA( p,d,q) với d = 0, q = 0 MA(q) là trƣờng hợp đặc biệt của ARIMA( p,d,q) với d = 0 và p =0 ARIMA( 2,1,2) – nghĩa... là không đối xứng 7 1.2 Phân tích hồi quy 1.2.1 Mô hình hồi quy tuyến tính hai biến Giả sử X và Y là hai biến của một tổng thể nào đó, mô hình hồi quy tuyến tính hai biến thể hiện mối quan hệ phụ thuộc giữa biến Y và biến X có dạng nhƣ sau: Y  1  2 X  u (1.1) Nhƣ vậy, mô hình hồi quy tuyến tính hai biến bao gồm các thành phần sau:  Các biến số: mô hình hồi quy gồm hai loại biến số: - Biến phụ thuộc:... khác nhau để chuẩn đoán p và q của mô hình sau khi tham số đã đƣợc xác định Một ý tƣởng là ngƣời ta có thể đánh đổi một hoặc nhiều độ trễ của AR(p) với một vài độ trễ của MA(q) bằng cách xem xét chi phí về mặt thông tin đối với số tham số đƣợc cực tiểu vẫn đảm bảo sự phù hợp của mô hình Tiêu chuẩn hiển nhiên để so sánh các mô hình là phƣơng sai của phần dƣ Kí hiệu phần dƣ của mô hình ARMA(p,q) là et (... số, thì Yt đƣợc gọi là bƣớc ngẫu nhiên có bụi (random walk with drift) Yt    Yt 1  ut Yt    ut hay (1  L)Yt    ut E (Yt )  Y0   t ; Var(Yt )  t 2 (1.17) 16 CHƢƠNG 2 MÔ HÌNH ARIMAVÀ ỨNG DỤNG 2.1 Mô hình ARIMA 2.1.1 Quá trình trung bình trƣợt (MA) Yt là quá trình trung bình trƣợt bậc q, nếu Yt có dạng: Yt    ut  1ut 1    qut q , t=1, 2, …,n (2.1) trong đó: utlà nhiễu trắng... đƣợc áp dụng cho các mô hình sau đây: Yt   Yt 1  ut (2.20) Yt  1   Yt 1  ut (2.21) Yt  1  2t   Yt 1  ut (2.22) Đối với các mô hình trên, giảthuyết cần kiểm định là: H 0 :   0; H1 :   0 (Chuỗi không dừng – hay nghiệm đơn vị) Dickey và Fuller đã chứng tỏ rằng phân bố giới hạn và các giá trị tới   hạn của thống kê (   )n   n có thể tìm đƣợc với giả thiết u t  IID và ngay... của phần dƣ tƣơng ứng:   p ,q 1 n    et ( p, q ) n t 1 (2.26) Nếu dựa vào phƣơng sai phần dƣ để xem xét thì hiển nhiên mô hình có nhiều tham số hơn càng phù hợp vì mỗi một tham số đƣa thêm sẽ làm cho mô hình mềm dẻo hơn trong việc sấp xỉ với số liệu quan sát Tuy nhiên nếu sử dụng quá nhiều tham số để mô tả phần MA thì khả năng dự báo ngoài mẫu sẽ kém đi Chẳng hạn, có thể đƣa vào số tham số bằng... tham số bằng số quan sát, khi đó Các phần dƣ sẽ bằng không, ƣớc lƣợng của phƣơng sai bằng không Nhƣng mô hình nhƣ vậy sẽ không phù hợp vì mô hình hóa là việc mô tả đơn giản hóa thực tế, ta đã biểu diễn n điểm qua n điểm khác Mô hình có quá nhiều tham số sẽ không phù hợp với thực tế Trƣờng hợp khác, nếu mô hình có quá ít tham số, hiển nhiên sẽ là không phù hợp 27 Vì những điều nói trên nên tiêu chuẩn chỉ ... ta rút đƣợc quy luật trình đƣợc mô tả thông qua chuỗi số liệu Xuất phát từ thực tế ứng dụng lớn mô hình ARIMA, em chọn đề tài nghiên cứu về: “MÔ HÌNH ARIMA VÀ ỨNG DỤNG” làm đề tài khóa luận Mục... khái niệm kiến thức đƣợc sử dụng chƣơng sau - Chƣơng 2 .Mô hình ARIMA ứng dụng: Chƣơng trình bày lớp mô hình ARIMA thử nghiệm ứng dụng mô hình để dự báo số VNINDEX CHƢƠNG KIẾN THỨC CHUẨN BỊ 1.1... dạng mô hình – xác định tham số p, d, q 24 2.1.7.2 Ƣớc lƣợng mô hình 30 2.1.7.3 Kiểm định tính thích hợp mô hình 32 2.1.7.4 Dự báo sai số dự báo 35 2.2 Ứng dụng mô hình ARIMA

Ngày đăng: 16/10/2015, 16:11

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan