MỘT SỐ PHƯƠNG PHÁP KHAI PHÁ DỮ LIỆU QUAN HỆ TRONG TÀI CHÍNH VÀ CHỨNG KHOÁN ( ARIMA )

27 249 0
MỘT SỐ PHƯƠNG PHÁP KHAI PHÁ DỮ LIỆU QUAN HỆ TRONG TÀI CHÍNH VÀ CHỨNG KHOÁN ( ARIMA )

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

MỞ ĐẦU Bài toán dự báo tài chính ngày càng được nhiều người quan tâm trong bối cảnh phát triển kinh tế xã hội. Đầu tư vào thị trường chứng khoán đòi hỏi nhiều kinh nghiệm và hiểu biết của các nhà đầu tư. Các kĩ thuật khai phá dữ liệu được áp dụng nhằm dự báo sự lên xuống của thị trường là một gợi ý giúp các nhà đầu tư có thể ra quyết định giao dịch. Mô hình ARIMA được xây dựng với chức năng nhận dạng mô hình, ước lượng các tham số và đưa ra kết quả dự báo dựa trên các tham số ước lượng đã được lựa chọn một cách tối ưu. Khóa luận nghiên cứu, thi hành mô hình ARIMA (từ các nghiên cứu của BoxJenkins) và ứng dụng vào bài toán khai phá dữ liệu chuỗi thời gian trong dự báo tài chính, chứng khoán. Khóa luận đã thực nghiệm trên dữ liệu vnIndex và đã thu được kết quả bước đầu. Với nội dung trình bày những lý thuyết cơ bản về mô hình ARIMA cho dữ liệu thời gian thực (time series) và cách áp dụng vào bài toán thực tế dự báo sựlên xuống của thị trường chứng khoán. Khóa luận được tổ chức theo cấu trúc như sau :

MỘT SỐ PHƯƠNG PHÁP KHAI PHÁ DỮ LIỆU QUAN HỆ TRONG TÀI CHÍNH VÀ CHỨNG KHOÁN ( ARIMA ) MỞ ĐẦU Bài toán dự báo tài ngày nhiều người quan tâm bối cảnh phát triển kinh tế xã hội Đầu tư vào thị trường chứng khoán đòi hỏi nhiều kinh nghiệm hiểu biết nhà đầu tư Các kĩ thuật khai phá liệu áp dụng nhằm dự báo lên xuống thị trường gợi ý giúp nhà đầu tư định giao dịch Mô hình ARIMA xây dựng với chức nhận dạng mô hình, ước lượng tham số đưa kết dự báo dựa tham số ước lượng lựa chọn cách tối ưu Khóa luận nghiên cứu, thi hành mô hình ARIMA (từ nghiên cứu BoxJenkins) ứng dụng vào toán khai phá liệu chuỗi thời gian dự báo tài chính, chứng khoán Khóa luận thực nghiệm liệu vnIndex thu kết bước đầu Với nội dung trình bày lý thuyết mô hình ARIMA cho liệu thời gian thực (time series) cách áp dụng vào toán thực tế - dự báo sựlên xuống thị trường chứng khoán Khóa luận tổ chức theo cấu trúc sau : Chương 1: GIỚI THIỆU CHUNG Giới thiệu sơ lược khai phá liệu nói chung toán dự báo quan tâm khai phá liệu Bài toán dự báo áp dụng khia cạnh sử dụng mô hình ARIMA cho chuỗi thời gian thực Chương 2: MÔ HÌNH ARIMA VÀ PHẦN MỀM EVIEW Trình bày số nội sung sở lý thuyết mô hình ARIMA, công cụ áp dụng vào mô hình mà khóa luận đề cập : Hàm tự tương quan ACF, hàm tự tương quan riêng phần PACF…Các bước phát triển mô hình : xác định mô hình, ước lượng tham sổ, kiểm định độ xác dự báo Mô hình ARIMA tình thử sai : kiểm định không thỏa mãn, phải xác định lại mô hình Tiếp đến giới thiệu qua phần mềm Eviews 5.1 cho trình thi hành Chương ÁP DỤNG MÔ HÌNH ARIMA VÀO BÀI TOÁN TÀI CHÍNH, CHỨNG KHOÁN Trình bày thực nghiệm mô hình ARIMA cho liệu tài chính, chứng khoán Các bước trình thi hành chương trình với phần mềm Eviews 5.1, đưa kết đánh giá với thực tế Phần Kết luận tổng kết két khóa luận phương hướng nghiên cứu MỤC LỤC MỞ ĐẦU CHƯƠNG : GIỚI THIỆU CHUNG 1.1 Bài toán dự báo 1.2 Dữ liệu chuỗi thời gian 1.2.1 Khái niệm chuối thời gian thực 10 1.2.2 Thành phần xu hướng dài hạn 10 1.2.3 Thành phần mùa 11 1.2.4 Thành phần chu kỳ 11 1.2.5 Thành phần bất thường 12 CHƯƠNG 2: MÔ HÌNH ARIMA VÀ PHẦN MỀM EVIEWS 13 2.1 Mô hình ARIMA 13 2.1.1 Hàm tự tương quan ACF 13 2.1.2 Hàm tự tương quan phần PACF 14 2.1.3 Mô hình AR(p) 17 2.1.4 Mô hình MA(q) 17 2.1.5 Sai phân I(d) 18 2.1.6 Mô hình ARIMA 18 2.1.7.Các bước phát triển mô hình ARIMA 22 2.2 Phần mềm ứng dụng Eviews 22 2.2.1 Giới thiệu Eviews 22 2.2.2 Áp dụng Eviews thi hành bước mô hình ARIMA 27 Tóm tắt chương 29 Chương ÁP DỤNG MÔ HÌNH ARIMA VÀO BÀI TOÁN TÀI CHÍNH, CHỨNG KHOÁN 30 3.1 Mô hình ARIMA cho dự báo tài chính, chứng khoán ……………………………………… 30 3.1.1 Dữ liệu tài 30 3.1.2 Mô hình ARIMA cho toán dự báo tài 30 Thiết kế mô hình ARIMA cho liệu 31 3.2 Áp dụng ………………………………………………………………………………………33 3.2.1 Môi trường thực nghiêm 33 3.2.2.Dữ liệu 33 3.2.3.Kiểm tra tính dừng chuỗi chứng khoán AAM 34 3.2.4.Thực dự báo 38 KẾT LUẬN 41 Chương GIỚI THIỆU CHUNG 1.1: Bài toán dự báo Sự phát triển công nghệ thông tin việc ứng dụng công nghệ thông tin nhiều lĩnh vực đời sống, kinh tế xã hội nhiều năm qua đồng nghĩa với lượng liệu quan thu thập lưu trữ ngày tích lũy nhiều lên Họ lưu trữ liệu cho ẩn chứa giá trị định Tuy nhiên, theo thống kê có lượng nhỏ liệu (khoảng từ 5% đến 10% ) phân tích, số lại họ phải làm làm với chúng họ tiếp tục thu thập tốn với ý nghĩ lo sợ có quan trọng bị bỏ qua sau có lúc cần đến Mặt khác, môi trường cạnh tranh, người ta ngày cần có nhiều thông tin với tốc độ nhanh để trợgiúp việc định ngày có nhiều câu hỏi mang tính chất định tính cần phải trả lời dựa khối lượng liệu khổng lồ có Với lý vậy, phương pháp quản trị khai thác sở liệu truyền thống ngày không đáp ứng thực tế làm phát triển khuynh hướng kỹ thuật kỹ thuật phát tri thức khai phá liệu (KDD – Knowledge Discovery and Data Mining) Kỹ thuật phát tri thức khai phá liệu nghiên cứu, ứng dụng nhiều lĩnh vực khác nước giới, Việt Nam kỹ thuật tương đối mẻ nhiên nghiên cứu dần đưa vào ứng dụng Từ thủa xa xưa, nhà tiên tri giữ vị trí quan trọng cộng đồng Khi văn minh nhân loại phát triển làm gia tăng mối quan hệ phức tạp giai đoạn sống, người có nhu cầu quan tâm đến tương lai họ Như trình bày [2, 3], kỹ thuật dự báo hình thành từ kỉ thứ 19, nhiên dự báo có ảnh hưởng mạnh mẽ công nghệ thông tin phát triển chất mô phương pháp dự báo cần thiết hỗ trợ máy tính Đến năm 1950, lý thuyết dự báo với phương pháp luận xây dựng phát triển có hệ thống Dự báo nhu cầu thiếu cho hoạt động người bối cảnh bùng nổ thông tin Dự báo cung cấp sở cần thiết cho hoạch định, nói khoa học dự báo dự định tương lai người vạch thuyết phục đáng kể Trong công tác phân tích dự báo, vấn đề quan trọng hàng đầu cần đặt việc năm bắt tối đa thông tin lĩnh vực dự báo Thông tin hiểu cách cụthể gồm : (1) số liệu khứ lĩnh vực dự báo, (2) diễn biến tình hình trạng động thái phát triển lĩnh vực dự báo (3) đánh giá cách đầy đủ nhân tố ảnh hưởng định lượng lẫn định tính Căn vào nội dung phương pháp mục đích dự báo, người ta chia dự báo thành hai loại: Phương pháp định tính phương pháp định lượng Phương pháp định tính thường phụ thuộc nhiều vào kinh nghiệm hay nhiều chuyên gia lĩnh vực liên quan Phương pháp thường áp dụng, kết dự báo chuyên gian lĩnh vực liên quan nhận xét, đánh giá đưa kết luận cuối Phương pháp định lượng sử dụng liệu khứ theo thời gian, dựa liệu lịch sử để phát chiều hướng vận động đối tượng phù hợp với mô hình toán học đồng thời sử dụng mô hình làm mô hình ước lượng Tiếp cận định lượng dựa giả định giá trị tương lai biến số dự báo phụ thuộc vào xu vận động đối tượng khứ Phương pháp dự báo theo chuỗi thời gian phương pháp định lượng Phương pháp chuỗi thời gian dựa việc phân tích chuỗi quan sát biến theo biến số độc lập thời gian Giả định chủ yếu biến số dự báo giữ nguyên chiều hướng phát triển xảy khứ Khóa luận tập trung nghiên cứu mô hình ARIMA để thực phân tích liệu chứng khoán hướng tới việc dự báo chứng khoán Mô hình ARIMA (AutoRegressive Integrate Moving Average) Box-Jenkins đề nghị năm 1976 [6, 11, 13], dựa mô hình tự hồi quy AR mô hình trung bình động MA ARIMA mô hình dự báo định lượng theo thời gian, giá trị tương lai biến số dự báo phụ thuộc vào xu vận động đối tượng khứ Mô hình ARIMA phân tích tính tương quan liệu quan sát để đưa mô hình dự báo thông qua giai đoạn nhận dạng mô hình, ước lượng tham số từ liệu quan sát kiểm tra tham số ước lượng để tìm mô hình thích hợp Mô hình kết trình gồm tham số thể mức độ tương quan liệu, chọn để dự báo giá trị tương lai Giới hạn độ tin cậy dự báo tính dựa phương sai sai số dự báo 1.2 Dữ liệu chuỗi thời gian Trong toán dự báo nói chung toán dự báo tài chứng khoán nói riêng, liệu thường biểu diễn dạng chuỗi thời gian Trong dạng liệu phân tích liệu chuỗi thời gian thuộc tốp đầu tính phổ biến Các bảng thống kê thăm dò kiểu liệu phân tích năm 2005-2008 1.2.1 Khái niệm chuối thời gian thực Theo [13, 16], liệu thời gian thực hay chuỗi thời gian chuỗi giá trị đại lượng ghi nhận thời gian Ví dụ : Số lượng hàng hóa bán 12 tháng năm 2009 công ty Các giá trị chuỗi thời gian đại lượng X kí hiệu X1, X2, X3,…, Xt ,… , Xn với X giá trị X thời điểm t Các thành phần liệu chuỗi thời gian thực Các nhà thống kê thường chia chuỗi theo thời gian thành thành phần: ¾ Thành phần xu hướng dài hạn (long –term trend component) ¾ Thành phần mùa (seasional component) ¾ Thành phần chu kỳ (cyclical component) ¾ Thành phần bất thường (irregular component) 1.2.2 Thành phần xu hướng dài hạn Thành phần dùng để xu hướng tăng hay giảm đại lượng X thời gian dài Về mặt đồ thị thành phần biểu diễn đường thẳng hay đường cong trơn Hình 1a Xu hướng tăng theo thời gian [16] 1.2.3 Thành phần mùa Thành phần dùng để xu hướng tăng hay giảm đại lượng X tính theo mùa năm (có thể tính theo tháng năm) Ví dụ : Lượng tiêu thụ chất đốt tăng vào mùa đông giảm vào mùa hè, ngược lại, lượng tiêu thụ xăng tăng vào mùa hè giảm vào mùa đông Lượng tiêu thụ đồ dùng học tập tăng vào mùa khai trường Hình Thành phần mùa [1] 1.2.4 Thành phần chu kỳ Thành phần thay đổi đại lượng X theo chu kỳ Thành phần khác thành phần mùa chỗ chu kỳ đại lượng X kéo dài năm Để đánh giá thành phần giá trị chuỗi thời gian quan sát hàng năm 1.2.5 Thành phần bất thường Thành phần dùng để thay đổi bất thường giá trị chuỗi thời gian Sự thay đổi dự đoán số liệu kinh nghiệm khứ, mặt chất thành phần tính chu kỳ CHƯƠNG MÔ HÌNH ARIMA VÀ PHẦN MỀM EVIEWS 2.1 Mô hình ARIMA 2.1.1 Hàm tự tương quan ACF Hàm tự tương quan đo lường phụ thuộc tuyến tính cặp quan sát y(t) y(t+k), ứng với thời đoạn k = 1, 2, …(k gọi độ trễ) Với độ trễ k, hàm tự tương quan độ trễ k xác định qua độ lệch biến ngẫu nhiên Yt Yt+k so với giá trị trung bình, chuẩn hóa qua phương sai Dưới đây, giả thiết biến ngẫu nhiên chuỗi dừng thay đổi quanh giá trị trung bình ߤ với phương sai số ߜ Hàm tự tương quan độtrễ khác có giá trị khác Trong thực tế, ta ước lượng hàm tự tương quan độ trễ thứ k qua phép biến đổi trung bình tất cặp quan sát, phân biệt độ trễ k, với giá trị trung bình mẫu µ , chuẩn hóa phương sai δ Chẳng hạn, cho chuỗi N điểm, giá trị rk hàm tự tương quan độ trễ thứ k tính sau : rk = với µ = N N ∑ (y N −K t =1 ∑ (y ) N t =1 t t − µ )( y t + k _ µ ) σ2 ; δ2 = N ∑ (y N t =1 t − µ) Yt: chuỗi thời gian dừng thời điểm t yt+k : chuỗi thời gian dừng thời điểm t +k µ ^ : giá trị trung bình chuỗi dừng r k : giá trị tương quan y k y t + k độ trễ k rk = tượng tự tương quan Về mặt lý thuyết, chuỗi dừng tất rk = hay vài rk khác không Do xem xét hàm tự tương quan mẫu, sai số mẫu xuất vậy, tượng tự tương quan rk = theo ý nghĩa thống kê Khi hàm tự tương quan ACF giảm đột ngột, có nghĩa r k lớn độ trễ 1, có ý nghĩa thống kê (|t| >2) Những rk xem “đỉnh” ta nói hàm tự tương quan ACF giảm đột ngột sau độ trễ k “đỉnh” độ trễ k lớn k Hầu hết hàm tự tương quan ACF giảm đột ngột sau độ trễ 1, Nếu hàm tự tương quan ACF chuỗi thời gian không dừng không giảm đột ngột mà trái lại giảm nhanh : đỉnh, ta gọi chiều hướng “tắt dần” Xem minh họa hình 4, hàm tự tương quan ACF “tắt dần” vài dạng sau : Dạng phân phối mẫu (hình 4a hình 4b) Dạng sóng sin (hình 4c) Kết hợp hai dạng Sự khác tượng “tắt dần” nhanh “tắt dần” chậm phân biệt tùy tiện 2.1.2 Hàm tự tương quan phần PACF Song song với việc xác định hàm tự tương quan cặp y(t) y(t+k), ta xác định hàm tự tương quan phần có hiệu lực việc can thiệp đến quan sát y(t+1), , y(t+k-1) Hàm tự tương quan phần độ trễ k Ckk ước lượng hệ số liên hệ y(t) mối kết hợp tuyến tính bên Sự kết hợp tính dựa tầm ảnh hưởng y(t) giá trị trung gian y(t+k) y(t+k) = Ck1y(t+k-1) + Ck2y(t+k-2) + + Ckk-1y(t + 1) + Ckky(t) + e(t) (1.3) Giải phương trình hồi quy dựa bình phương tối thiểu hệ số hồi quy Ckjphải tính độ trễ k, với j chạy từ đến k Giải pháp tốn Durbin [14] phát triển dùng để xấp xỉ đệ quy hệ số hồi quy cho mô hình ARIMA chuỗi dừng, sử dụng giá trị hàm tự tương quan độ trễ k rk hệ số hồi quy độ trễ trước Dưới phương pháp Durbin sử dụng cho độ trễ Độ trễ : Khởi tạo, giá trị hàm tự tương quan phần độ trễ có giá trị với hàm tự tương quan độ trễ trung gian quan sát kết tiếp : C11 = r Độ trễ : Hai giá trị C 22 C 21 tính dựa vào hàm tự tương quan r r , với hàm tự tương quan phần trước đó: r 22 − c11r1 − c11r1 Độ trễ : Tương tự, ba giá trị C 33 , C 32 , C 31 tính dựa vào hàm tự tương quan trước r ,r ,r với hệ số tính độ trễ thứ : C 22 C 21 C 22 = r − c 21r − c 22r1 − c 22r − c 21r1 C 32 = C 21 -C 33 C 22 C 31 = C 22 - C 33 C 21 Tổng quan, hàm tự tương quan phần tính theo Durbin : C 33 = rk − ∑ ( C k −1, j )( rk − j ) − ∑ ( C k −1, j ) r j (1.4) Trong : rk : Hàm tự tương quan độ trễ k v : Phương sai C kj : Hàm tự tương quan phần cho độ trễ k, loại bỏ ảnh hưởng độ trễ can thiệp C kj = C k −1, j - ( C kk ) C ( k − 1, k − j ) k=2,……….,j=1,2,………,k-1 Ckk = ( )( ) C 22 = r2 − r1 − r1 C 11 = r Khi độ trễ tăng, số hệ số tăng theo Phương pháp Durbin cho phép việc tính đệ quy dựa vào việc sử dụng kết trước Tóm lại, hàm tự tương quan ACF hàm tự tương quan phần PACF chuỗi thời gian có đặc tính khác Hàm tự tương quan ACF đo mức độ phụthuộc tuyến tính cặp quan sát Hàm tự tương quan phần PACF đo mức độ phụ thuộc tuyến tính phần ARIMA khai thác điểm khác biệt đểxác định cấu trúc mô hình cho chuỗi thời gian Xu hướng vận động hàm tự tương quan phần PACF giảm đột ngột (thường sau độ trễ 2) hay giảm Cũng hàm tự tương quan ACF, xu hướng giảm hàm tự tương quan phần PACF có dạng phân phối mũ, dạng sóng hình sin kết hợp dạng (hình 1-4) Hình : Ví dụ chiều hướng giảm khác [2] a) Dao động hàm mũ tắt dần (Damped Exponential) b) Dao động tắt dần theo quy luật số mũ (Damped exponential oscillation) c) Dao động sóng tắt dần theo quy luật hình sin (Damped sine wave) 2.1.3 Mô hình AR(p) Theo [6, 11, 16], ý tưởng mô hình AR(p) hồi quy số liệu khứ chu kì trước Y(t) = a0 + a1y(t-1) + a2y(t-2) +…apy(t-p) + e(t) (1.5) Trong : y(t) : quan sát dừng y(t-1), y(t-2), : quan sát dừng khứ (thường sử dụng không biến này) a0, a1, a2, …: tham số phân tích hồi quy et : sai số dự báo ngẫu nhiên giai đoạn Giá trị trung bình mong đợi Y(t) hàm tuyến tính quan sát dừng khứ y(t-1) y(t-2), … Nói cách khác sử dụng phân tích hồi quy y(t) theo giá trị chuỗi thời gian dừng có độ trễ, mô hình AR (yếu tố xu tách khỏi yếu tố thời gian, mô hình hóa yếu tố lại – sai số) Số quan sát dừng khứ sử dụng mô hình hàm tự tương quan bậc p mô hình AR Nếu ta sử dụng hai quan sát dừng khứ, ta có mô hình tương quan bậc hai AR(2) Điều kiện dừng tổng tham số phân tích hồi quy nhỏ : a1 + a2 + … + ap < Mô hình AR(1) : y(t) = a0 + a1y(t-1) + e(t) Mô hình AR(2) : y(t) = a0 + a1y(t-1) + a2y(t-2) +e(t) 2.1.4 Mô hình MA(q) Quan sát dừng y(t) hàm tuyến tính phụ thuộc biến sai số dự báo khứ Mô hình bình quân di động trung bình trọng số sai số y(t) = b0 + e(t) +b1e(t-1) + b2e(t-2) + +bqe(t-q) (1.6) Trong : y(t) : quan sát dừng e(t) : sai số dự báo ngẫu nhiên, giá trị giá trị trung bình 2.1.7 Các bước phát triển mô hình ARIMA Theo [3, 6], phương pháp Box – Jenkins bao gồm bước chung: • Xác định mô hình • Ước lượng tham số • Kiểm định độ xác • Dự báo • Xác định mô hình : Mô hình ARIMA áp dụng chuỗi dừng Mô hình trình bày theo dạng AR, MA hay ARMA Phương pháp xác định mô hình thường thực qua nghiên cứu chiều hướng biến đổi hàm tự tương quan ACF hay hàm tự tương quan phần PACF o Chuỗi ARIMA không dừng : cần phải chuyển đồi thành chuỗi dừng trước tính ước lượng tham số bình phương tối thiểu Việc chuyển đổi thực cách tính sai phân giá trị quan sát dựa vào giả định phần khác chuỗi thời gian xem xét tương tự, ngoại trừ khác biệt giá trị trung bình Nếu việc chuyển đổi không thành công, áp dụng tiếp kiểu chuyển đổi khác (chuyển đồi logarithm chẳng hạn) • Ước lượng tham số : tính ước lượng khởi đầu cho tham số a0, a1, …, ap, b1, …, bq mô hình dự định Sau xây dựng ước lượng sau trình lặp • Kiểm định độ xác : Sau tham số mô hình tổng quát xây dựng, ta kiểm tra mức độ xác phù hợp mô hình với liệu Chúng ta kiểm định phần dư (Yt –Y^t ) có ý nghĩa mối quan hệ tham số Nếu kiểm định không thỏa mãn, mô hình nhận dạng lại bước thực lại • Dự báo : Khi mô hình thích hợp với liệu tìm được, ta thực dự báo thời điểm t Do đó, mô hình ARMA(p,q) : y(t+1) = a0 + a1y(t) + … + apy(t – p + 1) + e(t+1) + b1e(t) + … + bqe( t – q + 1) (X) 2.2 Phần mềm ứng dụng Eviews 2.2.1 Giới thiệu Eviews Eviews: gói phần mềm thống kê cho Windows, sử dụng vào phân tích kinh tế hướng đối tượng chuỗi thời gian Nó Quantitative Micro Software (QMS) phá triển Bản 1.0 đời vào tháng năm 1994 [] Phùng Thanh Bình [5] giới thiệu tương đổi cụ thể Eviews tình sử dụng Eviews Eviews cung cấp công cụ phân tích liệu phức tạp, hồi quy dự báo chạy Windows Với Eviews, nhanh chóng xây dựng mối quan hệ kinh tế lượng từ liệu có sẵn sử dụng mối quan hệ để dự báo giá trị tương lai Eviews hữu ích tất loại nghiên cứu đánh giá phân tích liệu khoa học, phân tích tài chính, mô dự báo vĩ mô, dự báo doanh số, phân tích chi phí Đặc biết, Eviews phần mềm mạnh cho phân tích liệu thời gian Eview đưa nhiều cách nhập liệu thông dụng dễ sử dụng nhập tay, từ file có dạng excel hay text, dễ dàng mở rộng file liệu có sẵn Eviews trình bày biểu đồ, kết ấn tượng in trực tiếp chuyển quan loại định dạng văn khác Eviews giúp người sử dụng dễ dàng ước lượng kiểm định mô hình kinh tế lượng Ngoài ra, Eviews giúp người nghiên cứu xây dựng file chương trình cho dự án nghiên cứu Khi khởi động chương trình có dạng : Hình Eviews Users Guide Tạo tập tin Eviews Command Mai Work Status Có nhiều cách tạo tập tin • Eviews tạo tập tin để ta nhập liệu vào cách thủ công từ bàn phím copy paste File/ New Workfile…từ thực đơn để mở hộp thoại Workfile Create Ở góc bên trái mô tả cấu trúc liệu Ta chọn Dated-Regular Frequency, Unstructured, Balanced Panel Với liệu thời gian ta chọn Dated-Regular Frequency, liệu đơn giản ta chọn Balanced Panel, trường hợp khác chọn Unstructured Hình Lựa chọn cấu trúc trình tạo Workfile Nếu liệu năm, ô Frequency ta chọn Annual; ô Start date Ende date ta nhập năm bắt đầu năm kết thúc chuỗi liệu Nếu liệu quý, ô Frequency ta chọn Quarrterly… • Mở đọc liệu từ nguồn bên (không thuộc định dạng Eviews) Text, Excel, Stata File/open/Foreign Data as Workfile,…để đến hộp thoại Open, chọn Files of type Hình Mở file có sẵn với Eviews Sau tạo tập tin Eviews, ta lưu lại định dạng Eviews cách họn File/Save As… hay File/Save Trình bày liệu • Trình bày liệu chuỗi Để xem nội dung biến đó, ví dụ giadongcua tập tin Ta kích đúp vào Hình Miêu tả chuỗi liệu • Vẽ đồ thị Có hai cách biểu đồ thị dạng Line biến Thứ nhất, từ chuỗi(lấy chuỗi giadongcua làm ví dụ) ta chọn View/Graph/Line Thứ 2, từ cửa sổWorkfile Main menu ta chọn Quick/Graph/Line Graph,… nhập tên biến giadongcua Hình 10: Đồ thị chuỗi GIADONGCUA • Tạo biến Eviews hỗ trợ chuyển đổi để tạo biến cách click Genr gõ hàm chuyển đổi Thông thường : loggiadongcua = log(giadongcua) • Biến trễ, tới, sai phân mùa vụ Biến trễ , tới giai đoạn (xt-1) : x(-1), (xt+1) : x(+1) Biến trễ k giai đoạn (xt-k) : x(-k), (xt+k) : x(+k) Sai phân bậc (d(x) = xt – xt-1) Sai phân bâck k (d(x,k) = xt – xt-k) • Biểu đồ tương quan View/Correlogram… Hình 11 Biểu đồ hàm tự tương quan, tự tương quan phân • Hàm phép toán Eviews - Các phép toán số học : +,-,*,/ - Các phép toán chuỗi Eviews cho phép tính toán tạo chuỗi từ nhiều chuỗi có sẵn toán tử thông thường Ví dụ : 2*y +3, x/y +z… -Các hàm chuỗi : Hầu hết hàm Eviews bắt đầu ký hiệu @, ví dụ @mean(y) : Giá trị trung bình chuỗi y @abs(x) : Hàm giá trị tuyệt đối @sqrt(x) : Hàm bậc hai… 2.2.2 Áp dụng Eviews thi hành bước mô hình ARIMA 2.2.2.1 Xác định mô hình • Đưa liệu vào : Do liệu trình dự báo sử dụng mô hình ARIMA đủ lớn, liệu đầu vào đề xuất : Mở đọc liệu từ nguồn bên (không thuộc định dạng Eviews) Text, Excel, Stata File/open/Foreign Data as Workfile,…để đến hộp thoại Open, chọn Files of type (xem thêm 2.2.1) • Kiểm tra tính dừng chuỗi liệu : kích đúp vào biến “GiaDongCua”, View/Graph/line : đưa ý tưởng chuỗi thời gian dừng hay không View/Correlogram : Xác định thành phần p,d,q mô hình 2.2.2.2 Ước lượng mô hình, kiểm tra mô hình Từ biểu đồ tương quan, xác định thành phần p,d,q cho mô hình Tiếp theo ta xây dựng mô hình theo bước : • Chọn Quick/estimate Equation gõ vào mục Equation Specification mô hình xác định 2.2.2.1 Type : ’giadongcua c ar(1) ma(2)’, ‘giadongcua c ar(1)’, ‘giadongcua c ma(2)’ (Tùy thuộc vào mô hình xác định) Hình12 Ước lượng mô hình Hình 13 Kết trình ước lượng • Chọn View/Residual tests/correlogram-Q-Statistic : Dùng để xác định tính nhiễu trắng mô hình Mô hình gọi nhiễu trắng(white noise) có trung bình phương sai không đổi theo thời gian hay hàm tự tương quan tự tương quan riêng phần dao động quanh vị trí trung bình chuỗi [17] Khi một mô hình xác định nhiễu trắng, ta dừng mô hình mà không cần đến mô hình • Các tiêu chuẩn để đánh giá mô hình tốt [18] : o BIC nhỏ (Schwarz criterion xác định : n.Log(SEE) + K.Log(n)) o SEE nhỏ o R2 lớn o Q-statistics đồ thị tương quan phần dư nhiễu trắng Sau thử với mô hình khác so sánh kết theo tiêu chuẩn đánh giá 2.2.2.3 Dự báo Tại cửa sổ Equation phương trình, bấm nút forecast Hình 14 Chọn yêu cầu thích hợp cho dự báo Tóm tắt chương Chương nhằm giới thiệu mô hình ARIMA: (1) hàm tự tương quan ACF, (2) hàm tự tương quan phần PACF, (3) mô hình thành phần AR(p), (4) mô hình MA(q), sai phân I(d), bước trình xây dựng mô hình ARIMA Giới thiệu sơ phần mềm ứng dụng Eviews 5.1 phục vụ cho toán dự báo mô hình ARIMA CHƯƠNG ÁP DỤNG MÔ HÌNH ARIMA VÀO BÀI TOÁN TÀI CHÍNH, CHỨNG KHOÁN 3.1 Mô hình ARIMA cho dự báo tài chính, chứng khoán 3.1.1 Dữ liệu tài Dữ liệu sử dụng liệu chuỗi thời gian Đặc điểm để phân biệt liệu có phải thời gian thực hay không tồn cột thời gian đính kèm đối tượng quan sát Nói cách khác, liệu thời gian thực chuỗi giá trị quan sát biến Y : Y = {y1, y2, y3,…, yt-1, yt , yt+1, …, yn} với yt giá trị biến Y thời điểm t Mục đích việc phân tích chuỗi thời gian thực thu mô hình dựa giá trị khứ biến quan sát y1, y2, y3,…, yt-1, yt cho phép ta dự đoán giá trị biến Y tương lai, tức dự đoán giá trị yt+1, yt+2,…yn Trong toán chúng ta, liệu chứng khoán biết tới chuỗi thời gian đa dạng có nhiều thuộc tính ghi thời điểm Với liệu xét, thuộc tính : Open, High, Low, Close, Volume Open : Giá cổ phiếu thời điểm mở cửa ngày High : Giá cổ phiếu cao ngày Low : Giá cổ phiếu thấp ngày Close : Giá cổ phiếu niêm yết thời điểm đóng sàn giao dịch Volume : Khối lượng giao dịch cổ phiếu (bán, mua) ngày 3.1.2 Mô hình ARIMA cho toán dự báo tài Dựa vào trình tự phương pháp luận (phần 1.7) cấu trúc hoạt động mô hình ARIMA chương Để áp dụng mô hình ARIMA vào toán dự báo tài chính, ta xây dựng mô hình dự báo Mô hình gồm trình : • Xác định mô hình : Với đầu vào tập liệu chuỗi thời gian tài giúp cho việc xác định ban đầu thành phần mô hình p, d, q, S • Ước lượng, kiểm tra : Mô hình ARIMA phương pháp lặp, sau xác định thành phần, mô hình ước lượng tham số, sau kiểm tra độ xác mô hình : Nếu hợp lý, tiếp bước sau, không hợp lý, quay trở lại bước xác định • Dự báo : Sau xác định tham số, mô hình đưa dự báo cho ngày 3.1.3 Thiết kế mô hình ARIMA cho liệu Việc thiết kế thành công mô hình ARIMA phụ thuộc vào hiểu biết rõ ràng vấn đề, mô hình, dựa vào kinh nghiệm chuyên gia dự báo… Trong trình tìm hiểu, khóa luận đưa bước để xây dựng mô sau : Chọn tham biến Chuẩn bị liệu • Xác định tính dừng chuỗi liệu • Xác định yếu tố mùa vụ • Xác định yếu tố xu Xác định thành phần p, q mô hình ARMA Ước lượng tham số chẩn đoán mô hình phù hợp Dự báo ngắn hạn 3.1.3.1 Chọn tham biến Hướng tiếp cận phổ biến liệu tài tập trung xây dựng mô hình dự báo giá cổ phiếu đóng cửa sau kết thúc phiên giao dịch (Close) 3.1.3.2 Chuẩn bị liệu • Xác định tính dừng chuỗi liệu : Dựa vào đồ thị chuỗi đồ thị hàm tự tương quan • Nếu đồ thị chuỗi Y = f(t) cách trực quan chuỗi coi dừng đồ thị chuỗi cho trung bình phương sai không đổi theo thời gian (chuỗi dao động quanh giá trị trung bình chuỗi) • Dựa vào đồ thị hàm tự tương quan ACF đồ thị cho ta chuỗi giảm mạnh tắt dần sau q độ trễ • Xác định yếu tố mùa vụ cho chuỗi liệu : Dựa vào đồ thị chuỗi liệu Y = f(t) (Xem phần chương 1.1) • Xác định yếu tố xu cho chuỗi liệu : Xem lại phần 2.1.2 (Trong giới hạn khóa luận) 3.1.3.3 Xác định thành phần p, q mô hình ARMA Sau loại bỏ thành phần : Xu thế, mùa vụ, tính dừng liệu trở thành dạng áp dụng mô hình ARMA cho trình dự báo Việc xác định thành phần p q • Chọn mô hình AR(p) đồ PACF có giá trị cao độ trễ 1, 2, …, p giảm nhiều sau p dạng hàm ACF giảm dần • Chọn mô hình MA(q) đồ thị ACF có giá trị cao độ trễ 1, 2, …, q giảm nhiều sau q dạng hàm PACF giảm dần 3.1.3.4 Dự báo ngắn hạn mô hình Dựa vào mô hình chọn tốt nhất, với liệu khứ tới thời điểm t, ta sử dụng để dự báo cho thời điểm t+1 3.2 Áp dụng Ứng dụng mô hình ARIMA vào toán dự báo chứng khoán của Công ty cổ phần Thủy sản Mekong(Mã CK : AAM) Sử dụng Phần mềm EVIEWS 5.1 để dự đoán (Ứng dụng mô hình ARIMA cho toán dự đoán chuỗi thời gian) Quy trình thực nghiệm tiến hành mô tả 2.2.2 3.2.1 Môi trường thực nghiêm Môi trường thực nghiệm Eview 5.1 chạy hệ điều hành Window XP SP2, máy tính tốc độ 2*2.0 GHz, nhớ 1GB RAM 3.2.2 Dữ liệu Chọn loại liệu dự báo: Dữ liệu lấy từ http://www.cophieu68.com/datametastock.php Trong ta chọn Cổ phiếu có mã MMA để dự đoán, sử dụng riêng Giá đóng cửa Dữ liệu đầu vào file.CSV or dat lấy từ website xuống Dữ liệu có dạng sau : MaCK Ngay Gia DongCua AAM 5/14/2010 33.4 AAM 5/13/2010 33.2 AAM 5/12/2010 33.2 AAM 5/11/2010 34.4 AAM 5/10/2010 34.9 AAM 5/7/2010 36.5 … Bảng Dữ liệu đầu vào Dữ liệu cho trình dự báo ngày 24/9/2009 đến ngày 14/5/2010 Ở khóa luận tập trung vào GiaDongCua, trình dự báo giúp ta xác định Giá đóng cửa ngày sau Hình 15 Chọn GIADONGCUA làm mục tiêu dự báo 3.2.3 Kiểm tra tính dừng chuỗi chứng khoán AAM Hình 16 Biểu đồ đóng cửa 3.2.4 Nhận dạng mô hình Xác định tham số p, d, q ARIMA Hình 17 xác định d = 0,1,2 ? Hình 18 Biểu đồ SAC SPAC chuỗi GIATHAMCHIEU Nhìn vào hình 3.7, ta thấy biểu đồ hàm tự tương quan ACF giảm dần cách từ từ Chuỗi chưa dừng, ta phải sai phân lần Kiểm tra đồ thị Correlogram chuỗi sai phân bậc Hình 19 Biểu đồ SPAC SAC ứng với d=1 Như sau lấy sai phân bậc chuỗi dừng: Æ d=1, ACF tắt nhanh sau độ trễ Æq=1, PAC giảm nhanh sau độ trễ:Æ p=1 3.2.5 Ước lượng kiểm định với mô hình ARIMA Xây dựng mô hình ARIMA(1,1,1) Chọn Quick/Estimate Equation, sau gõ"dgiathamchieu c ar(1) ma(1)", Hình 20 Ước lượng mô hình ARIMA(1,1,1) Click OK, kết : Hình 21 Kết mô hình ARIMA(1,1,1) Chọn “View/Residual tests/Correlogram-Q- Statistic” Hình 22 : Kiểm tra phần dư có nhiễu trắng Như vậy, sai số mô hình ARIMA(1,1,1) chuỗi dừng có phân phối chuẩn Sai số nhiễu trắng Ta có bảng xác định tiêu chuẩn đánh giá sau thử với vài mô hình khác : Mô hìnhARIMA BIC Adjusted R SEE ARIMA (1,0,0) 4.24 0.97 1.967 ARIMA (2,1,1) 4.26 0.004 1.96 ARIMA (1,1,1) 4.20 0.57 1.909 ARIMA (4,2,1) 4.26 0.44 1.957 Bảng : Tiêu chuẩn đánh giá mô hình ARIMA 3.2.6 Thực dự báo Tại cửa sổ Equation ấn nút Forecast Hình 23 Dự báo Tại Forecast sample : ta chỉnh ngày dự báo : 14/5/2010 – 20/5/2010 Kết : Hình 24 Kết bảng thống kê dự báo Æ Ta có kết dự báo ngày 14/5/2010 – 20/5/2010 Ngày Giá thực tế Giá dự báo Đánh giá 17/05/2010 33.5 32.94174 -0.55826 18/05/2010 33.2 32.89932 -0.30068 19/05/2010 32.5 32.86322 0.36322 20/05/2010 33.2 32.83250 -0.3675 Bảng Đánh giá dự báo Qua thực nghiệm dự báo ngày từ ngày 17/05 – 20/05/2010, nhận thấy kết đưa xác so với giá thực tế mã chứng khoán AAM Tuy số lượng ngày dự báo thử nghiệm chưa nhiều song nhận định mô hình ARIMA(1,1,1) phù hợp để dự báo mã CK AAM Tóm tắt chương Chương giới thiệu môi trường thực nghiệm phần mềm, liệu đầu vào giá chứng khoán công ty với mã AAM (chọn GiaDongCua làm biến dự báo) Khóa luận tiến hành bước trình thi hành dự báo twf liệu nêu ởchương Đánh giá sơ thành công mô hình chọn : Mô hình chọn dự báo xác KẾT LUẬN Qua thời gian nghiên cứu để thực khóa luận tốt nghiệp, em nắm quy trình xây dựng mô hình ARIMA cho liệu tài áp dụng mô hình vào toán thực tế - toán dự báo tài Những kết mà khóa luận đạt tổng kết sau : • Nghiên cứu số nội dung lý thuyết chuỗi thời gian, mô hình ARIMA, công cụ Eviews để áp dụng Eviews thi hành mô hình ARIMA dự báo tài chính, chứng khoán • Nắm quy trình dùng phần mềm Eviews thi hành mô hình ARIMA cho liệu thời gian thực (với bước bản) tính toán giá trị dự báo liệu tài chính, chứng khoán • Thực quy trình sử dụng phần mềm Eviews thi hành mô hình ARIMA cho liệu mã cổ phiếu mã CK AAM để dự báo ngắn hạn giá cổ phiếu Bên cạnh kết đạt được, có vấn đề mà thời điểm này, khóa luận chưa giải được: • Áp dụng với chuỗi liệu có tính xu • Thuật toán để ước lượng đánh giá nhiều hạn chế • Đây mô hình phân tích kĩ thuật, chưa thể dự báo cách sách, phụ thuộc vào biến – Thời gian, trình dự báo phụ thuộc vào nhiều yếu tố Những nội dung cần nghiên cứu phát triển để tiếp tục nội dung khóa luận: • Xây dựng mô hình ARIMA đa biến : số giá chứng khoán phụ thuộc vào nhiều biến khác • Giải yếu tố xu thể cho chuỗi liệu [...]... biện pháp khắc phục là tìm vài dạng hàm dự định khác nhau cho chuỗi thời gian dừng Sau đó, kiểm tra độ chính xác mô hình tốt nhất Mô hình ARIMA (1 , 1, 1) : y(t) – y(t- 1) = a0 + a1(y(t- 1) – y(t- 2) + e(t) + b1e(t 1)) Hoặc z(t) = a0 + a1z(t- 1) + e(t) + b1e(t- 1), Với z(t) = y(t) – y(t- 1) ở sai phân đầu tiên : d = 1 Tương tự ARIMA( 1,2, 1) : h(t) = a0 + a1z(t- 1) + e(t) + b1e(t- 1), Với h(t) = z(t) – z(t- 1) ở... hiện tại : y(t) = a0 + a1y(t- 1) + a2y(t- 2) + + apy(t-p) + e(t) + b1e(t- 1) +b2e(t- 2) + + bqe(t-q) (1 . 7) Trong đó : y(t) : quan sát dừng hiện tại y(t-p), và e(t-q) : quan sát dừng và sai số dự báo quá khứ a0, a1, a2, , b1, b2, : các hệ số phân tích hồi quy Ví dụ : ARMA(1, 2) là mô hình hỗn hợp của AR( 1) và MA( 2) Đối với mô hình hỗn hợp thì dạng (p,q) = (1 , 1) là phổ biến Tuy nhiên, giá trị p và q được... loggiadongcua = log(giadongcua) • Biến trễ, tới, sai phân và mùa vụ Biến trễ , tới một giai đoạn (xt- 1) : x(- 1), (xt+ 1) : x(+ 1) Biến trễ k giai đoạn (xt-k) : x(-k), (xt+k) : x(+k) Sai phân bậc một (d(x) = xt – xt- 1) Sai phân bâck k (d(x,k) = xt – xt-k) • Biểu đồ tương quan View/Correlogram… Hình 11 Biểu đồ hàm tự tương quan, tự tương quan từng phân • Hàm và các phép toán trong Eviews - Các phép toán số học :... tại và giá trị trước đó Phân tích sai phân nhằm làm cho ổn định giá trị trung bình của chuỗi dữ liệu, giúp cho việc chuyển đổi chuỗi thành một chuỗi dưng Sai phân lần 1 (I( 1)) : z(t) = y(t) – y(t- 1) Sai phân lần 2 (I( 2)) : h(t) = z(t) – z(t- 1) 2.1.6 Mô hình ARIMA Mô hình ARMA(p,q) : là mô hình hỗn hợp của AR và MA Hàm tuyến tính sẽ bao gồm những quan sát dừng quá khứ và những sai số dự báo quá khứ và. .. phần PACF, (3 ) mô hình thành phần AR(p), (4 ) mô hình MA(q), sai phân I(d), các bước trong quá trình xây dựng mô hình ARIMA Giới thiệu sơ bộ về phần mềm ứng dụng Eviews 5.1 phục vụ cho bài toán dự báo bằng mô hình ARIMA CHƯƠNG 3 ÁP DỤNG MÔ HÌNH ARIMA VÀO BÀI TOÁN TÀI CHÍNH, CHỨNG KHOÁN 3.1 Mô hình ARIMA cho dự báo tài chính, chứng khoán 3.1.1 Dữ liệu tài chính Dữ liệu chúng ta sử dụng là dữ liệu chuỗi... MA( 1) : y(t) = b0 + e(t) + b1e(t- 1) Mô hình MA( 2) : y(t) = b0 + e(t) + b1e(t- 1) + b2e(t- 2) 2.1.5 Sai phân I(d) Chuỗi dừng : Chuỗi thời gian được coi là dừng nếu như trung bình và phương sai của nó không đổi theo thời gian và giá trị của đồng phương sai giữa hai thời đoạn chỉ phụ thuộc vào khoảng cách và độ trễ về thời gian giữa hai thời đoạn này chứ không phụ thuộc vào thời điểm thực tế mà đồng phương. .. –Y^t ) và có ý nghĩa cũng như mối quan hệ các tham số Nếu bất cứ kiểm định nào không thỏa mãn, mô hình sẽ nhận dạng lại các bước trên được thực hiện lại • Dự báo : Khi mô hình thích hợp với dữ liệu đã tìm được, ta sẽ thực hiện dự báo tại thời điểm tiếp theo t Do đó, mô hình ARMA(p,q) : y(t+ 1) = a0 + a1y(t) + … + apy(t – p + 1) + e(t+ 1) + b1e(t) + … + bqe( t – q + 1) (X) 2.2 Phần mềm ứng dụng Eviews 2.2.1... dựng mối quan hệ kinh tế lượng từ dữ liệu có sẵn và sử dụng mối quan hệ này để dự báo các giá trị tương lai Eviews có thể hữu ích trong tất cả các loại nghiên cứu như đánh giá và phân tích dữ liệu khoa học, phân tích tài chính, mô phỏng và dự báo vĩ mô, dự báo doanh số, và phân tích chi phí Đặc biết, Eviews là một phần mềm rất mạnh cho phân tích dữ liệu thời gian Eview đưa ra nhiều cách nhập dữ liệu rất... = f(t) một cách trực quan nếu chuỗi được coi là dừng khi đồ thị của chuỗi cho trung bình hoặc phương sai không đổi theo thời gian (chuỗi dao động quanh giá trị trung bình của chuỗi) • Dựa vào đồ thị của hàm tự tương quan ACF nếu đồ thị cho ta một chuỗi giảm mạnh và tắt dần về 0 sau q độ trễ • Xác định yếu tố mùa vụ cho chuỗi dữ liệu : Dựa vào đồ thị của chuỗi dữ liệu Y = f(t) (Xem phần chương 1. 1) •... tổng kết như sau : • Nghiên cứu một số nội dung lý thuyết cơ bản về chuỗi thời gian, về mô hình ARIMA, về công cụ Eviews để có thể áp dụng được Eviews thi hành mô hình ARIMA trong dự báo tài chính, chứng khoán • Nắm được quy trình dùng phần mềm Eviews thi hành mô hình ARIMA cho dữ liệu thời gian thực (với 4 bước cơ bản) tính toán giá trị dự báo dữ liệu tài chính, chứng khoán • Thực hiện quy trình sử ... : Tiêu chuẩn đánh giá mô hình ARIMA 3.2.6 Thực dự báo Tại cửa sổ Equation ấn nút Forecast Hình 23 Dự báo Tại Forecast sample : ta chỉnh ngày dự báo : 14/5/2010 – 20/5/2010 Kết : Hình 24 Kết bảng

Ngày đăng: 19/04/2016, 21:49

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan