Một giải pháp để dự báo sự biến động của hệ thống các dữ liệu đa chiều phụ thuộc lẫn nhau theo chuỗi thời gian bằng mạng nơron FIR

7 7 1
Một giải pháp để dự báo sự biến động của hệ thống các dữ liệu đa chiều phụ thuộc lẫn nhau theo chuỗi thời gian bằng mạng nơron FIR

Đang tải... (xem toàn văn)

Thông tin tài liệu

trình này tuy đã có một số thành công trong những bài toán cụ thể, nhưng còn tồn tại hạn chế là chỉ khảo sát bài toán chuỗi thời gian bằng cách dùng các phương pháp dự báo trong mô hì[r]

(1)

MỘT GIẢI PHÁP ĐỂ DỰ BÁO SỰ BIẾN ĐỘNG CỦA HỆ THỐNG CÁC DỮ LIỆU ĐA CHIỀU PHỤ THUỘC LẪN NHAU THEO CHUỖI

THỜI GIAN BẰNG MẠNG NƠRON FIR

Hà Gia Sơn*

Tóm tắt: Bài viết nhằm xây dựng giải pháp để dự báo hệ thống liệu đa chiều phụ thuộc lẫn theo chuỗi thời gian mạng nơron FIR (FINITE IMPULSE RESPONSE – Mạng đáp ứng xung hữu hạn) Phần ứng dụng dựa vào liệu trang Web thị trường tài Forex Kết cho thấy, việc sử dụng giải pháp góp phần nâng cao hiệu dự báo

Từ khóa: Dự báo; Chuỗi thời gian; Dữ liệu đa chiều; Mạng nơron FIR

1 ĐẶT VẤN ĐỀ

Dự báo dự kiến, tiên đoán kiện, tượng, trạng thái hay định xảy tương lai Theo nghĩa hẹp hơn, nghiên cứu khoa học triển vọng tượng Ở nước ngồi, có nhiều cơng trình nghiên cứu vấn đề này, có hệ thống lý thuyết gồm nhiều phương pháp, qui trình nhiều mơ hình để dự báo tương lai tài liệu [11] Tài liệu phân tích thăm dị yếu tố chuỗi thời gian, mơ hình chuỗi thời gian Trong thời gian gần đây, nước, có nhiềuđề tài cấp, với mục đích cách tiếp cận khác dự báo cơng trình [1-4], [6-7]

Hiện tại, xuất nhiều mơ hình dự báo có hiệu cao, giới bắt đầu áp dụng công cụ vào cơng tác dự báo mạng nơ- ron, thời gian qua, nhiều tác giả tiến hành hàng loạt nghiên cứu tập trung vào việc ứng dụng chúng việc dự báo nhân tố, biến số lĩnh vực kinh tế, kỹ thuật tài liệu [8], [10], [12],[13] đạt nhiều kết khả quan, họ tới kết luận mơ hình dự báo mạng nơ ron lai ( kết hợp mạng nơ ron mơ hình dự báo truyền

thống) FIR có vượt trội mơ hình hồi quy tuyến tính truyền thống Các cơng

trình có số thành cơng tốn cụ thể, tồn hạn chế khảo sát toán chuỗi thời gian cách dùng phương pháp dự báo mơ hình chuỗi thời gian có kết hợp với mạng nơron để khảo sát cột liệu thơng thường mà chưa tính đến ảnh hưởng lần yếu tố phụ thuộc khác, cơng trình đề cập đến việc dự báo hệ thống liệu đa chiều phụ thuộc lẫn theo chuỗi thời gian Tuy nhiên, báo [6] đưa ý tưởng kết hợp mơ hình báo [7] rõ phương pháp xác trình tự hồi quy dự báo hệ thống liệu đa chiều

Trên giới Việt nam, việc nghiên cứu giải pháp dự báo biến động hệ thống liệu đa chiều phụ thuộc lẫn theo chuỗi thời gian thường áp dụng vào vài tốn định, chưa tổng qt hóa, giải pháp thường cơng cụ tốn học kết hợp với phần mềm phân tích, chưa rõ mối quan hệ biến, cá thể với nhau, cần đòi hỏi vài giả thuyêt thống kê mơ hình đặc biệt Với ý định xây dựng giải pháp hợp lý để dự báo biến động hệ thống liệu đa chiều phụ thuộc lẫn theo chuỗi thời gian mạng nơ ron ý tưởng mới, đáp ứng phát triển thực tế vấn đề dự báo

(2)

mạng nơ ron FIR dự báo phát triển phương pháp phân tích thành phần để xác định trình tự hồi quy, sử dụng mơ hình hồi quy bội để xác định lại giá trị dự báo Ứng dụng dựa vào liệu trang http://www.investing.com thị trường tài Forex Kết cho thấy, việc kết hợp mạng nơ ron FIR mơ hình hồi quy truyền thống lại có kết dự báo tốt sử dụng mạng nơ ron

2 NỘI DUNG CẦN GIẢI QUYẾT 2.1 Xây dựng lý thuyết

2.1.1 Giả thiết ban đầu

Trong dự báo, số liệu khứ định xu hướng vận động tượng tương lai

2.1.2 Xây dựng giải pháp dự báo hệ thống liệu đa chiều

2.1.2.1 Bài toán: Hệ thống liệu đa chiều ma trận Xnp gồm n hàng ( cá thể ) p cột (biến ) có dạng:

    

 

    

  

p n n

n n

p p

p n

x x x t

x x x t

x x x t X

, , ,

, 2 , , 2

, , 1 , 1 ,

(1)

Trong ti cột thời gian, xij tham số biến động theo chuỗi thời gian, xây dựng giải pháp để xác định thời điểm tn+1…, giá trị tham số xn+1,1, xn+1,2….xn+1,p… 2.1.2.2 Giải pháp chung: việc dự báo chia làm 02 giai đoạn:

+ Giai đoạn 1: Trong mơi trường dự báo có ba thời đoạn quan tâm Đầu tiên,

người khảo sát sử dụng liệu thời đoạn n1 đến n2 để ước lượng một vài mô hình Các thời đoạn từ n2+ đến n3 , đó, giá trị thực tế Y biết; thời đoạn n3+1 trở giá trị Xs Y chưa biết Các giá trị dự báo tạo cho thời kỳ từ n2+1 đến n3 gọi giá trị dự báo kiểm định, giá trị dự báo tạo cho thời kỳ từ n3+1 trở gọi giá trị dự báo tiên nghiệm

Hình 1. Các thời đoạn dự báo mẫu, kiểm định tiên nghiệm

Đầu tiên, ta phải dự báo cột bảng dự liệu Theo [9], người ta thường dùng phương pháp dự báo chuỗi thời gian sử dụng mơ hình tự hồi quy Mơ hình chuỗi thời gian tự hồi quy hồn tồn có cấu trúc sau:

Yt = α1Yt-1+ α2Yt-2 + … + αpYt-p+ ut (2)

Trong Yt quan sát thứ t biến phụ thuộc ut thành phần sai số Các mơ hình thường gặp mơ hình trung bình trượt (MA – Moving Average):

Yt = νt – β1νt-1– β2 νt-2– …– βq νt-q (3) Nhưng mơ hình thường áp dụng để dự báo chuỗi thời gian mơ hình ARMA (Autoregressive Moving Average), phối hợp công thức tự hồi quy trung bình trượt tạo mơ hình ARMA Do đó, mơ hình ARMA (p, q) có dạng tổng qt:

(3)

- Để đánh giá mơ hình người ta sử dụng nhiều tiêu chuẩn đơn giản phổ biến tiêu chuẩn ME (sai số tuyệt đối trung bình, nhiều tài liệu, ký hiệu MAE), cụ thể: 

 

 

n

i

i i y

y n MAE

1

1 (5)

Trong đó, yi yi

giá trị thực tế giá trị dự báo mơ hình hồi quy chọn mơ hình có giá trị MAE thấp Tuy nhiên, để tăng thêm độ xác, giai đoạn này, ta sử dụng mạng nơron FIR kết hợp với mô hình ARMA để dự báo cho cột

+ Giai đoạn 2: Theo [7], hệ thống liệu đa chiều, phát triển cột

ảnh hưởng tích cực hay tiêu cực tới phát triển cột khác, vậy, dự báo xong cột bất kỳ, phải tính tới ảnh hưởng cột khác tới Chính vậy, cần phải đưa trình tự để hồi quy, không dẫn tới việc kết dự báo thiếu xác Sau đó, dùng tiếp mơ hình hồi quy bội để tìm liên quan biến (các cột) bảng với để xác định lại giá trị dự báo, nghĩa liên hệ biến phụ thuộc Y cho trước với nhiều biến độc lập X1, X2, , Xn Công thức tổng quát sau:

Y=  X1X2 + X3+…….nXn +n+1Yt (6) 2.1.2.3 Sử dụng mạng nơron FIR để dự báo cột (biến)

+ Mạng nơ ron: Mạng nơron nhân tạo, gọi tắt mạng nơron, mơ hình xử lý

thông tin theo cách thức hệ nơron sinh học Nó tạo nên từ số lượng lớn nơron kết nối với thông qua liên kết (gọi trọng số liên kết) làm việc thể thống để giải vấn đề cụ thể (hình 2)

Hình 2. Mạng nơron truyền thẳng

Hình trái tế bào nơron bên phải mạng truyền thẳng

Xét tế bào nơron trích từ lớp l mạng L lớp Đầu vào xil tới nơron nhân với hệ số wijl gọi trọng số đại diện cho kết nối khớp thần kinh nơron i lớp trước nơron j lớp l Và đầu nơron xlj1 hàm sigmoid tổng trọng số đầu vào nó: 1  ( )

i l i l i l

j f wx

x (7)

- Mạng nơron FIR: theo [6], tế bào nơron mạng này, khớp tĩnh thay lọc tuyến tính FIR Bộ lọc FIR mơ hình hóa với đường trễ phân nhánh minh họa hình Trong lọc này, đầu y(k) tương ứng với tổng trọng số giá trị trễ đầu vào

 

 

T

n

n k x n w k

y

0

) ( ) ( )

( (8)

(4)

Hình 3. Mơ hình lọc FIR

Đầu xlj1(k) lớp l thời điểm k tính hàm sigmoid tổng tất kết đầu l lọc cung cấp cho nơron:

)) ( ( )

( ,

1 k f w x k

x l

i i

l j i l

j  

 (9)

Hình 4. Nơron FIR mạng nơron FIR

2.1.2.4 Phương pháp phân tích thành phần để xác định phụ thuộc trình tự hồi quy cột biến

+ Phương pháp chung: mục đích kỹ thuật rút thơng tin chủ yếu chứa

trong bảng liệu cách xây dựng biểu diễn đơn giản hơn, cho đám mây số liệu thể rõ nhất, mà thơng tin khơng sai lạc Theo [5], ta có bảng số liệu:

       

      

p n n

n

p p

p n

x x

x

x x

x

x x

x X

,

, ,

, 2 , ,

, , 1 ,

,

Trong đó, xi,j giá trị mà biến Xj (với j = 1,p) nhận cá thể i (với i= 1,n) Để biết mối quan hệ biến, cá thể cần chuyển chung qua không gian với số chiều Bài báo [7] nêu bước tiến hành gồm quy tâm bảng số liệu; Tính ma trận phương sai- hiệp phương sai; tìm giá trị riêng: 1  2   q p; Tìm trục hình chiếu cá thể i trục j; Tìm thành phần chính; Tái lập điểm – biến Bài báo [7] đưa giải thuật xác định trình tự hồi quy dự báo liệu đa chiều, ý tưởng giải thuật là:

Giả sử ta có tất hình chiếu biến thành phần chính, đó, theo [5] (tr 103), coi biến Xi biến cần giải thích biến Xk biến giải thích Xk tác động vào Xi góc véc tơ Xk, Xi nhỏ 900

i

X > Xk ( Xi , Xk - Độ dài véc tơ Xi Xk) Lúc này, ta biết tọa độ véc tơ nên xác định chúng theo công thức:

2

i i

i x y

(5)

( xi, yi tọa độ Xi mặt phẳng tạo trục chính) Góc 02 véc tơ Xk, Xi xác định công thức:

2 2

)

, (

k k i i

k i k i k

i

y x y x

y y x x X

X Cos

 

 (11)

Vì thế, để xác định trình tự hồi quy dùng phương pháp phân tích thành phần để đưa biến (các cột) mặt phẳng 02 thành phần chính, sau đó, xếp theo độ lớn biến xem xét góc 02 biến để phân tích liên quan chúng, đó, giả sử biến Xi biến cần giải thích, ta tìm biến Xk1, Xk2…Xkn giải thích cho biến Xi, sử dụng kết dự báo ứng dụng phương pháp hồi quy bội để tìm tiếp giá trị dự báo Lập lại hết bảng liệu

2.1.2.5 Sử dụng phương pháp hồi quy bội để dự báo lại kết cột (biến) Gọi Yt giá trị thực thời điểm t biến phụ thuộc Xt1, Xt2, , Xtk giá trị dự báo cột tương ứng tạo mạng nơron FIR Phương pháp đương nhiên tạo giá trị trung bình có trọng số giá trị dự báo Do vậy, giá trị dự báo kết hợp là: ft= ˆ1ˆ2X2,iˆ3X3,i  ˆkXk,i (12)

Trong đó, ˆ1, ˆ2,……ˆk hệ số - trọng số cần xác định

Gọi Yi giá trị thực tế thời điểm i, sai số ei dự báo so với kết kỳ vọng

sẽ tiến tới 0, cụ thể sau:

ei = Yi – fi = Yi - ˆ1ˆ2X2,iˆ3X3,i ˆkXk,i  (13) Áp dụng công thức cho ei, sử dụng phương pháp bình phương tối thiểu, ta biểu

thức sau:

 2

n

1 i

i , k k i , 3 i , 2 i n

1 i

2

i Y ˆ ˆ X ˆ X ˆ X

e 

 

        

 đạt cực tiểu (14)

Trong đó, X1,1, X1,2, … Xi,j giá trị dự báo mơ hình biết Khai triển (14) giải hệ phương trình ta có trọng số ˆ1, ˆ2,…… ˆk cần xác định 2.2 Ví dụ ứng dụng

2.2.1 Dữ liệu ứng dụng

Trong ví dụ này, tác giả lấy liệu giá vàng bán trang web trang

http://www.investing.com thị trường tài Forex (Foreign Exchange ), thị

trường tài lớn giới Bảng liệu bao gồm cột giá mở cửa, giá cao thấp (vì giá vàng biến động ngày) Dữ liệu ngày 10/12/2006 tới ngày 11/11/2016, gồm 2580 trường hợp Bảng kết dự báo áp dụng mạng nơ ron FIR tác giả đưa lên trang Mediafile theo địa : http://www.mediafire.com/file/5zu56hz7zuowjp4/du_lieu_va_ket_qua_du_bao.xls

Dữ liệu dạng bảng:

Bảng 1. Dữ liệu kết dự báo mạng nơron FIR

SỐ LIỆU GỐC KẾT QUẢ DỰ BÁO BẰNG FIR

TT Ngày Lúc mở Cao Thấp Lúc mở Cao Thấp

1 10/12/2006 575.00 575.00 575.00 1197,865 1204,764 1190,317 10/13/2006 585.50 585.50 585.50 1197,865 1204,764 1190,317

………… ………… ………… ………… ………… ………… …………

(6)

Ở phần 2.1.2.2 (giải pháp chung), tác giả khái quát trình dự báo gồm giai đoạn, giai đoạn dự báo cột (bằng mạng nơ ron FIR) giai đoạn xem xét tác động lần cột để hồi quy xác định xác lại giá trị dự báo

2.2.2 Xây dựng mạng nơron FIR để dự báo

Dữ liệu huấn luyện tập cặp (Xh, Dh), Xh đó, thơng số giá vàng lúc mở, lúc cao thấp ngày h, Dh thông số giá vàng ngày h+1 Tức Dh =Xh1 Sau huấn luyện mạng nơron nhiều lần với L mẫu huấn luyện mạng nơron nắm quy luật biến đổi giá vàng Q trình huấn luyện thực theo thuật tốn lan truyền ngược Các thông số huấn luyện sau:

Bảng Các thông số mạng FIR

TT Tên thông số Giá

trị

TT Tên thông số Giá trị

1 Số lượng nơ-ron đầu vào Số mẫu thời kỳ ước lượng 1-1299 Số lượng nơ-ron đầu Số mẫu thời kỳ kiểm định 1300-1499

3 Số lượng lớp ẩn Số mẫu để kiểm tra tiên nghiệm 1499-2538

4 Số lượng nơ-ron ẩn 3x4

Sau hình vẽ liệu thời kỳ cột (giá mở cửa), (giá thấp

trong ngày) (giá cao ngày) từ xuống, I- Toàn vùng liệu, II- Thời

kỳ ước lượng dự báo mẫu, III- Dự Báo Kiểm định, IV- Dự báo Tiên nghiệm)

Hình Biểu đồ giai đoạn cột giá mở, giá cao giá thấp

Sau dự báo mạng nơron FIR, MAE cột sau:

I II III IV

I II III IV

(7)

Bảng 3: trình tự hồi quy

cot dodai cotpt

3 0,999642021

2

1

Bảng 1. Thông số MAE giá mở, giá cao thấp

TT MAE Giá mở (cột 1) Giá cao (cột 2) Giá thấp (cột 3)

1 MAE toàn 15,525 15,338 14,647

2 MAE miền tiên nghiệm 13,044 13,422 9,977

So sánh hiệu FIR với phương pháp dự báo chuỗi thời gian sử dụng mơ hình ARIMA:

Đầu tiên, ta dùng 1499 trường hợp giá vàng lúc mở cửa để dự báo trường hợp tiếp theo, sau chạy chương trình dự báo ARIMA, ta có bảng so sánh FIR ARIMA, ta thấy MAE FIR nhỏ so với ARIMA, từ ta rút kết luận FIR có hiệu dự báo tốt nhiều so với ARIMA

Dữ liệu để đường dẫn :

http://www.mediafire.com/file/sua979gtg557qte/du_lieu_ung_dung_gia_vang.xls

2.2.3 Sử dụng mơ hình hồi quy bội để xác định lại các giá trị dự báo

+ Sử dụng phương pháp phân tích thành phần

chính để xác định xác trình tự hồi quy

cột: Sử dụng thuật tốn báo [7], ta tính

toán bảng Ở đây, ta lấy cột (giá mở cửa) cột đơn vi, qua bảng trên, ta thấy, cột phụ thuộc cột 2, cột lại phụ thuộc cột Đó trình tự hồi quy mà ta phải xác định

+ Sử dụng mơ hình hồi quy bội xác định lại giá trị dự báo: Xét hồi quy bội

cho cột 3: trường hợp có cột (biến) tác động vào cột này, cột (giá cao nhất) kết dự báo FIR cột (giá thấp nhất), cần xác định trọng số   1, 2, 3bằng việc triển khai biểu thức (14) để qui việc giải hệ phương trình ẩn:

 

 

 ˆ ˆ ˆ 

2 ˆ ˆ ˆ ˆ ˆ ˆ , , 3 , 2 1 , , 3 , 2 2 , 3 , 2 1                                     n i i i i i k n i i i n i i i i n i i n i i i i n i i X X X Y e X X X Y e X X Y e             (15) Đặt n X X n i i    , , n X X n i i    , , n Y Y n i i  

 (16)

X X

x2,i  2,i ,x3,iX3,iX yiYiY , ta xác định ˆ1, ˆ2,ˆ3:

3 2

1 Y ˆ X ˆ X

ˆ   

 (17)

Bảng 2. So sánh MAE FIR ARIMA

MAE Giá FIR ARIMA

Giá mở 13,044 1066,87

Giá cao 13,422 991,48

Ngày đăng: 01/04/2021, 12:23

Tài liệu cùng người dùng

Tài liệu liên quan