Dự báo chuỗi thời gian mờ dựa trên đại số gia tử

Kỷ yếu công trình khoa học 2015 - Phần I DỰ BÁO CHUỖI THỜI GIAN MỜ DỰA TRÊN ĐẠI SỐ GIA TỬ Trần Quang Duy, Nguyễn Công Điều, Vũ Như Lân Khoa Toán-Tin, Đại học Thăng Long Email: Tr.qduy@gmail.com, ncdieu@yahoo.com, vnlan@ioit.ac.vn Tóm tắt: Chuỗi thời gian mờ Song & Chissom đưa năm 1993 nghiên cứu rộng rãi giới cho mục đích dự báo Tuy nhiên, độ xác dự báo chuỗi thời gian theo tiếp cận mờ Song & Chissom chưa cao phụ thuộc vào nhiều yếu tố S.M Chen (1996) đề xuất mô hình dự báo chuỗi thời mờ hiệu sử dụng tính toán số học đơn giản Sau mô hình nghiên cứu cải tiến nhiều ứng dụng dự báo có nhiều kết xác Đại số gia tử (ĐSGT) tiếp cận tác giả N.C.Ho W Wechler xây dựng vào năm 1990 Mô hình dự báo chuỗi thời gian mờ thể qua ba giai đoạn phép mờ hóa, xác định quan hệ mờ phép giải mờ Trong ĐSGT, phép mờ hóa phép giải mờ thay phép ngữ nghĩa hóa phép giải nghĩa tương ứng đơn giản Trong báo này, đưa tiếp cận sử dụng ĐSGT với khả cung cấp mô hình tính toán hoàn toàn khác biệt so với tiếp cận mờ cho mô hình dự báo chuỗi thời gian mờ Các kết thử nghiệm dự báo số sinh viên nhập học Đại học Alabama chứng minh mô hình chuỗi thời gian mờ dựa ĐSGT tốt so với nhiều mô hình có Từ khóa: Tập mờ, nhóm quan hệ mờ, đại số gia tử, dự báo chuỗi thời gian mờ MỞ ĐẦU Dự báo chuỗi thời gian vấn đề nhiều nhà khoa học giới quan tâm nghiên cứu Q.Song B.S Chissom [1] lần đưa quan niệm xem giá trị thực định lượng chuỗi thời gian từ góc độ định tính Từ chuỗi thời gian xem biến ngôn ngữ toán dự báo trở thành vấn đề dự báo giá trị ngôn ngữ biến ngôn ngữ Có thể coi quan niệm chuỗi thời gian có tính đột phá Tuy nhiên mô hình tính toán nhóm quan hệ mờ [2, 3] phức tạp độ xác dự báo không cao Chen [4] thay đổi cách tính toán nhóm quan hệ mờ mô hình dự báo [2, 3] với phép tính số học đơn giản để thu kết dự báo xác Nhiều nghiên cứu sử dụng phương pháp luận thu nhiều kết quan trọng [4, 9, 10] Ở Việt Nam, báo [11] kết nghiên cứu dự báo chuỗi thời gian mờ Các nghiên cứu giới chủ yếu tập trung giải vấn đề nâng cao độ xác dự báo Có thể thấy số vấn đề sau ảnh hưởng đến độ xác dự báo chuỗi thời gian mờ: a/ Mờ hóa liệu: Đây vấn đề đòi hỏi phải có trực giác tốt để mô tả định tính chuỗi thời gian cách hợp lý, từ xây dựng nhóm quan hệ mờ cung cấp thông tin có giá trị cho trình dự báo sau Đặc tính quan trọng phép mờ hóa số lượng khoảng chia, độ dài khoảng chia Nếu số lượng khoảng chia ít, dự báo có độ sai lệch lớn chưa đủ thông tin Nếu số lượng khoảng chia lớn, dự báo nghĩa tính mờ giá trị ngôn ngữ không nhóm quan hệ mờ Trong nghiên cứu [7, 8]: số lượng khoảng, độ dài khoảng bậc mô hình chuỗi thời gian mờ có ảnh hưởng đến độ Trường Đại học Thăng Long 30 Kỷ yếu công trình khoa học 2015 - Phần I xác mô hình dự báo Một số nghiên cứu sâu số lượng khoảng, độ dài khoảng bậc mô hình chuỗi thời gian mờ tối ưu để có dự báo tốt cho liệu nhóm quan hệ mờ [12, 13, 14] b/ Giải mờ: Đây trình dự báo với nhiều kỹ thuật khác sở phép mờ hóa Cách giải mờ phổ biến dựa luật [4], nhiên [10, 11] tìm số tham số định hướng cho trình giải mờ thu số kết tốt Tiếp cận đại số gia tử (ĐSGT) [15] tiếp cận khác biệt so với tiếp cận mờ có số ứng dụng thể rõ hiệu tiếp cận so với tiếp cận mờ truyền thống số lĩnh vực điều khiển [16, 18, 19], công nghệ thông tin [17] Tiếp tục nghiên cứu ứng dụng đây, tiếp cận ĐSGT cần nghiên cứu thử nghiệm cho lĩnh vực ứng dụng mới, toán xây dựng mô hình dự báo chuỗi thời gian mờ nhiều tác giả khác giới quan tâm Bài báo trình bày theo thứ tự sau đây: Sau mục MỞ ĐẦU Mục II giới thiệu mô hình dự báo chuỗi thời gian mờ ứng dụng cho dự báo số sinh viên nhập học trường đại học Alabama Song & Chissom [2,3] Chen [4] Mục III sở toán dự báo số sinh viên nhập học trường đại học Alabama, nêu số nội dung quan trọng ĐSGT cần thiết cho toán dự báo chuỗi thời gian mờ với tham số hợp lý so sánh với phương pháp Chen phương pháp cải tiến khác sử dụng chuỗi thời gian mờ bậc với khoảng chia Mục IV tiếp tục trình bày phương pháp dự báo số sinh viên nhập học trường đại học Alabama sở tiếp cận ĐSGT điều kiện phép ngữ nghĩa hóa phi tuyến, phép giải nghĩa phi tuyến với tham số tối ưu dựa đoạn giải nghĩa tối ưu Từ so sánh với số phương pháp dự báo cải tiến theo tiếp cận mờ sử dụng bậc cao, số khoảng chia lớn số mô hình dự báo chuỗi thời gian mờ tối ưu Độ xác dự báo phương pháp đánh giá qua sai số trung bình bình phương MSE (Mean Square Error), qua thấy rõ tính ưu việt tiếp cận ĐSGT so với tiếp cận mờ MÔ HÌNH DỰ BÁO CHUỖI THỜI GIAN MỜ 2.1 Một số khái niệm mô hình dự báo chuỗi thời gian mờ Mô hình chuỗi thời gian mờ lần Song Chissom đưa [1, 2, ] Chen cải tiến [4,5, 6] để xử lý phép tính số học đơn giản xác phù hợp với ứng dụng dự báo chuỗi thời gian mờ Có thể tóm lược qua số khái niệm sau đây: Định nghĩa 2.1: Chuỗi thời gian mờ Giả sử Y(t), (t= , 0,1,2, .), tập số thực tập xác định tập mờ f i (t), (i=1,2 , ) Biến t thời gian Nếu F(t) chuỗi tập mờ f i (t), (i=1,2, ), F(t) gọi chuỗi thời gian mờ Y(t), (t= , 0,1,2, ) Định nghĩa 2.2: Quan hệ mờ Nếu tồn quan hệ mờ R(t−1, t), cho F(t)=F(t−1)*R(t−1, t), dấu * ký hiệu toán tử đó, F(t) suy từ F(t−1) Quan hệ F(t) F(t−1) xác định ký hiệu: F(t−1)→F(t) Trường Đại học Thăng Long (2.1) 31 Kỷ yếu công trình khoa học 2015 - Phần I Ví dụ toán tử * phép kết hợp MaxMin [2] MinMax [3] hay phép tính số học [ 4] Nếu F (t−1)=Ai and F (t)=Aj , quan hệ logic F (t) and F(t−1) ký hiệu Ai→Aj , Ai vế trái Aj vế phải quan hệ mờ mô tả tập mờ dự báo Định nghĩa 2.3: Quan hệ mờ bậc n Giả sử F(t) chuỗi thời gian mờ Nếu F(t) suy từ F(t−1), F(t−2), , F(t−n), quan hệ mờ biểu diễn biểu thức: F(t−n), ,F(t−2), F(t−1) → F(t) (2.2) gọi chuỗi thời gian mờ bậc n Định nghĩa 2.4: Nhóm quan hệ mờ ( NQM ) Các quan hệ mờ với tập mờ bên vế trái đưa vào nhóm gọi nhóm quan hệ mờ hay nhóm quan hệ logic mờ Giả sử có quan hệ mờ sau, vế trái giống nhau: Ai→ Aj1; Ai→ Aj2; ; Ai→ Ajn Các quan hệ mờ đưa vào nhóm ký hiệu sau: Ai→ Aj1, Aj2, , , Ajn (2.3) 2.2 Mô hình dự báo Song Chissom Mô hình dự báo chuỗi thời gian mờ lần Song Chissom đưa vào năm 1993 [1, 2, ] ứng dụng để dự báo số sinh viên nhập học trường Đại học Alabama với liệu lịch sử qua 22 năm kể từ năm 1971 đến 1992 Bảng 2.1 sau đây: Bảng 2.1 Số sinh viên nhập học trường đại học Alabama từ 1971 đến 1992 Năm Số sinh viên nhập học Năm Số sinh viển nhập học 1971 13055 1982 15433 1972 13563 1983 15497 1973 13867 1084 15145 1974 14696 1985 15163 1975 15460 1986 15984 1976 15311 1987 16859 1977 15603 1988 18150 1978 15861 1989 18970 1979 16807 1990 19328 1980 16919 1991 19337 1981 16388 1992 18876 Trường Đại học Thăng Long 32 Kỷ yếu công trình khoa học 2015 - Phần I Chuỗi thời gian lần xem xét góc độ biến ngôn ngữ toán dự báo có cách nhìn hoàn toàn quan điểm lý thuyết tập mờ Mô hình dự báo mô hình dự báo chuỗi thời gian dừng [2, 3] triển khai qua bước sau đây: Bước Xác định tập Bước Chia miền xác định tập thành khoảng Bước Xây dựng tập mờ tập Bước Mờ hóa chuỗi liệu Bước Xác định quan hệ mờ Bước Dự báo phương trình Ai=Ai−1* R, ký hiệu * toán tử max-min Bước Giải mờ kết dự báo quan (2.4) Trong bước 5, quan hệ mờ R xác định biểu thức Ri=As TxAq , với hệ mờ k, As →Aq, R= ∪i=1,k Ri Ở x toán tử min, T phép chuyển vị ∪ phép hợp 2.3 Mô hình dự báo Chen Do mô hình dự báo chuỗi thời gian mờ Song & Chissom phức tạp bước bước 6, Chen [4] cải tiến cách tính toán cho xác cho mô hình dự báo chuỗi thời gian sử dụng phép tính số học đơn giản sở thông tin từ nhóm quan hệ mờ theo bước sau đây: Bước Chia miền xác định tập thành khoảng Bước Xây dựng tập mờ tập Bước Mờ hóa chuỗi liệu Bước Xác định quan hệ mờ Bước Tạo lập nhóm quan hệ mờ Bước Xây dựng luật dự báo nhóm quan hệ Bước Giải mờ đầu theo luật đưa dự báo MÔ HÌNH DỰ BÁO THEO TIẾP CẬN ĐẠI SỐ GIA TỬ Đại số gia tử cung cấp mô hình xử lý đại lượng không chắn hiệu cho nhiều toán ứng dụng Có thể thấy rõ giá trị ngôn ngữ với ngữ nghĩa vốn có thứ tự chặt chẽ biến ngôn ngữ mô tả cấu trúc đại số gia tử [15, 16], từ tạo môi trường tính toán, suy luận tốt cho nhiều ứng dụng Gọi AX = ( X, G, C, H, ≤ ) cấu trúc đại số, với X tập AX; G = {c-, c+} tập phần tử sinh; C = {0, W, 1}, 0, W tương ứng phần tử đặc trưng cận trái (tuyệt đối nhỏ), trung hòa cận phải (tuyệt đối lớn); H tập toán tử Trường Đại học Thăng Long 33 Kỷ yếu công trình khoa học 2015 - Phần I gọi gia tử; ≤ biểu thị quan hệ thứ tự giá trị ngôn ngữ Gọi Hlà tập hợp gia tử âm H+ tập hợp gia tử dương AX Ký hiệu H- = {h-1, h-2, …h-q}, h-1 < h-2 < … < h-q H+ = {h1, h2, …, hp}, h1 < h2 < … < hp Định nghĩa 3.1: Độ đo tính mờ fm: X → [0, 1] gọi độ đo tính mờ thỏa mãn điều kiện sau:: fm(c-)+fm(c+) = ∑ h∈H fm( hx) = fm(x), với ∀x ∈ X Với phần tử 0, W 1, fm(0) = fm(W) = fm(1) = Và với ∀x,y ∈ X, ∀h∈H, fm(hx) fm(hy ) = fm( x ) fm( y ) (3.1) (3.2) (3.3) Đẳng thức (3.3) không phụ thuộc vào phần tử x, y ta ký hiệu µ(h) độ đo tính mờ gia tử h Tính chất fm(x) µ(h) sau: fm(hx) = µ(h)fm(x), ∀x∈X (3.4) p ∑ fm(hi c) = fm(c) , với c∈{c-, c+} (3.5) fm( hi x) = fm( x) (3.6) i =− q ,i ≠ p ∑ i =− q ,i ≠ −q p ∑ µ (h ) = α i i =−1 ∑ µ (h ) = β , với α, β > α+β = i (3.7) i =1 Định nghĩa 3.2: Hàm dấu Hàm Sign: X→{-1, 0, 1} ánh xạ gọi hàm dấu với h, h'∈H c ∈{c-, c+} đó: Sign(c-) = -1, Sign(c+) = +1; (3.8) Sign(hc) = - Sign(c), h âm c; (3.9) Sign(hc) = + Sign(c), h dương c; (3.10) Sign(h'hx) = -Sign(hx), h’hx ≠ hx h' âm h; (3.11) Sign(h'hx) = + Sign(hx), h’hx ≠ hx h' dương h; (3.12) Sign(h'hx) = h’hx = hx (3.13) Gọi fm độ đo tính mờ X, ánh xạ ngữ nghĩa định lượng ν: X → [0,1], sinh fm X, xác định sau: v (W) = θ = fm(c − ), (3.14) v (c − ) = θ − α fm(c − ) = β fm(c − ) , (3.15) v (c + ) = θ + α fm(c + ) = − β fm(c + ) (3.16) Trường Đại học Thăng Long 34 Kỷ yếu công trình khoa học 2015 - Phần I j v(hj x) = v( x) + sign(hj x){∑i= sign( j ) fm(hi x) − ω (hj x) fm(hj x)} (3.17) với ω (h j x) = [1 + Sign(h j x) sign(hp h j x)( β − α )] ∈ {α , β } , (3.18) j ∈ [-q^p], j ≠ Để thuận tiện cho việc biểu diễn ngữ nghĩa giá trị ngôn ngữ [16], giả sử miền tham chiếu thông thường biến ngôn ngữ X đoạn [a, b] miền tham chiếu ngữ nghĩa Xs đoạn [as,bs] ( ≤ as < bs ≤ ) Việc chuyển đổi tuyến tính từ [a, b] sang [as,bs] gọi phép ngữ nghĩa hóa tuyến tính (linear semantization) việc chuyển ngược lại từ đoạn [as,bs] sang [a, b] gọi phép giải nghĩa tuyến tính (linear desemantization) Đoạn [a, b ] gọi đoạn giải nghĩa Trong nhiều ứng dụng ĐSGT sử dụng miền ngữ nghĩa đoạn [as=0, bs=1], phép ngữ nghĩa hóa tuyến tính gọi phép chuẩn hóa (linear Semantization = Normalization) phép giải nghĩa tuyến tính gọi phép giải chuẩn (Linear Desemantization = Denormalization ) Nhiều ứng dụng ĐSGT nhiều lĩnh vực khoa học đòi hỏi mở rộng không gian tham số phép ngữ nghĩa hóa phép giải nghĩa để có nhiều tham số lựa chọn mềm dẻo Điều có mở rộng phép ngữ nghĩa hóa phép giải nghĩa từ tuyến tính sang phi tuyến Như biểu diễn phép ngữ nghĩa hóa phép giải nghĩa sau: Linear Semantization (x) = xs = as + ( bs – as ) ( x – a ) / ( b – a) (3.19a) Normalization (x) = xs = ( x – a ) / (b – a ) (3.19b) Nonlinear Semantization (x) = f(xs,sp) (3.19c) Với điều kiện: ≤ f(xs,sp) ≤ f(xs=0,sp) = f(xs=1,sp) = Hàm f(.) chọn tùy theo ứng dụng hàm liên tục, đồng biến để đảm bảo thứ tự ngữ nghĩa Ví dụ chọn f(xs,sp) dựa Normalization(x) sau: Nolinear Normalization (x) = sp.xs(1-xs) + xs (3.19d) Tương tự: Linear Desemantization (xs) = x = a + (b – a) (xs – as) / (bs – as) (3.20a) Denormalization (xs) = x = a + ( b – a )xs (3.20b) Nonlinear Desemantization (xs) = g(x,dp) (3.20c) Với điều kiện: a ≤ g(x,dp) ≤ b g(x = a,dp) = a g(x = b,dp) = b Hàm g(.) chọn tùy theo ứng dụng hàm liên tục, đồng biến tương ứng với thứ tự ngữ nghĩa Ví dụ sau chọn f(xs,sp ), tiếp tục chọn g(x,dp) dựa Denormalization (f(xs,sp) ) sau: Nonlinear Denormalization (f(xs,sp)) = dp(( Denormalization (f(xs,sp))–a ) (b – Denormalization (f(xs,sp))) / (b-a) + Denormalization (f(xs,sp)) Trong Denormalization (f(xs,sp)) = (sp.x.(1-x)+x ).(b-a) + a Trường Đại học Thăng Long ( 3.20d ) ( 3.20d1) 35 Kỷ yếu công trình khoa học 2015 - Phần I Hàm f(xs,sp) hàm biểu diễn phép ngữ nghĩa hóa phi tuyến, g(x.dp) hàm biểu diễn phép giải nghĩa phi tuyến chưa sử dụng ứng dụng ĐSGT, sp∈[-1 1] tham số ngữ nghĩa hóa, dp ∈[-1 1] tham số giải nghĩa.Khi sp=dp=0; tính phi tuyến bị loại bỏ biểu thức (3.19d) trở thành (3.19b) (3.20d) trở thành (3.20b) Cho trước độ đo tính mờ gia tử µ(h) giá trị độ đo tính mờ phần tử sinh fm(c-), fm(c+) θ phần tử trung hoà (neutral) Khi mô hình tính toán ĐSGT xây dựng sở biểu thức từ (3.1) đến (3.20) kích hoạt thực tế sử dụng hiệu nhiều ứng dụng Phép mờ hóa phép giải mờ tiếp cận mờ thay tương ứng phép ngữ nghĩa hóa phép giải nghĩa tiếp cận ĐSGT Hệ luật thể siêu mặt làm sở cho trình suy luận xấp xỉ Một lưu ý quan trọng trình tính toán tiếp cận ĐSGT cần xác định tham số ban đầu độ đo tính mờ phần tử sinh độ đo tính mờ gia tử biến ngôn ngữ cách thích hợp dựa sở phân tích ngữ nghĩa miền ngôn ngữ toán ứng dụng cụ thể Khi mô hình tính toán tiếp cận ĐSGT cho kết hợp lý ứng dụng Đối với mô hình dự báo chuỗi thời gian mờ Song & Chissom Chen, thấy rõ ba giai đoạn: mờ hóa, xác định quan hệ mờ giải mờ Như vậy, hoàn toàn thay tiếp cận mờ với ba giai đoạn tiếp cận ĐSGT với ba giai đoạn tương tự: ngữ nghĩa hóa , xác định nhóm quan hệ ngữ nghĩa giải nghĩa Mô hình dự báo chuỗi thời gian mờ dựa ĐSGT có bước sau đây: Bước Xác định tập nền, chia miền xác định tập thành khoảng Bước Xây dựng nhãn ngữ nghĩa (giá trị ngôn ngữ theo tiếp cận ĐSGT) tập Bước Ngữ nghĩa hóa chuỗi liệu Bước Xác định quan hệ ngữ nghĩa theo nhãn ngữ nghĩa Bước Tạo lập nhóm quan hệ ngữ nghĩa theo nhãn ngữ nghĩa Bước Giải nghĩa đầu dự báo Các bước tương tự với bước dự báo mô hình Chen tiếp cận ĐSGT không sử dụng tập mờ mà dùng ngữ nghĩa định lượng mô tả trực tiếp ngữ nghĩa giá trị ngôn ngữ Bài toán chọn để so sánh làm rõ hiệu dự báo mô hình toán dự báo số sinh viên nhập học trường Alabama Song & Chissom [2 3] Chen [4] đặt để nghiên cứu mô hình chuỗi thời gian mờ Đây toán Chen [5,6,7,8] nhiều tác giả giới quan tâm nghiên cứu cải tiến [9,10, 11, 12, 13, 14, 20, 21, 22, 23] Chúng sử dụng số liệu để xây dựng trình dự báo dựa ĐSGT Các bước tính toán dựa ĐSGT cụ thể sau: Trường Đại học Thăng Long 36 Kỷ yếu công trình khoa học 2015 - Phần I Bước 1: Xác định tập nền, chia miền xác định tập thành khoảng Tập U chọn tương tự mô hình Chen [4] có khoảng xác định: [Dmin−D1, Dmax+D2] với Dmin Dmax số sinh viên nhập học thấp cao theo liệu lịch sử nhập học trường Cụ thể Dmin=13055 Dmax=19337, D1 = 55 D2 = 663, U= [13000, 20000] Chia tập U thành khoảng u1, u2, u3, u4, u5, u6 u7 Trong u1 = [13000, 14000], u2 = [14000, 15000], u3 = [15000, 16000], u4 = [16000, 17000], u5 = [17000, 18000], u6 = [18000, 19000] u7 = [19000, 20000] Bước Xây dựng nhãn ngữ nghĩa tập Để tiện theo rõi so sánh với bước dự báo mô hình Chen, sử dụng số ký hiệu tương tự ký hiệu Chen sử dụng Giả sử A1, A2 ,…, Ak nhãn ngữ nghĩa gán cho khoảng u1, u2,…uk, k số khoảng tập Khác với tập mờ nghiên cứu Chen, nhãn ngữ nghĩa xây dựng từ phần tử sinh c-, c+ với gia tử h ϵ H tạo thành giá trị ngôn ngữ biến ngôn ngữ “số sinh viên nhập học ” Khi nhãn ngữ nghĩa A1, A2 ,…, Ak có dạng sau đây: A1= hA1c; A2= hA2c;….; Ak= hAkc, hAi, (i=1,2,…k) chuỗi gia tử tác động lên c với c ∈{c-, c+} Trong [4], Chen sử dụng giá trị ngôn ngữ A1 = (not many), A2 = (not too many), A3 = (many), A4 = (many many), A5 = (very many), A6 = (too many) A7 = (too many many) Theo tiếp cận ĐSGT, gia tử “very”và “little” tác động lên phần tử sinh “small”và “large” sử dụng để tạo nhãn ngữ nghĩa tương ứng với giá trị ngôn ngữ Chen sau: A1 = (very small), A2 = (small), A3 = (little small), A4 = (midle), A5 = (little large), A6 = (large) A7 = (very large) Bước Ngữ nghĩa hóa chuỗi liệu Để xác định ngữ nghĩa định lượng cho nhãn ngữ nghĩa A1, A2, ,A7 bước 2, cần chọn trước độ đo tính mờ gia tử µ(very), µ(little) giá trị độ đo tính mờ phần tử sinh fm(c-) = θ với θ phần tử trung hoà cho trước Nếu gia tử dương “very” gia tử âm “little ” tác động lên phần tử sinh “large” “small” trên, µ(little) = α µ(very) = 1- α = β theo(3.7) Như ngữ nghĩa định lượng nhãn ngữ nghĩa phụ thuộc vào tham số ĐSGT α, θ hoàn toàn xác định sau thay giá trị α, θ vào phương trình tính toán ngữ nghĩa định lượng từ (3.14) đến (3.18) Cụ thể giá trị ngữ nghĩa định lượng nhãn ngữ nghĩa A1,A2, A7 gán tương ứng cho khoảng u1, u2, , u7 có dạng tham số hóa sau đây: ν(very small) = θ(1-α)(1-α) (3.21) ν(small) = θ(1-α) (3.22) ν(little small) = θ(1-α+α2) ν(midle) = θ (3.23) (3.24) ν(little large) = θ+α(1-θ)(1-α) (3.25) ν(large) = θ+(1-θ)α (3.26) ν(very large) = θ+α(1-θ)(2-α) (3.27) Trường Đại học Thăng Long 37 Kỷ yếu công trình khoa học 2015 - Phần I Nếu chọn trước α = 0.5 θ = 0.5, phương trình từ (3.21) đến (3.27) trở thành: ν(very small) = 0.125 (3.28) ν(small) = 0.25 (3.29) ν(little small) = 0.375 (3.30) ν(midle) = 0.5 (3.31) ν(little large) = 0.625 (3.32) ν(large) = 0.75 (3.33) ν(very large) = 0.875 (3.34) Ký hiệu: SA = Semantization (A) giá trị ngữ nghĩa định lượng theo nhãn ngữ nghĩa A, đó: SA1 = ν(very small); SA2 = ν(small); SA3 = ν(little small); SA4 = ν(midle); SA5 = ν(little large); SA6 = ν(large) SA7 = ν(very large) giá trị ngữ nghĩa định lượng theo tham số chọn trước α, θ Khi dễ dàng thấy rằng: SA1 < SA2 < SA3 < SA4 < SA5 < SA6 < SA7 (3.35) Tương tự trên, xây dựng công thức tính toán giá trị ngữ nghĩa định lượng theo nhãn ngữ nghĩa có nhiều gia tử tác động lên phần tử sinh Biểu thức (3.35) thể rõ tính chất quan trọng sau đây: Thứ tự ngữ nghĩa đảm bảo Các nhãn ngữ nghĩa Ai có giá trị ngữ nghĩa định lượng SAi có quan hệ ngữ nghĩa với thông qua tham số ĐSGT α, θ, µ(hAi), i= 1, 2,… Như vậy, ứng dụng cụ thể tiếp cận ĐSGT, ảnh hưởng tham số mang tính hệ thống Có nghĩa tất giá trị ngôn ngữ biến ngôn ngữ chịu ảnh hưởng tham sô ĐSGT Những tính chất tạo khác biệt tiếp cận ĐSGT tiếp cận mờ Trong tiếp cận mờ, giá trị ngôn ngữ sử dụng tập mờ hoàn toàn ràng buộc với Bước 4: Xác định quan hệ ngữ nghĩa theo nhãn ngữ nghĩa Các quan hệ ngữ nghĩa xác định sở liệu lịch sử Nếu đặt chuỗi thời gian mờ F(t-1) Ak có ngữ nghĩa định lượng SAk F(t) Am có ngữ nghĩa định lượng SAm, Ak có quan hệ với Am dẫn đến SAk có quan hệ với SAm Quan hệ gọi quan hệ ngữ nghĩa theo nhãn ngữ nghĩa ký hiệu là: SAk → SAm Semantization (Aj) → Semantization (Ak) (3.36) Trong toán dự báo số sinh nhập học trường Alabama, Ak nhãn ngữ nghĩa mô tả số sinh viên nhập học năm với ngữ nghĩa định lượng SAk, Am nhãn ngữ nghĩa mô tả số sinh viên nhập học năm với ngữ nghĩa định lượng SAm Như vậy, sở số liệu Chen [4], xác định quan hệ ngữ nghĩa theo nhãn ngữ nghĩa ( kể số lần trùng ) sau đây: SA1 → SA1 (trùng lần); SA1 → SA2; Trường Đại học Thăng Long 38 Kỷ yếu công trình khoa học 2015 - Phần I SA2 → SA3; SA3 → SA3 (trùng lần); SA3 → SA4 (trùng lần); SA4 → SA4 (trùng lần); SA4 → SA3; SA4 → SA6; SA6 → SA6; SA6 → SA7; SA7 → SA7 SA7 → SA6 (3.37) Bước Tạo lập nhóm quan hệ ngữ nghĩa theo nhãn ngữ nghĩa Nếu ngữ nghĩa định lượng (vế trái (3.37)) có quan hệ với nhiều ngữ nghĩa định lượng (vế phải (3.37)), vế phải chập lại thành nhóm Quan hệ lập theo nhóm gọi nhóm quan hệ ngữ nghĩa (NQHNN) Như từ (3.37) nhận NQHNN sau đây: Nhóm 1: SA1 → (SA1, SA1, SA2) Nhóm 2: SA2 → (SA3) Nhóm 3: SA3 → (SA3, SA3, SA3, SA3, SA3, SA3, SA3, SA4, SA4) Nhóm 4: SA4 → (SA4, SA4, SA3, SA6) Nhóm 5: SA6 → (SA6, SA7) Nhóm 6: SA7 → (SA7, SA6) Bước Giải nghĩa đầu dự báo Giả sử số sinh viên nhập học năm (t-1) chuỗi thời gian mờ F(t-1) ngữ nghĩa hóa theo (3.19) SAj, đầu dự báo F(t) hay số sinh viên nhập học dự báo năm t xác định theo nguyên tắc (luật) sau đây: Nếu tồn quan hệ 1-1 nhóm quan hệ ngữ nghĩa theo nhãn ngôn ngữ Aj sau: SAj → SAk, theo (3.19d): Nonlinear Semantization (Aj) → Nonlinear Semantization (Ak) , đầu dự báo tính theo (3.20d): DSAj → Nonlinear Desemantization (SAk) đoạn giải nghĩa uk chọn cho bao uk thuộc khoảng xác định tập chuỗi thời gian mờ [Dmin−D1, Dmax+D2] Nếu SAk trống, SAj → ∅, đầu dự báo tính theo (3.20d): DSAj → Nonlinear Desemantization (∅) đoạn giải nghĩa chọn cho bao uj thuộc khoảng xác định tập chuỗi thời gian mờ [Dmin−D1, Dmax+D2] Nếu tồn quan hệ 1-nhiều nhóm quan hệ ngữ nghĩa (kể quan hệ trùng) theo nhãn ngôn ngữ Aj: SAj → (SAi,SAk,…, SAr), theo (3.19d): NonlinearSemantization (Aj) → (NonlinearSemantization (Ai), NonlinearSemantization (Ak), …, NonlinearSemantization (Ar)), đầu dự báo xác định theo (3.20d) cho liệu lịch sử nhóm quan hệ ngữ nghĩa: DSAj → NonlinearDesemantization (WSAiAj * SAi+ WSAkAj * SAk+…+ WSArAj * SAr) đoạn giải nghĩa chọn cho bao ui, uk… ur thuộc khoảng xác định tập chuỗi thời gian mờ [Dmin−D1, Dmax+D2] Trong WSAiAj, WSAkAj…, WSArAj trọng số ngữ nghĩa thành phần NQHNN theo nhãn ngữ nghĩa Aj tính tỷ số số liệu thuộc khoảng ui tổng số liệu thuộc khoảng ui, uk,…, ur NQHNN Trường Đại học Thăng Long 39 Kỷ yếu công trình khoa học 2015 - Phần I Lưu ý cách chọn đoạn giải nghĩa đảm bảo không phá vỡ nhóm quan hệ mờ đồng thời cho phép tính toán dự báo cho điểm dự báo nhóm quan hệ mờ Trong toán dự báo số sinh viên nhập học trường đại học Alabama, chọn đoạn giải nghĩa hợp lý theo phép thử – sai với giá trị đầu, giá trị cuối Bảng 3.1 sau đây: Bảng 3.1 Giá trị đầu giá trị cuối đoạn giải nghĩa chọn Các điểm dự báo Giá trị Giá trị đầu cuối Các điểm dự báo Giá trị Giá trị đầu cuối ( 1972 ) 13000 17000 12 ( 1983 ) 14000 18000 ( 1973 ) 13000 18000 13 ( 1984 ) 14000 17000 ( 1974 ) 13000 20000 14 ( 1985 ) 14000 17000 ( 1975 ) 15000 16000 15 ( 1986 ) 15000 18000 ( 1976 ) 14000 17000 16 ( 1987 ) 15000 19000 ( 1977 ) 14000 18000 17 ( 1988 ) 15000 20000 (1978 ) 15000 18000 18 ( 1989 ) 16000 20000 ( 1979 ) 15000 19000 19 ( 1990 ) 17000 20000 ( 1980 ) 15000 19000 20 ( 1991 ) 17000 20000 10 ( 1981 ) 14000 19000 21 ( 1992 ) 15000 20000 11 ( 1982 ) 13000 18000 Ví dụ tính toán dự báo cho năm 1972 với θ = 0.5, α = 0.5, sp = 0.3 dp = - 0.2: Thực bước 1, 2, bước trên, sau tính toán ngữ nghĩa cho nhóm bước với NQHNN SA1 → (SA1, SA1, SA2) sau: Theo Bảng 3.2: Nhóm có NQHNN thuộc khoảng u1 u2 Số liệu thuộc khoảng u1 gồm giá trị: 13055, 13563 13867 trùng lần Do số liệu thuộc khoảng u1 (3*2 = 6) Số liệu thuộc khoảng u2 gồm giá trị: 14696 Như tổng số liệu thuộc khoảng u1, u2 nhóm (3*2+1) = trọng số ngữ nghĩa SA1 theo nhãn ngữ nghĩa A1 WSA1A1 = / (3*2+1) = 3/7 Tương tự tính trọng số ngữ nghĩa SA2 theo nhãn ngữ nghĩa A1 WSA2A1 = 1/7 Với SA1 = 0.125, SA2 = 0.25, ngữ nghĩa nhóm là: (SA1, SA1, SA2) = WSA1A1*SA1 + WSA1A1*SA1 + WSA2A1*SA2 = (3/7)*0.125 + (3/7)*0.125 + (1/7)*0.25 = 0.143 Đoạn giải nghĩa dự báo chọn cho năm 1972 theo Bảng 3.1 [13000 – 17000] Trước hết tinh toán giá trị giải nghĩa tuyến tính cho phép ngữ nghĩa hóa phi tuyến theo (3.20d1) với sp=0.3: Trường Đại học Thăng Long 40 Kỷ yếu công trình khoa học 2015 - Phần I Denormalization (f(xs,sp))=f(0.143,0.3)=(0.3*0.143*(1-0.143)+0.143)*(17000-13000) + 13000 = 13719 Tiếp tục tính giá trị giải nghĩa phi tuyến cho phép ngữ nghĩa hóa phi tuyến theo (3.20d) với dp = -0.2: Nonlinear Denormalization (f(xs,sp )) = g(13719,-0.2) 13000)*(17000-13719) / (17000-13000) + 13719 = 13600 = (-0.2)*(13719- Như vậy, giá trị dự báo cho năm 1972 theo (3.20d) là: DSA1 → Nonlinear DeNormalization (f(xs,sp )) = g(13719,-0.2) = 13600 Bằng cách tương tự tính toán dự báo cho năm 1973, 1974… để nhận giá trị dự báo cụ thể cho năm 1973, 1974, …, 1992 Như với số sinh viên nhập học từ 1971 đến 1992, sở bước theo tiếp cận ĐSGT, xây dựng mô hình dự báo cho năm 1971 → 1972 , 1972 → 1973, … , 1991 → 1992 Chương trình tính toán sở sử dụng MATLAB R2013a Kết mô hình dự báo sử dụng ĐSGT mô tả Bảng 3.2 để so sánh với kết số mô hình dự báo khác có với khoảng chia Trong trường hợp phép ngữ nghĩa hóa phi tuyến phép giải nghĩa phi tuyến với sp = 0.3 dp = - 0.2, kết tính toán nhận MSE = 65020 Bảng 3.2: So sánh phương pháp dự báo với khoảng chia Năm Số sinh viên nhập học Phương pháp Chen [4] Phương pháp Lee [9] Phương pháp ĐSGT 1971 13055 1972 13563 14000 13833 13600 1973 13867 14000 13833 13750 1974 14696 14000 13833 14050 1975 15460 15500 15500 15396 1976 15311 16000 15722 15232 1977 15603 16000 15722 15642 1978 15861 16000 15722 16232 1979 16807 16000 15722 16643 1980 16919 16833 16750 17027 1981 16388 16833 16750 16533 1982 15433 16833 16750 15533 1983 15497 16000 15722 15642 Trường Đại học Thăng Long 41 Kỷ yếu công trình khoa học 2015 - Phần I 1984 15145 16000 15722 15232 1985 15163 16000 15722 15232 1986 15984 16000 15722 16232 1987 16859 16000 15722 16643 1988 18150 16833 16750 17534 1989 18970 19000 19000 19288 1990 19328 19000 19000 19466 1991 19337 19000 19000 19466 1992 18876 19000 19000 19111 407507 397537 65020 MSE MÔ HÌNH DỰ BÁO TỐI ƯU THEO TIẾP CẬN ĐSGT Vấn đề dự báo tối ưu chuỗi thời gian mờ theo nghĩa cực tiểu sai số trung bình bình phương MSE thực sở 46 tham số sau: tham số sp phép ngữ nghĩa hóa (3.19d), tham số dp phép giải nghĩa (3.20d) , 21 tham số giá trị đầu, 21 giá trị cuối đoạn giải nghĩa tương ứng với 21 điểm dự báo tham số θ, α ĐSGT Chương trình tính toán sở sử dụng phần mềm tối ưu hóa GA MATLAB R2013a Kết mô hình dự báo dựa ĐSGT với tham số θ, α, sp, dp 42 giá trị đầu, giá trị cuối đoạn giải nghĩa tìm tối ưu theo nghĩa cực tiểu hàm MSE kết mô tả Bảng 4.1, MSE có dạng: 21 MSE = (∑ ( SSVNHTTi − SSVNHDBi )) / 21 ( 4.1 ) i =1 Ở đây: MSE (Mean Square Error) sai số trung bình bình phương; SSVNHTTi số sinh viên nhập học thực tế năm i; SSVNHDBi số sinh viên nhập học dự báo năm i Bảng 4.1 Kết tính toán dự báo tối ưu số sinh viên nhập học trường đại học Alabama từ 1971 đến 1992 theo tiếp cận ĐSGT Bộ tham số tối ưu nhận được: θ* = 0.317; α* =0.382; sp* = 0.375 dp* = 0.418 với MSE= 35718 Năm Số sinh viên nhập học thực tế 1971 13055 1972 13563 Trường Đại học Thăng Long Số sinh viên nhập học dự báo 13574 Năm Số sinh viển nhập học thực tế Số sinh viên nhập học dự báo 1982 15433 16031 1983 15497 15498 42 Kỷ yếu công trình khoa học 2015 - Phần I 1973 13867 13866 1084 15145 15146 1974 14696 14644 1985 15163 15164 1975 15460 15461 1986 15984 15983 1976 15311 15310 1987 16859 16858 1977 15603 15602 1988 18150 17526 1978 15861 15860 1989 18970 18971 1979 16807 16806 1990 19328 19329 1980 16919 16918 1991 19337 19338 1981 16388 16389 1992 18876 18877 Mô hình dự báo chuỗi thời gian mờ tối ưu theo tiếp cận ĐSGT ứng dụng cho toán dự báo số sinh viên nhập học trường đại học Alabama so sánh với mô hình dự báo khác theo tiếp cận mờ sử dụng bậc cao, số khoảng lớn 7, tổng hợp Bảng 4.2 Bảng 4.2 So sánh kết mô hình dự báo tối ưu theo tiếp cận ĐSGT kết mô hình dự báo cải tiến khác Phương Pháp MSE Pedryczc 198203 (7 khoảng ) Witold [23] 66689 (17 khoảng) Tối ưu PSO (2015) Bai [14] (2011) bậc 14544 (22 khoảng) 140676 Phương Pháp MSE Ozdemir [12] Tối ưu 78073 độ dài khoảng kết hợp mạng nơron (2012) Singh[21] 3(2007) bậc 87025 Uslu [20] tối ưu 106276 DEA (2013) Egrioglu [13] (2010) 60714 Huarng [10] độ dài 78792 khoảng khác hiệu (2001) Tiếp cận ĐSGT 35718 sp* = 0.375 dp* = 0.418 θ* = 0.317; =0.382 α* KẾT LUẬN Vấn đề dự báo chuỗi thời gian mờ năm gần nhiều chuyên gia giới quan tâm nghiên cứu Nhiều nghiên cứu sử dụng mô hình chuỗi thời gian mờ bậc cao với độ dài khoảng số lượng khoảng hợp lý cho kết dự báo số sinh viên nhập học trường Đại học Alabama xác [7, 12, 13, 21] Mô hình dự báo dựa ĐSGT Trường Đại học Thăng Long 43 Kỷ yếu công trình khoa học 2015 - Phần I mô hình mới, hoàn toàn khác biệt, có khả dự báo chuỗi thời gian mờ với độ xác cao so với số mô hình dự báo có Sự khác biệt thể phương pháp luận lần sử dụng phép ngữ nghĩa hóa phi tuyến thay cho phép mờ hóa, nhóm quan hệ ngữ nghĩa thay cho nhóm quan hệ mờ phép giải nghĩa phi tuyến thay cho phép giải mờ Mặc dù sử dụng mô hình chuỗi thời gian mờ bậc với khoảng chia liệu lịch sử mô hình dự báo Chen [4], kết ứng dụng mô hình dự báo dựa ĐSGT với tham số hóa nhãn ngữ nghĩa từ (3.21) đến (3.27) biến ngôn ngữ ( thể Bảng 3.3 ) cho thấy rõ hiệu dự báo tốt so với số phương pháp dự báo sử dụng khoảng có [4, 9] Hơn nữa, mô hình dự báo với tham số tối ưu ĐSGT (Bảng 4.2) tốt so với số mô hình sử dụng nhiều kỹ thuật phức tạp khác mô hình dự báo chuỗi thời gian mờ bậc cao, số khoảng chia lớn [13, 14, 21], số mô hình dự báo tối ưu khác [10, 12, 20, 23] Rõ ràng rằng: tính xác mô hình dự báo tối ưu sai số trung bình bình phương MSE sử dụng ĐSGT so với số mô hình dự báo tối ưu khác đảm bảo khả tối ưu tham số ĐSGT θ*, α* kết hợp với tham số mở rộng phép ngữ nghĩa hóa phi tuyến sp* phép giải nghĩa phi tuyến dp* với 42 tham số đoạn giải nghĩa sơ sở khai thác toàn diện có tính hệ thống thông tin ẩn chứa nhóm quan hệ ngữ nghĩa Những kết báo mở hướng nghiên cứu cho lĩnh vực dự báo chuỗi thời gian mờ TÀI LIỆU THAM KHẢO [1] Song Q, Chissom B.S Fuzzy time series and its models Fuzzy Sets and Syst 54 269–277, 1993 [2] Song Q, Chissom B.S, Forecasting enrollments with fuzzy time series – part Fuzzy Sets and Syst 54, 1–9, 1993 [3] Song Q, Chissom, B S, Forecasting enrollments with fuzzy time series – part Fuzzy Sets and Syst 62, 1–8, 1994 [4] Chen, S.M, Forecasting Enrollments Based on Fuzzy Time Series Fuzzy Sets and Syst 81, 311–319, 1996 [5] Chen S M and Wang N Y, Fuzzy Forecasting Based on Fuzzy-Trend Logical Relationship Groups IEEE TRANSACTIONS ON SYSTEMS, MAN, AND CYBERNETICS—PART B: CYBERNETICS, VOL 40, NO 5, 1343-1358, 2010 [6] Chen S.M, Chen C D, Handling forecasting problems based on high-order fuzzy logical relationships Expert Systems with Applications 38, 3857–3864, 2011 [7] Chen S M, Forecasting Enrollments based on High Order Fuzzy Time Series Cybernetics and Systems: An International Journal 33,1-16, 2002 [8] Chen S.M and Chung N.Y, Forecasting enrollments using high-order fuzzy time series and genetic algorithms, Int Journal of Intelligent Systems 21, 485-501 2006 [9] Lee M H, Efendi R, Ismad Z, Modified Weighted for Enrollments Forecasting Based on Fuzzy Time Series MATEMATIKA, 25(1), 67-78, 2009 [10] Huarng K, Effective lengths of intervals to improve forecasting in fuzzy time series Fuzzy Sets and Systems 123 387–394, 2001 Trường Đại học Thăng Long 44 Kỷ yếu công trình khoa học 2015 - Phần I [11] Nguyễn Công Điều: Một thuật toán cho mô hình chuỗi thời gian mờ Tạp chí KHOA HỌC VÀ CÔNG NGHỆ, Tâp 49, Số 4, 11-25, 2011 [12] Ozdemir O, Memmedli M, Optimization of Interval Length for Neural Network Based Fuzzy Time Series IV International Conference “Problems of Cybernetics and Informatics”, September 12-14, 104-105, 2012 [13] Egrioglu E, Aladag C H, Yolcu U, Uslu V R, Basaran M A, Finding an optimal interval length in high order fuzzy time series Expert Systems with Applications 37 5052– 5055, 2010 [14] Bai E, Wong W K, Chu W C, Xia M and Pan F, A heuristic time invariant model for fuzzy time series forecasting Expert Systems with Applications, 38, 2701-2707, 2011 [15] Ho N C and Wechler W, Hedge algebras: An algebraic approach to structures of sets of linguistic domains of linguistic truth variable, Fuzzy Sets and Systems, Vol 35,3, 281293, 1990 [16] Nguyen Cat Ho, Vu Nhu Lan, Le Xuan Viet, Optimal hedge-algebras-based controller: Design and Application, Fuzzy Sets and Systems 159, 968– 989, 2008 [17] Nguyen C.H, Huynh V.N, Pedrycz W, A Construction of Sound Semantic Linguistic Scales Using 4-Tuple Representation of Term Semantics, Int J Approx Reason 55 763–786, 2014 [18] Dinko Vukadinović, Mateo Bašić, Cat Ho Nguyen, Nhu Lan Vu, Tien Duy Nguyen, Hedge-Algebra-Based Voltage Controller for a Self-Excited Induction Generator, Control Engineering Practice, 30, 78–90, 2014 [ 19] Hai-Le Bui , Cat-Ho Nguyen, Nhu-Lan Vu, Cong-Hung Nguyen, General design method of hedge-algebras-based fuzzy controllers and an application for structural active control Applied Intelligence, Vol 43, N 2, 251-275, 2015 [20] Uslu V R, Bas, E Yolcu U, Egrioglu E, A New Fuzzy Time Series Analysis Approach by using Differential Evolution Algorithm and Chronologically-Determined Weights Vol 2, No.1, 18-30, 2013 [21] Singh S R, A robust method of forecasting based on fuzzy time series.Applied Mathematics and Computation 188, 427-484, 2007 [22] Hwang, J.-R., Chen, S.-M., Lee, C.-H : Handling Forecasting problems using fuzzy time series Fuzzy Sets and Systems 100, 217-228, 1998 [23] Lua W, Chen X, Pedryczc W, Liu X, Yang J, Using interval information granules to improve forecasting in fuzzy time series International Journal of Approximate Reasoning, 57, 1–18, 2015 FUZZY TIME SERIES FORECASTING BASED ON HEDGE ALGEBRAS Tran Quang Duy, Nguyen Cong Dieu, Vu Nhu Lan Abstract: Fuzzy time series has been firstly proposed by Song & Chissom (1993) and widely studied for forecasting purposes now However, the accuracy of forecasts based on the concept of fuzzy approach of Song & Chissom is not high because of such depends on very Trường Đại học Thăng Long 45 Kỷ yếu công trình khoa học 2015 - Phần I many factors Chen (1996) proposed an efficient fuzzy time series model which consists of simple arithmetic calculations only After that, this has been widely studied for improving accuracy of forecasting in many applications to get better results The hedge algebras developed by Nguyen and Wechler (1990) was completely different from the fuzzy approach Fuzzy time series method generally embodies three stages such as fuzzification, determination of fuzzy relations and defuzzification stages In hedge algebras, instead of performing fuzzification and defuzzification, more simple methods are adopted, termed as semantization and desemantization, respectively In this paper, we present a new approach using hedge algebras to provide a computational model, which is completely different from the fuzzy approach for fuzzy time series forecasting The experimental results of forecasting enrollments of students of the University of Alabama show that the model of fuzzy time series based on hedge algebras is better than many existing models Keywords: Fuzzy Sets, Fuzzy Logical Relationship Groups, Hedge Algebras, Fuzzy Time Series Forecasting Trường Đại học Thăng Long 46

Dự báo chuỗi thời gian mờ dựa trên đại số gia tử

Thông tin tài liệu

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan