Nghiên cứu cải tiến phương pháp phân tích chuỗi thời gian mở và ứng dụng dự báo sinh viên nhập học

47 209 0
Nghiên cứu cải tiến phương pháp phân tích chuỗi thời gian mở và ứng dụng dự báo sinh viên nhập học

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

LỜI CẢM ƠN Chúng xin gửi lời cảm ơn tới nhóm seminar Đại số gia tử Viện Cơng nghệ thông tin, Viện Hàn lâm Khoa học Công nghệ Việt Nam có góp ý quý báu, cung cấp nhiều kiến thức để chúng tơi hồn thiện hiểu biết trình nghiên cứu Chúng xin gửi lời cảm ơn chân thành tới tập thể Bộ mơn Kỹ thuật máy tính - Mạng, Khoa Toán - Lý - Tin, Trường Đại học Tây Bắc đóng góp nhiều ý kiến thiết thực, tạo điều kiện để chúng tơi hồn thành đề tài NHÓM TÁC GIẢ MỤC LỤC PHẦN MỞ ĐẦU 1 Lý chọn đề tài Mục đích, nhiệm vụ nghiên cứu Đối tượng nghiên cứu Phạm vi nghiên cứu Phương pháp nghiên cứu Cấu trúc đề tài CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN DỰ BÁO VÀ DỮ LIỆU CHUỖI THỜI GIAN 1.1 Khái quát dự báo 1.1.1 Khái niệm dự báo 1.1.2 Tính chất dự báo 1.1.3 Các phương pháp dự báo 1.1.4 Chức vai trò dự báo 1.2 Chuỗi thời gian 1.2.1 Khái niệm chuỗi thời gian 1.2.2 Phân tích chuỗi thời gian dự báo 1.2.3 Mô hình ARMA Chương 2: CÁC PHƯƠNG PHÁP DỰ BÁO CHUỖI THỜI GIAN MỜ 12 2.1 Lý thuyết tập mờ 12 2.1.1 Tập mờ 12 2.1.2 Biến ngôn ngữ 12 2.1.3 Số mờ 13 2.1.3 Các phép toán tập mờ 16 2.1.5 Giải mờ 20 2.2 Suy diễn mờ 23 2.2.1 Kiến trúc hệ suy diễn mờ 23 2.2.2 Các bước suy diễn mờ 25 2.2.3 Một số phương pháp suy diễn hệ mờ 25 2.3 Chuỗi thời gian mờ 26 2.3.1 Một số khái niệm chuỗi thời gian mờ 26 2.3.2 Mơ hình dự báo Song Chissom 27 2.3.3 Mơ hình dự báo Chen 28 2.3.4 Luật dự báo chuỗi thời gian mờ 28 Chương 3: CẢI TIẾN PHƯƠNG PHÁP DỰ BÁO CHUỖI THỜI GIAN MỜ VÀ ỨNG DỤNG DỰ BÁO SINH VIÊN NHẬP HỌC TẠI TRƯỜNG ĐẠI HỌC TÂY BẮC 30 3.1 Một số khái niệm đại số gia tử ứng dụng tron toán dự báo 30 3.2 Ứng dụng phương pháp dự báo chuỗi thời gian mờ sử dụng đại số gia tử vào toán dự báo số lượng sinh viên nhập học Trường Đại học Tây Bắc 34 3.3 Tối ưu tham số mơ hình dự báo chuỗi thời gian sử dụng đại số gia tử 39 KẾT LUẬN VÀ KIẾN NGHỊ 41 TÀI LIỆU THAM KHẢO 42 DANH MỤC HÌNH ẢNH Hình 1.1: Biến động tỷ giá USD/VND thị trường Hình 1.2: Biểu đồ giá vàng qua tháng Hình 2.1: Số mờ Singleton 14 Hình 2.2: Số mờ tam giác 14 Hình 2.3: Bài toán độ tuổi theo số mờ tam giác 15 Hình 2.4: Số mờ hình thang 15 Hình 2.5: Bài tốn nhiệt độ theo số mờ hình thang 16 Hình 2.6: Số mờ hình Gaussian 16 Hình 2.7: Hàm thuộc tập mờ A 17 Hình 2.8: Hàm thuộc tập mờ ¬ A(x) 17 Hình 2.9: Tuyển hai tập mờ theo S(x,y) = max(x,y) 17 Hình 2.10: Tuyển hai tập mờ theo S(x,y) = (1,x+y) 18 Hình 2.11: Tuyển hai tập mờ theo S(x,y) = x+y+x.y 18 Hình 2.12: Hàm thuộc hai tập mờ A,B 18 Hình 2.13: Hội hai tập mờ theo T(x,y) = min(x,y) 19 Hình 2.14: Hội hai tập mờ theo T(x,y) = x.y 19 Hình 2.15: Giải mờ phương pháp 21 Hình 2.16: Giải mờ phương pháp trung bình 21 Hình 2.17: Giải mờ theo phương pháp trung bình tâm 22 Hình 2.18: Hàm thuộc hợp thành dạng đối xứng 22 Hình 2.19: Cấu trúc hệ suy diễn mờ 24 Hình 3.1: Biểu đồ so sánh kết dự báo 38 Hình 3.2: Biểu đồ so sánh kết dự báo sau tối ưu 40 PHẦN MỞ ĐẦU Lý chọn đề tài Bài toán dự báo chuỗi thời gian nhiều tác giả nước nước quan tâm nghiên cứu [5,6,7,8,9,10,11,14,15] Việc dự báo liệu tương lai tham vọng người nhằm đốn biết trước kết từ có giải pháp trước để hoạch định tốt công việc Chuỗi thời gian mờ Q Song B.S Chissom lần đề cập tới nghiên cứu năm 1993 [1,2] Chuỗi thời gian mờ cơng cụ hữu hiệu để dự đốn liệu thu thập ngôn ngữ tự nhiên, khơng cịn cho thấy ưu điểm vượt trội sử dụng cho liệu có biến động lớn giá cổ phiếu thị trường chứng khoán [7,8] Kể từ giới thiệu nay, nhiều cơng trình nghiên cứu đề xuất nhằm nâng cao tính xác kết dự báo giảm bớt độ phức tạp tính toán toán [7,8,9,10,11] Đại số gia tử (ĐSGT) N Cat Ho W Wechler giới thiệu năm 1990 [12] nhằm đưa mơ hình tốn học phù hợp với liệu khơng chắn, theo giá trị ngữ nghĩa ngôn ngữ nằm trật tự định thứ tự tạo nên giá trị ngữ nghĩa từ ngôn ngữ Đại số gia tử ứng dụng tốn điều khiển, hồi quy, trích rút tri thức, tính tốn từ… cho nhiều kết tốt [16,17,18,19,20] Trong nghiên cứu chúng tơi tìm kiếm giải pháp cải tiến mơ hình dự báo chuỗi thời gian mờ, cụ thể việc áp dụng lý thuyết đại số gia tử vào mơ hình Các kết dự báo thực nghiệm áp dụng dự báo số lượng sinh viên nhập học Trường Đại học Tây Bắc đưa thảo luận nhằm cho thấy tính hiệu mơ hình đề xuất Mục đích, nhiệm vụ nghiên cứu - Nghiên cứu toán dự báo liệu chuỗi thời gian - Nghiên cứu lý thuyết tập mờ khả ứng dụng - Nghiên cứu phương pháp dự báo chuỗi thời gian mờ - Thử nghiệm dự báo với liệu sinh viên nhập học Trường Đại học Tây Bắc Đối tượng nghiên cứu - Bài toán dự báo chuỗi thời gian mờ Phạm vi nghiên cứu - Nghiên cứu ứng dụng toán dự báo chuỗi thời gian mờ vào dự báo liệu sinh viên nhập học Trường Đại học Tây Bắc Phương pháp nghiên cứu - Phương pháp phân tích, tổng hợp tài liệu - Phương pháp thực nghiệm Cấu trúc đề tài Đề tài gồm ba phần: - Phần 1: Phần mở đầu - Phần 2: Phần nội dung đề tài gồm chương: Chương 1: Tổng quan toán dự báo liệu chuỗi thời gian Chương 2: Các phương pháp dự báo chuỗi thời gian mờ Chương 3: Cải tiến phương pháp dự báo chuỗi thời gian mờ ứng dụng dự báo sinh viên nhập học Trường Đại học Tây Bắc - Phần 3: Kết luận kiến nghị CHƯƠNG 1: TỔNG QUAN VỀ BÀI TOÁN DỰ BÁO VÀ DỮ LIỆU CHUỖI THỜI GIAN 1.1 Khái quát dự báo 1.1.1 Khái niệm dự báo Dự báo tiên đốn có khoa học, mang tính chất xác suất mức độ, nội dung, mối quan hệ, trạng thái, xu hướng phát triển đối tượng nghiên cứu cách thức thời hạn đạt mục tiêu định đề tương lai Dự báo kết kết hợp phân tích định tính phân tích định lượng q trình cần dự báo Chỉ có dự báo khoa học đảm bảo độ tin cậy cao sở vững cho việc thông qua định quản lý khoa học Ngày vai trò dự báo lĩnh vực đời sống, xã hội ngày quan trọng nâng lên đáng kể 1.1.2 Tính chất dự báo - Dự báo mang tính xác suất: Mỗi đối tượng dự báo vận động theo quy luật, quỹ đạo định Đồng thời q trình phát triển ln chịu tác động từ mơi trường hay yếu tố bên ngồi mà yếu tố tác động khơng phải đứng im mà vận động phát triển khơng ngừng Chính dù trình độ dự báo có hồn thiện đến đâu khơng thể chắn kết dự báo hồn tồn xác, tồn trường hợp không lường trước tương lai - Dự báo đáng tin cậy: Mặc dù dự báo mang tính xác suất đáng tin cậy Vì dựa sở lý luận phương pháp luận khoa học Ngày nay, phương pháp công cụ xử lý thông tin ngày đại giúp cho việc tính tốn, phân tích đơn giản, xác độ tin cậy dự báo không ngừng nâng cao - Dự báo mang tính đa phương án: Dự báo thực giả thiết dự báo có điều kiện Tập hợp giả thiết để dự báo gọi phơng dự báo Mỗi dự báo tiến hành phông dự báo khác nguyên nhân chủ quan khách quan khác Tính đa phương án mặt thuộc tính khách quan dự báo mặt khác lại phù hợp với u cầu cơng tác quản lý, làm cho việc định đạo thực định quản lý trở nên linh hoạt hơn, dễ thích nghi với biến đổi vơ phức tạp tình hình thực tế 1.1.3 Các phương pháp dự báo Theo học giả Gordon, hai thập kỷ gần đây, có tám phương án dự báo áp dụng rộng rãi giới sau: Tiên đoán (Genius forecasitng) Ngoại suy xu hướng (Trend extrapolation) Phương pháp chuyên gia (Consensus methods) Phương pháp mô (Stimulation) Phương pháp kịch (Scenarion) Phương pháp định (Decision trees) Phương pháp ma trận tác động qua lại (Cross-impact matrix method) Phương pháp dự báo tổng hợp (Combining methods) Tuy nhiên theo phân loại Việt Nam phương pháp dự báo thường chia thành hai nhóm là: Phương pháp định tính phương pháp định lượng 1.1.3.1 Phương pháp định tính Phương pháp dựa sở nhận xét yếu tố liên quan, dựa ý kiến khả có liên hệ yếu tố liên quan tương lai Từ việc khảo sát ý kiến tiến hành cách khoa học để nhận biết kiện tương lai hay từ ý kiến phản hồi nhóm đối tượng hưởng lợi (chịu tác động) mà phương pháp định tinh có liên quan đến mức độ phức tạp khác 1.1.3.2 Phương pháp định lượng Mơ hình dự báo định lượng dựa số liệu khứ, số liệu giả sử có liên quan đến tương lai tìm thấy Tất mơ hình dự báo theo định lượng sử dụng thơng qua chuỗi thời gian giá trị quan sát đo lường giai đoạn theo chuỗi Hiện nay, để nâng cao mức độ xác dự báo người ta thường kết hợp hai phương pháp định tính định lượng Bên cạnh đó, vấn đề cần dự báo thực thông qua phương pháp dự báo đơn lẻ mà đòi hỏi kết hợp nhiều phương pháp nhằm mô tả chất việc cần dự báo 1.1.4 Chức vai trò dự báo 1.1.4.1 Chức dự báo Theo quan điểm triết học, dự báo hình thức nhận thức giới, nhận thức xã hội Nó có hai chức bản: - Chức tham mưu: sở đánh giá thực trạng, phân tích xu hướng vận động phát triển khứ, tương lai, dự báo cung cấp thông tin cần thiết, khách quan làm cho việc định quản lý xây dựng chiến lược, kế hoạch hóa chương trình, dự án,…người quản lý hoạch định chiến lược, người lập kế hoạch có nhiệm vụ lựa chọn số phương án có, tìm phương án có tính khả thi cao nhất, có hiệu Để thực tốt chức dự báo phải thật đảm bảo tính khách quan, khoa học tính độc lập tương quan quản lý hoạch định sách - Chức khuyến nghị hay điều chỉnh: Với chức dự báo tiên đoán hậu nảy sinh q trình thực sách kinh tế -xã hội nhằm giúp quan chức kịp thời điều chỉnh mục tiêu chế tác động quản lý để đạt hiệu kinh tế - xã hội cao 1.1.4.2 Vai trò dự báo Trong kinh tế thị trường, công tác dự báo vô quan trọng lẽ cung cấp thơng tin cần thiết nhằm phát bố trí sử dụng nguồn lực tương lai cách có thực tế Với thông tin mà dự báo đưa cho phép nhà hoạch định sách có định đầu tư, định sản xuất, tiết kiệm tiêu dùng, sách tài chính, sách kinh tế vĩ mơ Dự báo không tạo sở khoa học cho việc hoạch định sách, cho việc xây dựng chiến lược phát triển, cho quy hoạch tổng thể mà cho phép xem xét khả thực kế hoạch hiệu chỉnh kế hoạch Sử dụng mơ hình dự báo hoạt động quản lý quan trọng, tạo điều kiện khơng cung cấp thơng tin tương lai mà cịn có khả làm chủ cơng tác quản lý Nhờ có mơ hình dự báo mà tăng cường khả quản lý cách khoa học Giúp nhận thức sâu sắc quy luật khách quan, tránh tính chủ quan 1.2 Chuỗi thời gian 1.2.1 Khái niệm chuỗi thời gian Một chuỗi thời gian dãy giá trị quan sát X:={x1, x2,……… xn} xếp thứ tự diễn biến thời gian với x1 giá trị quan sát thời điểm đầu tiên, x2 quan sát thời điểm thứ xn quan sát thời điểm thứ n Ví dụ: Thống kê số lượng sinh viên hệ đại học quy nhập học Trường Đại học Tây Bắc qua năm, ta có x1 = 672 giá trị quan sát thời điểm thứ tức năm 2004, x2 = 1007 giá trị quan sát thời điểm thứ tức năm 2005 x = 680 giá trị quan sát thời điểm thứ 14 tức năm 2017 10 STT Khóa Năm Tổng số SV K45 2004 672 K46 2005 1007 K47 2006 1271 K48 2007 1588 K49 2008 1481 K50 2009 1692 K51 2010 1814 K52 2011 1995 K53 2012 1653 10 K54 2013 1640 11 K55 2014 1129 12 K56 2015 1246 13 K57 2016 902 14 K58 2017 680 Bảng 1: Thống kê số lượng sinh viên hệ Đại học quy nhập học Trường Đại học Tây Bắc Các báo cáo tài mà ta thấy ngày phương tiên truyền thông như: báo, tivi, internet… số chứng khoán, tỷ giá tiền tệ, số tiêu dùng… Đó thể thực tế chuỗi thời gian Trong thí dụ trên, thứ tự thời gian quan sát thực đóng vai trị quan trọng, hầu hết kỹ thuật thống kê cổ điển có tác dụng cần phải đề xuất kỹ thuật tính tốn để bộc lộ nét đặc thù chuỗi thời gian Nếu Ak trống, có nghĩa Aj → ∅ Aj có mức độ thuộc cao khoảng uj, đầu dự báo điểm uj Nếu tồn quan hệ - nhiều nhóm quan hệ mờ Aj , ký hiệu Aj→ A1 , A2 ,…, An, mức độ thuộc cao A1 , A2 ,…, An khoảng u1 , u2 ,…, un tương ứng, đầu dự báo tính trung bình điểm m1 , m2,…,mn u1 , u2,…, un Đầu dự báo có dạng: (m1+m2+…+mn)/n 29 Chương 3: CẢI TIẾN PHƯƠNG PHÁP DỰ BÁO CHUỖI THỜI GIAN MỜ VÀ ỨNG DỤNG DỰ BÁO SINH VIÊN NHẬP HỌC TẠI TRƯỜNG ĐẠI HỌC TÂY BẮC Trong phần chúng tơi trình bày tóm tắt lý thuyết đại số gia tử [12], quan trọng cơng thức để xác định mơ hình tính tốn đại số gia tử bao gồm phép ngữ nghĩa hóa giải ngữ nghĩa hóa Đây sở để ứng dụng đại số gia tử toán dự báo chuỗi thời gian mờ Đồng thời, phần trình bày cải tiến phương pháp dự báo chuỗi thời gian mờ sử dụng mơ hình tính tốn đại số Việc áp dụng phương pháp cải tiến vào liệu số lượng sinh viên hệ đại học quy nhập học Trường Đại học Tây Bắc từ năm 2004 đến năm 2017 trình bày kết dự báo thảo luận 3.1 Một số khái niệm đại số gia tử ứng dụng tron toán dự báo Gọi AX = (X, G, C, H, ≤ ) cấu trúc đại số, với X tập AX; G = {c–, c+} tập phần tử sinh; C = {0, W, 1}, 0, W tương ứng phần tử đặc trưng cận trái (tuyệt đối nhỏ), trung hòa cận phải (tuyệt đối lớn); H tập toán tử gọi gia tử; ≤ biểu thị quan hệ thứ tự giá trị ngôn ngữ Gọi H− tập hợp gia tử âm H+ tập hợp gia tử dương AX Ký hiệu H− = {h−1, h−2, …, h−q}, h−1< h−2< … < h−q H+ = {h1, h2, …, hp}, h1 < h2 < … < hp Định nghĩa 3.1: (Độ đo tính mờ) fm: X → [0, 1] gọi độ đo tính mờ thỏa mãn điều kiện sau: +) fm(c−) + fm(c+) = ∑h ∈H fm(hx) = fm(x) với ∀x ∈X +) Với phần tử 0, W 1, fm(0) = fm(W) = fm(1) = +) Và với ∀x,y ∈ X, ∀h∈H, fm(hx) fm(hy) = fm(x) fm( y) Đẳng thức không phụ thuộc vào phần tử x, y ta ký hiệu µ(h) độ đo tính mờ gia tử h Tính chất fm(x) µ(h) sau: +) fm(hx) = µ(h)fm(x), ∀x∈X +) ∑ p i=−q,i≠0 fm(hi c) = fm(c) với c∈{c–, c+} 30 +) ∑ +) ∑ p i=−q,i≠0 −q i=−1 fm(hi x) = fm(x) µ(hi ) = α ∑ p i=1 µ(hi ) = β với α, β > α + β = Định nghĩa 3.2: (Hàm dấu) Hàm sign: X → {−1,0,1} ánh xạ gọi hàm dấu với h,h'∈H − + c ∈{c ,c } đó: +) sign(c − ) = −1, sign(c + ) = +1; +) sign(hc) = −sign(c), h âm c; +) sign(hc) = +sign(c), h dương c; +) sign(h'hc) = −sign(hc), h’hx ≠ hx h’ âm h; +) sign(h'hc) = +sign(hc), h’hx ≠ hx h’ dương h; +) sign(h'hx) = 0, h’hx = hx Định nghĩa 3.3: (Giá trị ngữ nghĩa định lượng) Gọi fm độ đo tính mờ X, ánh xạ ngữ nghĩa định lượng ν: X → [0, 1], sinh fm X, xác định sau: +) v(W) = θ = fm(c − ) +) v(c − ) = θ − α fm(c − ) = β fm(c − ) +) v(c + ) = θ + α fm(c + ) = 1− β fm(c + ) +) v(hj x) = v(x)+ sign(hj x)[∑ i=sign( j ) fm(hi x) − ω (hj x) fm(hj x)] j với ω (hj x) = [1+ sign(hj x).sign(hphj x)( β − α )]∈{α , β }, j ∈[−q,p], j ≠ Ngữ nghĩa hóa (Semantization) giải ngữ nghĩa hóa (Desemantization): Để thuận tiện cho việc biểu diễn ngữ nghĩa giá trị ngôn ngữ, giả sử miền tham chiếu thông thường biến ngôn ngữ X đoạn [a, b] miền tham chiếu ngữ nghĩa Xs đoạn [as,bs] (0 ≤ as < bs ≤ 1) Việc chuyển đổi tuyến tính từ [a, b] sang [as,bs] gọi phép ngữ nghĩa hóa tuyến tính (Linear Semantization) cịn việc chuyển ngược lại từ đoạn [as,bs] sang [a, b] gọi phép giải nghĩa tuyến tính (Linear Desemantization) Trong nhiều ứng dụng ĐSGT sử dụng miền ngữ nghĩa đoạn [as=0, bs=1], phép ngữ nghĩa hóa tuyến tính gọi phép chuẩn hóa (Linear Semantization = Normalization) phép giải nghĩa tuyến tính 31 gọi phép giải chuẩn (Linear Desemantization = Denormalization) Như biểu diễn phép ngữ nghĩa hóa tuyến tính phép giải nghĩa tuyến tính đơn giản sau: • Linear Semantization (x) = xs = as + (bs – as) (x – a) / (b – a) • Linear Desemantization (xs) = x = a + (b – a)(xs – as) / (bs – as) • Normalization (x) = xs = (x – a) / (b – a) • Denormalization (xs) = x = a + (b – a)xs a, b số thực Nhiều ứng dụng ĐSGT lĩnh vực khoa học đòi hỏi mở rộng không gian tham số phép ngữ nghĩa hóa phép giải nghĩa để có nhiều tham số lựa chọn mềm dẻo Điều có mở rộng phép ngữ nghĩa hóa phép giải nghĩa từ tuyến tính đến phi tuyến Tương tự trên, phép ngữ nghĩa hóa phi tuyến phép giải nghĩa phi tuyến biểu diễn sau: • Nonlinear Semantization (x) = f(xs,sp) Với điều kiện: ≤ f(xs,sp) ≤ f(xs=0,sp) = f(xs=1,sp) = • Nonlinear Desemantization (xs) = g(x,dp) Với điều kiện: a ≤ g(x,dp) ≤ b, g(x = a,dp) = a g(x = b,dp) = b Các hàm f(.) g(.) chọn tùy theo ứng dụng hàm liên tục, đồng biến, sp∈[−1, 1] tham số ngữ nghĩa hóa, dp ∈[−1, 1] tham số giải nghĩa Ví dụ chọn f(.) phi tuyến theo xs thể qua f(xs,sp) g(.) phi tuyến theo x thể qua Denormalization (f(xs,sp)) sau: • f(xs,sp) = sp*xs*(1 − xs)+xs • g(x,dp) = dp*((Denormalization (f(xs,sp)) – a)*(b – Denormalization (f(xs,sp))) / (b − a) + Denormalization (f(xs,sp)) Denormalization (f(xs,sp)) = (sp*x*(1 − x)+x )*(b − a) + a Hàm f(xs,sp) hàm biểu diễn ngữ nghĩa phi tuyến phép giải nghĩa phi tuyến g(x.dp) chưa sử dụng ứng dụng ĐSGT Lưu ý rằng: chọn hàm f(xs,sp) g(x,dp) độc lập với Khi sp = dp = tính phi tuyến bị loại bỏ Cho trước độ đo tính mờ gia tử µ(h) giá trị độ đo tính mờ phần tử sinh fm(c-), fm(c+) θ phần tử trung hồ (neutral) Khi mơ hình tính tốn ĐSGT xây dựng sở biểu thức kích hoạt thực 32 tế sử dụng hiệu nhiều ứng dụng Phép mờ hóa phép giải mờ tiếp cận mờ thay tương ứng phép ngữ nghĩa hóa phép giải nghĩa tiếp cận ĐSGT Hệ luật thể siêu mặt làm sở cho trình suy luận xấp xỉ Một lưu ý quan trọng trình tính tốn tiếp cận ĐSGT cần xác định tham số ban đầu độ đo tính mờ phần tử sinh độ đo tính mờ gia tử biến ngôn ngữ cách thích hợp dựa sở phân tích ngữ nghĩa miền ngơn ngữ tốn ứng dụng cụ thể Khi mơ hình tính tốn tiếp cận ĐSGT cho kết hợp lý ứng dụng Đối với mơ hình dự báo chuỗi thời gian mờ Song & Chissom Chen, thấy rõ hai giai đoạn quan trọng tác giả sử dụng dựa tiếp cận mờ Đầu tiên giai đoạn có nội dung phép mờ hóa bao gồm bước đến bước Nếu giai đoạn mờ hóa cung cấp thơng tin định tính hợp lý quan hệ mờ nhóm quan hệ mờ tạo khả dự báo với độ xác cao Giai đoạn giai đoạn có nội dung phép giải mờ (bước bước mơ hình Song, Chissom bước mơ hình Chen) Đây giai đoạn tìm kết dự báo dựa sở bước giai đoạn mờ hóa Khó khăn giai đoạn tìm xu hướng dự báo Trong giai đoạn phải đánh giá khả tăng hay giảm với mức độ nhiều hay cách xác Chính kết dự báo [6, 19] có độ xác cao đưa hướng dự báo cho liệu lịch sử dựa hiệu ứng tăng hay giảm tốc độ tăng hay giảm cặp liệu Dựa phân tích đây, rõ ràng rằng: hồn tồn thay tiếp cận mờ với hai giai đoạn có nội dung phép mờ hóa phép giải mờ mơ hình Song & Chissom Chen tiếp cận ĐSGT với hai giai đoạn có nội dung phép ngữ nghĩa hóa phép giải nghĩa tương ứng Như xây dựng mơ hình dự báo chuỗi thời gian mờ tương tự mơ hình Chen không sử dụng tập mờ mà dựa tiếp cận ĐSGT với mơ hình tính tốn qua biểu thức trình bày phía trên, cụ thể sau: Mơ hình dự báo chuỗi thời gian mờ sử dụng đại số gia tử [15]: Bước Xác định tập nền, chia miền xác định tập thành khoảng Bước Xây dựng nhãn ngữ nghĩa (giá trị ngôn ngữ theo tiếp cận ĐSGT) tập 33 Bước Ngữ nghĩa hóa phi tuyến chuỗi liệu Bước Xác định quan hệ ngữ nghĩa theo nhãn ngữ nghĩa Bước Tạo lập nhóm quan hệ ngữ nghĩa theo nhãn ngữ nghĩa Bước Giải nghĩa phi tuyến đầu dự báo Các bước tương tự với bước dự báo mơ hình Chen tiếp cận ĐSGT không sử dụng tập mờ mà dùng ngữ nghĩa định lượng mô tả giá trị ngôn ngữ Ở đây, phép mờ hóa thay phép ngữ nghĩa hóa, quan hệ mờ thay quan hệ ngữ nghĩa nhóm quan hệ mờ thay nhóm quan hệ ngữ nghĩa Cuối phép giải mờ thay phép giải nghĩa 3.2 Ứng dụng phương pháp dự báo chuỗi thời gian mờ sử dụng đại số gia tử vào toán dự báo số lượng sinh viên nhập học Trường Đại học Tây Bắc Trong phần sử dụng phương pháp dự báo dùng đại số gia tử trình bày [15] để đưa kết dự báo số lượng sinh viên nhập học Trường Đại học Tây Bắc Về liệu chuỗi thời gian chọn sinh viên đại học hệ quy để đảm bảo tính thống liệu Thời gian bắt đầu tính năm 2004 Trường Đại học Tây Bắc bắt đầu đào tạo hệ đại học từ năm 2001 năm đầu cịn ngành học nên số lượng sinh viên chưa nhiều, từ khóa K45 (năm 2004) Nhà trường mở rộng ngành đào tạo nên lấy mốc thời gian từ 2004 cho đảm bảo tương quan số lượng sinh viên năm STT Năm Tổng số SV 10 11 12 13 14 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 672 1007 1271 1588 1481 1692 1814 1995 1653 1640 1129 1246 902 680 Bảng 3.1: Thống kê số lượng sinh viên nhập học Mơ hình tính tốn bước nêu mục 3.1 cụ thể sau: 34 Bước 1: Xác định tập nền, chia miền xác định tập thành khoảng Tập U chọn tương tự mơ hình S.M Chen [4] có khoảng xác định: [Dmin−D1, Dmax+D2] với Dmin Dmax số sinh viên nhập học thấp cao theo liệu lịch sử nhập học trường Cụ thể Dmin=672 Dmax=1995 Các biến D1 D2 số dương chọn cho khoảng [Dmin−D1, Dmax+D2] bao hoàn toàn số sinh viên nhập học thấp cao tương lai Sử dụng cách chọn S.M Chen [4], D1 = 72 D2 = 5, U = [600, 2000] Khoảng xác định tập U chia thành khoảng u1, u2, u3, u4, u5, u6 u7 Trong u1 = [600, 800], u2 = [800, 1000], u3 = [1000, 1200], u4 = [1200, 1400], u5 = [1400, 1600], u6 = [1600, 1800] u7 = [1800, 2000] Bước Xây dựng nhãn ngữ nghĩa (giá trị ngôn ngữ không biểu diễn dạng tập mờ) tiếp cận ĐSGT tập Giả sử A1, A2 ,…, Ak nhãn ngữ nghĩa gán cho khoảng u1, u2,…uk, k số khoảng tập Các nhãn ngữ nghĩa xây dựng từ phần tử sinh c−, c+ với gia tử h ϵ H tạo thành giá trị ngôn ngữ biến ngôn ngữ “số sinh viên nhập học ” Khi nhãn ngữ nghĩa A1, A2 ,…, Ak có dạng sau đây: A1= hA1c; A2= hA2c;….; Ak= hAkc, hAi, (i=1,2,…k) chuỗi gia tử tác động lên c với c ∈{c−, c+} Theo tiếp cận ĐSGT, sử dụng gia tử “very” “little” tác động lên phần tử sinh “small” “large” để tạo nhãn ngữ nghĩa tương ứng với giá trị ngôn ngữ S.M Chen [4] sau: A1 = (very small), A2 = (small), A3 = (little small), A4 = (middle), A5 = (little large), A6 = (large) A7 = (very large) Bước Ngữ nghĩa hóa chuỗi liệu Để xác định ngữ nghĩa định lượng cho nhãn ngữ nghĩa A1, A2, ,A7 bước 2, cần chọn trước độ đo tính mờ gia tử µ(very), µ(little) giá trị độ đo tính mờ phần tử sinh fm(c−) = θ với θ phần tử trung hoà cho trước Nếu nhãn ngữ nghĩa tạo thành từ gia tử dương gia tử âm ví dụ gia tử dương “very” gia tử âm “little ” tác động lên phần tử sinh “large” “small” trên, µ(little) = α µ(very) = 1− α = β Như ngữ nghĩa định lượng nhãn ngữ nghĩa phụ thuộc vào tham số ĐSGT α, θ hoàn toàn 35 xác định Cụ thể giá trị ngữ nghĩa định lượng nhãn ngữ nghĩa A1,A2, A7 gán tương ứng cho khoảng u1, u2, , u7 có dạng tham số hóa sau đây: ν(very small) = θ(1− α)(1− α) ν(small) = θ(1− α) ν(little small) = θ(1− α + α2) ν(midle) = θ ν(little large) = θ + α(1− θ)(1− α) ν(large) = θ + (1− θ)α ν(very large) = θ + α(1− θ)(2− α) Chọn α=0.5 θ=0.5 ta tính giá trị ngữ nghĩa định lượng nhãn ngữ nghĩa sau: ν(very small) = -0.125 ν(small) = 0.25 ν(little small) = 0.375 ν(midle) = 0.5 ν(little large) = 0.625 ν(large) = 0.750 ν(very large) = 0.875 Ký hiệu: SA = Semantization (A) giá trị ngữ nghĩa định lượng theo nhãn ngữ nghĩa A, đó: SA1 = ν(very small); SA2 = ν(small); SA3 = ν(little small); SA4 = ν(middle); SA5 = ν(little large); SA6 = ν(large) SA7 = ν(very large) giá trị ngữ nghĩa định lượng theo tham số chọn trước α, θ Bước 4: Xác định quan hệ ngữ nghĩa theo nhãn ngữ nghĩa Các quan hệ ngữ nghĩa xác định sở liệu lịch sử Nếu đặt chuỗi thời gian mờ F(t − 1) Aj có ngữ nghĩa định lượng SAj F(t) Ak có ngữ nghĩa định lượng SAk, Aj có quan hệ với Ak dẫn đến SAj có quan hệ với SAk Quan hệ gọi quan hệ ngữ nghĩa theo nhãn ngữ nghĩa ký hiệu là: SAj → SAk Semantization (Aj) → Semantization (Ak) Trong toán này, Aj nhãn ngữ nghĩa mô tả số sinh viên nhập học năm với ngữ nghĩa định lượng SAj, Ak nhãn ngữ nghĩa mô tả số sinh viên nhập học năm với ngữ nghĩa định lượng SAk 36 Như vậy, sở số liệu sinh viên nhập học, xác định quan hệ ngữ nghĩa theo nhãn ngữ nghĩa sau đây: SA1 → SA3; SA2 → SA1; SA3 → SA4; SA4 → SA2; SA4 → SA5; SA5 → SA5; SA5 → SA6; SA6 → SA3; SA6 → SA6; SA6 → SA7; SA7 → SA6 SA7 → SA7 Chú ý bỏ qua lặp lại luật ghi nhận từ lịch sử liệu Bước Tạo lập nhóm quan hệ ngữ nghĩa theo nhãn ngữ nghĩa Nếu ngữ nghĩa định lượng có quan hệ với nhiều ngữ nghĩa định lượng vế phải chập lại thành nhóm Quan hệ lập theo nhóm gọi nhóm quan hệ ngữ nghĩa (NQHNN) Như từ kết Bước ta nhận NQHNN sau đây: Nhóm 1: SA1 → (SA3) Nhóm 2: SA2 → (SA1) Nhóm 3: SA3 → (SA4) Nhóm 4: SA4 → (SA2, SA5) Nhóm 5: SA5 → (SA5, SA6) Nhóm 6: SA6 → (SA3, SA6, SA7) Nhóm 7: SA7 → (SA6, SA7) Bước Giải nghĩa đầu dự báo Giả sử số sinh viên nhập học năm (t − 1) chuỗi thời gian mờ F(t − 1) ngữ nghĩa hóa SAj, đầu dự báo F(t) hay số sinh viên nhập học dự báo năm t xác định theo nguyên tắc (luật) trình bày [15] Nếu ta bỏ qua trọng số, nghĩa bỏ qua độ quan trọng lặp lại luật trọng số nhóm quan hệ mờ 1/S với S số phần tử bên vế phải luật Trong toán dự báo số sinh viên nhập học Trường Đại học Tây Bắc, ta cần phải chọn 13 khoảng giải nghĩa với giá trị đầu giá trị cuối thích hợp tương ứng với 13 giá trị cần dự báo 37 Sau lựa chọn khoảng giải nghĩa cho 13 giá trị dự báo, lựa chọn tham số sp dp chúng tơi chạy mơ hình MatLab cho kết sau STT 10 11 12 13 14 Năm Tổng số SV 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 MSE 672 1007 1271 1588 1481 1692 1814 1995 1653 1640 1129 1246 902 680 Chen [4] ĐSGT [15] 900 1100 1200 1600 1600 1567 1800 1800 1567 1567 1100 1200 700 49400 940 1256 1234 1495 1642 1608 1866 1755 1608 1452 1212 962 1017 32760 Bảng 3.2: Kết dự báo số lượng sinh viên nhập học Trong bảng sai số trung bình bình phương (MSE) xác định theo công thức sau: ∑ MSE = 14 (X i −Yi )2 i=2 13 Xi , Yi liệu thực liệu dự báo năm thứ i tính từ năm 2005 đến năm 2017 năm 2004 khơng dự báo (năm đầu tiên) 2000 1800 1600 1400 1200 1000 800 600 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 Số liệu thực PP của Chen [4] Phương pháp ĐSGT Hình 3.1: Biểu đồ so sánh kết dự báo 38 Qua biểu đồ hình 3.1 ta thấy phương pháp dự báo sử dụng đại số gia tử cho độ xác tốt so với phương pháp Chen [4] Điều thể tính đắn mặt phương pháp tiếp cận, tính mềm dẻo phương pháp đại số gia tử 3.3 Tối ưu tham số mô hình dự báo chuỗi thời gian sử dụng đại số gia tử Như thấy mục 3.2, tham số mơ hình dự báo sử dụng đại số gia tử [15] hoàn toàn lựa chọn ngẫu nhiên theo kinh nghiệm Do đó, thiết cần sử dụng cách tiếp cận tối ưu cho mô hình Các tham số cần tối ưu mơ hình tốn dự báo số lượng sinh viên nhập học Trường Đại học Tây Bắc bao gồm 30 tham số tương ứng α, θ, 26 giá trị đầu cuối 13 khoảng giải nghĩa tương ứng với 13 điểm dự báo với tham số phi tuyến ngữ nghĩa hóa giải ngữ nghĩa sp, dp Chúng sử dụng giải thuật di truyền MatLab, với hàm mục tiêu (fitness function) sai số bình phương trung bình (MSE) trình bày mục 3.2 Các cận cận biến cần tối ưu chọn sau: lb = [0.0; 0.0; 600; 1200; 600; 1400; 600; 1600; 600; 1800; 600; 1800; 600; 2000; 600; 2000; 600; 2000; 600; 2000; 600; 2000; 600; 1400; 600; 1600; 600; 800; -1; -1]; ub = [1.0; 1.0; 1000; 2000; 1200; 2000; 800; 2000; 1400; 2000; 1400; 2000; 1000; 2000; 1600; 2000; 1600; 2000; 1000; 2000; 1000; 2000; 1200; 2000; 800; 2000; 600; 2000; 1; 1]; Ta dễ dàng nhận thấy α, θ có giá trị nằm đoạn [0,1]; sp, dp có giá trị nằm đoạn [−1;1] giá trị đầu khoảng, cuối khoảng nằm đoạn [Dmin; Dmax] cho chúng bao giá trị khoảng tương ứng với giá trị dự báo lịch sử dự báo Sau thử nghiệm với mơ hình tính tốn sử dụng đại số gia tử, kích thước quần thể (size of population) 100, 1000 hệ (generations) thu nhiễm sắc thể tốt (đã làm tròn) sau: Best individual = [0.40848; 0.303233; 789; 1356; 722; 1882; 800; 2000; 868; 1840; 1284; 1930; 1000; 2000; 1558; 2000; 869; 2000; 946; 2000; 600; 2000; 876; 1652; 600; 1600; 600; 999; -0.048205; 0.340872] 39 Sau chạy tối ưu tham số vào mơ hình dự báo ta kết bảng so sánh biểu đồ Rõ ràng kết dự báo với mơ hình tối ưu tham số tốt nhiều so với mô hình dự báo [15] STT 10 11 12 13 14 Năm 2004 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 MSE Tổng số SV ĐSGT [15] ĐSGT Tối ưu 940 1256 1234 1495 1642 1608 1866 1755 1608 1452 1212 962 1017 32760 1007 1277 1675 1485 1693 1613 1875 1681 1593 1460 1247 1079 697 18576 672 1007 1271 1588 1481 1692 1814 1995 1653 1640 1129 1246 902 680 Bảng 3.3: Bảng so sánh kết dự báo sau tối ưu 2000 1800 1600 1400 1200 1000 800 600 2005 2006 2007 2008 2009 2010 2011 2012 2013 2014 2015 2016 2017 Số liệu thực PP ĐSGT [15] PP ĐSGT Tối ưu Hình 3.2: Biểu đồ so sánh kết dự báo sau tối ưu 40 KẾT LUẬN VÀ KIẾN NGHỊ Qua đề tài này, nghiên cứu chuỗi thời gian mờ việc cải tiến chuỗi thời gian mờ sử dụng đại số gia tử Việc nghiên cứu áp dụng đại số gia tử vào cải tiến phương pháp dự báo chuỗi thời gian mờ hướng bước đầu cho kết tốt Qua việc sử dụng mơ hình tính tốn đại số gia tử, thấy rõ độ xác dự báo nâng lên rõ rệt Qua đề tài này, thử nghiệm ứng dụng phương pháp cải tiến vào liệu số lượng sinh viên nhập học Trường Đại học Tây Bắc so sánh độ xác phương pháp với phương pháp Chen Chúng ta thấy rõ ràng phương pháp cho kết dự báo tốt Tuy nhiên, thử nghiệm số lượng sinh viên nhập học ghi nhận toán tương đối ngắn, thêm vào số liệu đại lượng thực tế phụ thuộc nhiều vào yếu tố người sách Đảng Nhà nước Trong thời gian tới, tiếp tục nghiên cứu cải tiến toán dự báo chuỗi thời gian mờ theo hướng sau: - Nghiên cứu tối ưu tham số mơ hình dự báo sử dụng tối ưu bầy đàn (Particle Swarm Optimization) - Nghiên cứu ứng dụng mơ hình vào dự báo số liệu khác đặc biệt kinh tế, nông lâm nghiệp… để mở rộng phạm vi ứng dụng mơ hình 41 TÀI LIỆU THAM KHẢO [1] Q Song, B.S Chissom, Fuzzy time series and its models, Fuzzy Sets and System, 54 (1993) 269–277 [2] Q Song, B.S Chissom, Forecasting enrollments with fuzzy time series – part 1, Fuzzy Sets and System 54 (1993) 1–9 [3] Q Song, B.S Chissom, Forecasting enrollments with fuzzy time series – part 2, Fuzzy Sets and System 62 (1994) 1–8 [4] S.M Chen, Forecasting Enrollments Based on Fuzzy Time Series, Fuzzy Sets and System 81 (1996) 311–319 [5] S.M Chen and N.Y Chung, Forecasting enrollments using high-order fuzzy time series and genetic algorithms, International Journal of Intelligent Systems 21 (2006) 485-501 [6] M.H Lee, R Efendi, Z Ismad, Modified Weighted for Enrollments Forecasting Based on Fuzzy Time Series, MATEMATIKA, 25-1 (2009) 67-78 [7] S.M Chen, P.Y Kao, TAIEX forecasting based on fuzzy time series, particle swarm optimization techniques and support vector machines, Information Sciences 247 (2013), 62-71 [8] Q Cai, D Zhang, B Wu, S.C.H Leung, A novel stock forecasting model based on fuzzy time series and genetic algorithm, Procedia Computer Science 18 ( 2013 ) 1155 – 1162 [9] Q Cai, D Zhang, W.Zheng, S.C.H Leung, A new fuzzy time series forecasting model combined with ant colony optimization and auto-regression, KnowledgeBased Systems 74 (2015) 61–68 [10] F Ye, L Zhang, D Zhang, H Fujita, Z Gong, A novel forecasting method based on multi-order fuzzy time series and technical analysis, Information Sciences 367–368 (2016) 41–57 [11] Dang Tran, Nhuan Tran, Giang Nguyen, Binh Minh Nguyen, A Proactive Cloud Scaling Model Based on Fuzzy Time Series and SLA Awareness, Procedia Computer Science 108C (2017) 365-374 [12] N Cat Ho and W Wechler, Hedge algebras: An algebraic approach to structures of sets of linguistic domains of linguistic truth variable, Fuzzy Sets and Systems, Vol 35-3 (1990) 281-293 42 [13] N Cat Ho and W Wechler, Extended hedge algebras and their application to Fuzzy logic, Fuzzy Sets and Systems 52 (1992) 259-281 [14] Nguyễn Công Điều, Một thuật tốn cho mơ hình chuỗi thời gian mờ, Tạp chí Khoa học Cơng nghệ, Tập 49, Số (2011) 11-25 [15] Nguyễn Duy Hiếu, Vũ Như Lân, Nguyễn Cát Hồ, Dự báo chuỗi thời gian mờ dựa ngữ nghĩa, Kỷ yếu Hội nghị Quốc gia lần thứ Nghiên cứu ứng dụng CNTT (FAIR) (2015) 232-243 [16] Cat Ho, N and H Van Nam, An algebraic approach to linguistic hedges in Zadeh's fuzzy logic, Fuzzy Set and System 129 (2002), 229-254 [17] Nguyen Cat Ho, Vu Nhu Lan, Le Xuan Viet, Optimal hedge-algebras-based controller: Design and Application, Fuzzy Sets and Systems 159 (2008), 968– 989 [18] Dinko Vukadinović, Mateo Bašić, Cat Ho Nguyen, Nhu Lan Vu, Tien Duy Nguyen Hedge-Algebra-Based Voltage Controller for a Self-Excited Induction Generator, Control Engineering Practice 30 (2013), 78–90 [19] Nguyen Cat Ho, Nguyen Van Long, Hoang Van Thong, A discussion on interpretability of linguistic rule based systems and its application to solve regression problems, Knowledge-Based Systems 88 (2015) [20] Nguyen Cat Ho, Jose M Alonso, Looking for a real-world-semantics-based approach to the interpretability of fuzzy systems, IEEE International Conference on Fuzzy Systems (2017) 43 ... nghiên cứu - Nghiên cứu ứng dụng toán dự báo chuỗi thời gian mờ vào dự báo liệu sinh viên nhập học Trường Đại học Tây Bắc Phương pháp nghiên cứu - Phương pháp phân tích, tổng hợp tài liệu - Phương. .. - Nghiên cứu phương pháp dự báo chuỗi thời gian mờ - Thử nghiệm dự báo với liệu sinh viên nhập học Trường Đại học Tây Bắc Đối tượng nghiên cứu - Bài toán dự báo chuỗi thời gian mờ Phạm vi nghiên. .. toán dự báo liệu chuỗi thời gian Chương 2: Các phương pháp dự báo chuỗi thời gian mờ Chương 3: Cải tiến phương pháp dự báo chuỗi thời gian mờ ứng dụng dự báo sinh viên nhập học Trường Đại học

Ngày đăng: 03/01/2018, 22:53

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan