BÀI TOÁN TRÒ CHƠI MA TRẬN

Thông tin tài liệu

ĐẠI HỌC ĐÀ NẴNG TRƯỜNG ĐẠI HỌC BÁCH KHOA KHOA CÔNG NGHỆ THÔNG TIN Tel (84-511) 736 949, Website: itf.ud.edu.vn, E-mail: cntt@edu.ud.vn BÁO CÁO TIỂU LUẬN MÔN HỌC HỆ HỖ TRỢ RA QUYẾT ĐỊNH NGÀNH KHOA HỌC MÁY TÍNH ĐỀ TÀI : BÀI TOÁN TRÒ CHƠI MA TRẬN (Chú ý không làm thay đổi định dạng trang in) Học viên thực hiện: LÊ ĐỨC THỌ Lớp Cao học KHMT Khóa 28 (2013 2015) ĐÀ NẴNG, 05/2015 MỤC LỤC LỜI MỞ ĐẦU I TỔNG QUAN Định nghĩa DSS 2 Đặc điểm hệ hỗ trợ định Quy trình định Các loại định Phân loại DSS Kiến trúc DSS II BÀI TOÁN TRÒ CHƠI MA TRẬN Giới thiệu trò chơi ma trận Một số ví dụ III MÔ HÌNH BÀI TOÁN 10 IV PHƯƠNG PHÁP CHỌN 11 V VÍ DỤ MINH HỌA 13 Tổng quát toán 13 Giải vấn đề 13 VI KẾT LUẬN 16 VII TÀI LIỆU THAM KHẢO 17 Hệ hỗ trợ định LỜI MỞ ĐẦU Ngày công nghệ thông tin lĩnh vực thiếu hoạt động kinh doanh sản xuất, quản lý kinh tế nghiên cứu khoa học, thống kê tình hình phát triển xã hội, dân số v.v Với chức khai thác có tính chất tác nghiệp, việc khai thác sở liệu phục vụ yêu cầu trợ giúp định ngày có ý nghĩa to lớn Việc đưa định vấn đề xuất khắp lĩnh vực mà không nhận Từ việc đơn giản chọn ăn cho bữa ăn việc lớn phân bổ nguồn ngân sách vào chương trình quốc gia công việc đưa định Việc ứng dụng hệ hỗ trợ định giúp doanh nghiệp xây dựng chiến lược phát triển sản xuất kinh doanh đắn tương lai, mạng lại hiệu to lớn cho doanh nghiệp, tổ chức v.v… Dữ liệu lưu trữ thu thập ngày nhiều người định quản lý, kinh doanh lại cần thông tin dạng “tri thức” rút từ nguồn liệu liệu cho việc định Quá trình định cần có nhiều phương pháp hỗ trợ, số phương pháp Dự báo phương pháp sử dụng phổ biến kết dự báo đầu vào cần thiết trình đưa ý kiến chủ quan chung sau thảo luận Lê Đức Thọ Trang Hệ hỗ trợ định I TỔNG QUAN Định nghĩa DSS Thuật ngữ hệ hỗ trợ định (Decision Support Systems – DSS) bắt đầu xuất từ năm đầu thập niên 1970, có nhiều nghiên cứu ứng dụng hệ hỗ trợ định Đã có nhiều định nghĩa hệ hỗ trợ định Hệ hỗ trợ định hệ thống nhằm hỗ trợ người quản lý thực định, bao gồm mục tiêu cần đạt, hàm, cách thức xử lý, … Quyết định công việc có tổ chức hay gọi công việc có cấu trúc chặt chẽ, công việc cấu trúc, thực không thường xuyên, lại có tầm quan trọng Những hệ thống cung cấp chế mở rộng tiện lợi cho người quản lý thực tốt công việc mình, thay người quản lý để tự động đề định Hệ hỗ trợ định phương pháp lấy tri thức định hợp lý vào lúc có mức phí hợp lý Hay hệ hỗ trợ định hệ phương pháp xử lý liệu để lấy tri thức nhằm lựa chọn phương án tối ưu theo mục tiêu Đó kết hợp tri thức việc tạo lập định Mục đích hệ hỗ trợ định hỗ trợ việc định nhà quản lý theo mục tiêu đề Đặc điểm hệ hỗ trợ định Hệ hỗ trợ định công cụ giúp đỡ người quản lý thực định Ý định hệ hỗ trợ định hỗ trợ thay thế, quản lý việc định với quan điểm nâng cao tính hiệu việc định suất Có nhiều khuôn mẫu (framework) mô hình đưa Lê Đức Thọ Trang Hệ hỗ trợ định việc xây dựng hệ hỗ trợ định Các mô hình có đặc điểm sau: - Thân thiện với người sử dụng - Linh hoạt trình thực thi việc hỗ trợ định - Hỗ trợ hoạt động trình định cách sử dụng phương thức, liệu, quy luật phương tiện khác Các hệ hỗ trợ định dùng tổ chức để hổ trợ định cho vấn đề bán cấu trúc cấu trúc Với vấn đề bán cấu trúc cấu trúc người can thiệp vào trình định Con người cso thể can thiệp vào thời điểm sau: - Trong trình nhận định vấn đề - Trong trình xử lý vấn đề - Trong trình lựa chọn giải pháp Quy trình định Các yếu tố quan trọng hệ hỗ trợ định: - Dữ liệu - Tri thức - Mô hình, phương pháp lựa chọn Quy trình định chia làm giai đoạn: - Thu thập: Lấy yêu cầu, yếu tố môi trường, liệu để xử lý thông tin, tri thức … (thu thập, chọn lọc, chuẩn hóa, …) - Thiết kế: Xây dựng phương án thay thế, ràng buộc, phương pháp đo lường Định hình phương pháp lựa chọn Lê Đức Thọ Trang Hệ hỗ trợ định - Lựa chọn: Sử dụng tri thức, thông tin thu với phương pháp hay mô hình lựa chọn (ở bước thiết kế) để lựa chọn, đánh giá phương án Phương án phù hợp chi phí thấp hiệu quả, phù hợp với mục tiêu đặt Các loại định Quyết định chia làm nhiều cấp độ từ định có cấu trúc hoàn toàn đến định hoàn toàn cấu trúc Có cấu trúc hay cấu trúc dựa vào rõ ràng, mập mờ hay tính phức tạp yếu tố giai đoạn định Phương pháp truyền thống tạo lập định Phương án n Phương án n-1 Dữ liệu (Data) Thiết lập Mục đích Lựa chọn Quyết định Phương án Phương án Ràng buộc Phương án Lê Đức Thọ Trang Hệ hỗ trợ định Tạo lập định có sử dụng tri thức Tri thức Phương án n Phương án n-1 Tri thức Thiết lập Lựa chọn PA Phương án Xử lý liệu Mục đích Phương án Quyết định Ràng buộc Phương án Dữ liệu (Data) Phân loại DSS: Có xu hướng Model – Driven Mô hình vận dụng mô hình toán tài chính, mô hình dự báo, tối ưu, mô hình giả lập để đưa hỗ trợ định vấn đề Dữ liệu thường bị giới hạn tham số, không gian (Thường theo mô hình toán) Ví dụ: Bài toán vận tải: Mô hình hỗ trợ điều xe cho tốn chi phí đến đủ nơi Lê Đức Thọ Trang Hệ hỗ trợ định Data – Driven Mô hình sử dụng liệu có tính chất chuỗi hay thời gian để tạo lập báo cáo giúp cho việc định Mô hình phải phân tích rút trích liệu để tạo lập báo cáo tổng hợp, thông tin theo mục đích Về sau phát triển với ứng dụng gọi Data WareHouse Communication – Driven Mô hình quan tâm đến việc hỗ trợ định dạng nhóm Giải vấn đề nhóm người định - Nhiều phương án khác để lựa chọn - Nhiều cách giải khác - Phương pháp kết nối nhóm định Document – Driven Mô hình sử dụng phương pháp phân tích rút trích thông tin dạng văn (có thể văn bản, tài liệu ảnh, phim, âm thanh, …) Ví dụ: hệ thống hỗ trợ nhà quản trị nhận thức thái độ thị hiếu tiêu dùng khách hàng qua thông tin phản hồi (có thể thư từ, hay hình ảnh nét mặt khách hàng tới công ty, …) Các hệ khai thác liệu mạng (web mining) Knowledge – Driven Mô hình sử dụng hệ thống quản lý tri thức để áp dụng vào việc định Thường dùng cho kiểu liệu có hay cấu trúc, hay loại liệu không tường minh Được áp dụng cho lĩnh vực chuyên môn hẹp Sử dụng phương pháp trí tuệ nhân tạo Sự phát triển dần hình thành nên hệ thống gọi hệ chuyên gia (Expert System) Lê Đức Thọ Trang Hệ hỗ trợ định Kiến trúc DSS Kiến trúc DSS bao gồm phần bản: - Hệ thống ngôn ngữ (Language System – LS) - Hệ thống thể (Presentation System – PS) - Hệ thống tri thức (Knowledge System – KS) - Hệ thống xử lý (Problem Processing System – PPS) Người dùng Người định Người nhận tri thức Người phát triển Nhà quản trị … Lê Đức Thọ Hệ thống ngôn ngữ - Tiếp nhận liệu thông tin, tri thức - Nơi giao tiếp ngừi dùng - Xuất thông tin, tri thức cho người dùng - Ra định dạng hỗ trợ Hệ thống xử lý - Lấy liệu - Lấy tri thức - Chọn lọc - Chuẩn hóa Hệ thống tri thức - Mô tả tri thức - Xử lý tri thức - Đo lường - So sánh - Điều khiển - Suy diễn - Suy diễn tri thức Trang Hệ hỗ trợ định II BÀI TOÁN TRÒ CHƠI MA TRẬN Giới thiệu trò chơi ma trận Đối tượng nghiên cứu lý thuyết trò chơi mô hình phương pháp định trường hợp nhiều người tham gia (nhiều người chơi) Mục tiêu người chơi khác thường trái ngược Ở đây, xem xét trò chơi có hai người quyền lợi hai người chơi trái ngược Trò chơi bao gồm dãy bước (phương án) Các bước ngẫu nhiên (Trong trò chơi cờ tất bước mang tính cá nhân) Kết bước đánh giá hàm chiến thắng cho người chơi Nếu hàm chiến thắng trò chơi gọi chơi tổng không - Chiến lược tập hợp quy tắc, xác định người chơi, có nghĩa lựa chọn bước - Chiến lược tối ưu gọi chiến lược mà chiến lược đạt giá trị trung bình mong đợi người chơi lớn (tốt nhất) trò chơi lặp lặp lại - Trò chơi ma trận: trò chơi mà có hai người tham gia vào trò chơi, ban đầu hàm chiến thắng người chơi Người chơi thứ có hữu hạn số chiến lược: {1, …, m} người chơi thứ có: {1, …, n} với (ij ) đưa số tiền thưởng aij người chơi thứ (j) trả cho người chơi thứ (i) Ma trận (aij) cho kết chiến thắng người chơi thứ kết thất bại người chơi thứ hai, aij  0! Một số ví dụ Trò chơi đột kích Trò chơi có người chơi: Lê Đức Thọ Trang Hệ hỗ trợ định Người chơi thứ chọn hệ thống phòng không Người chơi thứ hai chọn máy bay Phần tử aij xác suất bắn cháy máy bay j hệ thống phòng không i Mục đích người người chơi thứ hai vượt qua hệ thống phòng không Các pháo Các máy bay 0,5 0,6 0,8 0,9 0,7 0,8 0,7 0,5 0,6 Phương án chọn bước (2,2) có ý nghĩa theo hai hướng: Nếu chọn máy bay 2, pháo cao xạ tốt cho người chơi thứ nhất; Nếu chọn pháo cao xạ máy bay tốt cho người chơi thứ hai Trong ma trận có điểm tựa “saddle-node” (điểm ổn định) Saddle-node (aij) (ai0j0) cho: aij0  ai0j0  ai0j, (ij ) Trò chơi tung đồng xu Người chơi chọn hai phương án {sấp, ngửa} trước lúc tung đồng xu Nếu lần tung trùng với phương án chọn người chơi thứ chiến thắng, không chiến thắng thuộc người chơi thứ hai II- người chơi Sấp Ngửa Sấp -1 Ngửa -1 I- Người chơi Lê Đức Thọ Trang Hệ hỗ trợ định Một số trò chơi khác : Trò chơi tài xỉu từ quân xúc sắt, Trò chơi Oẳn tù xì hay trò chơi tìm đường mê cung cho hai người chơi v.v… III MÔ HÌNH BÀI TOÁN • Lý thuyết trò chơi: nghiên cứu việc chọn định trường hợp đối kháng • Người chơi – Người chọn định; – Đối thủ người chọn định • Chiến lược: Tập hợp hành động để lựa chọn định ứng với người chơi • Xét trò chơi gồm người: – A : i, i:=1,…,n, tập chiến lược – B : j, j:=1,…,m, tập chiến lược – Giải thưởng ứng với chiến lược (i,j) hai người chơi ký hiệu aij (Phần thưởng người người kia) • Lời giải – Tìm chiến lược tốt cho người chơi … n a11 a12 … a1n a21 a22 … a2n … … … … … m am1 am2 … amn A Lê Đức Thọ B Đối với A: Nếu A nước A sẽ: - Thắng a11 điểm B nước - Thắng a12 điểm B nước -… Đối với B: Nếu B nước B sẽ: - Thua a11 điểm A nước - Thua a21 điểm A nước -… - Thua am1 A nước m Trang 10 Hệ hỗ trợ định - Nghiệm tối ưu trò chơi chiến lược (i*,j*) - Giải trò chơi có nghĩa tìm nghiệm tối ưu IV PHƯƠNG PHÁP CHỌN Nguyên lý Minimax Minimax (còn gọi minmax) phương pháp lý thuyết định có mục đích tối thiểu hóa (minimize) tổn thất vốn dự tính "tối đa" (maximize) Có thể hiểu ngược lại là, nhằm tối đa hóa lợi ích vốn dự tính tối thiểu (maximin) Nó bắt nguồn từ trò chơi có tổng không Nó mở rộng cho nhiều trò chơi phức tạp giúp đưa định chung có diện không chắn Một phiên giải thuật áp dụng cho trò chơi tic – tac - toe, mà người chơi thắng, thua, hòa Nếu người chơi A thắng nước đi, "nước tốt nhất" nước để dẫn đến kết thắng Nếu người B biết có nước mà dẫn đến tình người A thắng nước tiếp theo, nước khác dẫn đến tình mà người chơi A có thể, tốt nhất, hòa nước tốt người B nước sau Ta nắm rõ, nước "tốt nhất" Giải thuật Minimax giúp tìm nước tốt nhất, cách ngược từ cuối trò chơi trở đầu Tại bước, ước định người A cố gắng tối đa hóa hội thắng A đến phiên anh ta, nước người chơi B cố gắng để tổi thiểu hóa hội thắng người A (nghĩa tối đa hóa hội thắng B) Giả thiết đối thủ toàn đoán tất phương án (bước đi) Người chơi thứ giả thiết người chơi thứ hai biết hết tất phương án i (bước i) người chơi thứ chọn j(i): aij(i)  aij, j = 1, …, n Lê Đức Thọ Trang 11 Hệ hỗ trợ định Ký hiệu  i = aij(i) = aij, i=1, , n Người chơi thứ chọn i0 cho  = max  i = max aij = ai0 Đại lượng  gọi giá trị nhỏ trò chơi chiến lược Người chơi thứ hai từ việc cân nhắc cách thận trọng cho trước tiên j chọn i(j) cho aij(j)  aij  i, có nghĩa  j = max aij chọn j cho  j nhỏ  = max aij =  j0 Đại lượng  gọi giá trị lớn trò chơi tập chiến lược Ví dụ : Trong ví dụ sau trò chơi tổng 0, A B bước lúc, minh họa thuật toán minimax Nếu người chơi có chọn lựa ma trận lợi cho A là: B chọn B1 B chọn B2 B chọn B3 A chọn A1 +3 -2 +2 A chọn A2 -1 +4 A chọn A3 -4 -3 +1 B có ma trận lợi ngược dấu (i.e lựa chọn A1 B1 B trả cho A) sau lựa chọn minimax đơn giản cho A A2 kết xấu sau phải trả 1, lựa chọn minimax đơn giản cho B B2 kết xấu sau trả Tuy vậy, lời giải không ổn định, B tin A chọn A2 B chọn B1 để thắng 1; sau A tin B chọn B1 A chọn A1 để thắng 3; sau B chọn B2; cuối hai người chơi nhận khó khăn việc chọn lựa Do chiến lược ổn định cần thiết Một số chọn lựa bị thống trị người khác bị loại bỏ: A không chọn A3 A1 hay A2 sinh kết tốt hơn, Lê Đức Thọ Trang 12 Hệ hỗ trợ định B chọn gì; B không chọn B3 B2 sinh kết tốt hơn, A chọn A tránh việc phải trả số lượng dự định (expected payment) 1/3 cách chọn A1 với xác suất 1/6 A2 với xác suất 5/6, B chọn B tính phần lợi dự định (expected gain) 1/3 cách sử dụng chiến thuật ngẫu nhiên việc chọn B1 với xác suất 1/3 B2 với xác suất 2/3, A chọn Những chiến lược minimax hỗn hợp ổn định cải tiến John von Neumann chứng minh định lý Minimax vào năm 1928, phát biểu chiến lược luôn tồn trò chơi tổng không cho hai người chơi tìm cách giải tập hợp phương trình lúc VÍ DỤ MINH HỌA V Tổng quát toán Ký hiệu điểm thưởng người chơi thứ I người chơi sử dụng chiến lược p người chơi sử dụng chiến lược q công thức Ri(p,q) Tìm kiếm chiến lược Minimax số tiền phải trả ma trận trò chơi sau: A B A (5,3) (2,6) B (3,2) (4,5) Giải vấn đề Giả sử người chơi thực hành động A với xác suất p người chơi thực hành động A với xác suất q Số điểm thưởng mong đợi người chơi cho công thức: R1(p, q) = 5pq+2p(1 q)+3(1 p)q+4(1 p)(1 q) = 4pq 2p q+4 Lê Đức Thọ Trang 13 Hệ hỗ trợ định Người chơi giả định người chơi hạn chế tối đa số tiền phải trả người chơi Để giảm thiếu số tiền phải trả người chơi dựa chiến lượt người chơi tính (có nghĩa thay đổi số tiền mong muốn trả người chơi chiến lược người chơi 2) Nói chung, hàm hàm tuyến tính p Có khả sau: Trong trường hợp này, để hạn chế tối đa số tiền mà người chơi phải trả, người chơi chọn xác suất q=0 (có nghĩa người chơi chọn chơi sau) Chiến lược Minimax người chơi để chọn bước nhằm tăng tối đa số điểm người chơi chơi sau Trong trường hợp để giảm thiểu số tiền phải trả người chơi 1, người chơi chọn xác suất q=1 (có nghĩa chọn chơi trước) Chiến lược minimax người chơi chọn bước tối đa hoá điểm thưởng người chơi chơi trước Tồn p cho Khi người chơi sử dụng chiến lược này, họ mong đợi số tiền phải trả không phụ thuộc vào chiến lược người chơi Đây chiến lược minimax người chơi Lê Đức Thọ Trang 14 Hệ hỗ trợ định Ta có: R( ,q) = 4-2p = 3,5 Nó dựa chiến lược người chơi chọn bước A với xác suất 0.25 Bằng cách người chơi đảm bảo cho số tiền phải trả 3.5 Cần lưu ý người chơi chọn người chơi hạn chế tối đa điểm thưởng người chơi cách chọn q=0 tức chọn B Trong trường hợp số tiền phải trả người chơi R1(p, 0) = − 2p < 3.5 Tương tự người chơi chọn thì người chơi hạn chế tối đa số điểm thưởng người chơi cách chọn q= tức chọn A Trong trường hợp số tiền trả người chơi R1(p, 1) = 2p + < 3.5 Rõ ràng 3.5 số tiền lớn mà người chơi mong muốn trả Chúng ta tính chiến lược Minimax cho người chơi cách tương tự Số tiền mong muốn chi trả người chơi hàm p q, khác liên quan đến p, chiến lược người chơi 1.Chúng ta có R2(p, q) = 3pq+6p(1−q)+2(1−p)q+5(1−p)(1−q) = p−3q+5 Do Theo đó, người chơi tìm cách tối thiểu hóa số điểm đạt người chơi cách chọn xác suất p=0 tức chọn bước B Nếu người chơi chọn bước B người chơi nên chọn bước B Điều đảm bảo cho người chơi hoàn trả Chú ý: Điều biết từ ma trận tiền trả mục đích người chơi giảm thiểu tối đa số tiền phải trả người chơi 2, người chơi chọn bước B tốt bước A Lê Đức Thọ Trang 15 Hệ hỗ trợ định Thực tế phần thưởng người chơi nhỏ người chơi chọn bước B, người chơi chọn A hay B Giả sử người chơi sử dụng chiến lược Minimax, có nghĩa người chơi chọn bước A với xác xuất 0.25 người chơi chọn bước B Thì số tiền phải trả người chơi là: R1(0.25A + 0.75B, B) = 0.25 × + 0.75 × = 3.5 Số tiền phải trả người chơi là: R2(0.25A + 0.75B, B) = 0.25 × + 0.75 × = 5.25 có nghĩa điểm thưởng người chơi lớn số tiền phải trả minimax cuả người chơi Tóm lại, chiến lược minimax người chơi chiến lược tốt, người chơi sử dụng chiến lược minimax Người chơi chi trả nhiều VI KẾT LUẬN Đề tài tìm hiểu kiến thức chung hệ hỗ trợ định định nghĩa, đặc điểm, quy trình định kiến trúc DSS Giới thiệu toán trò chơi ma trận phương pháp giải toán ma trận sử dụng chiến lược Minimax Lê Đức Thọ Trang 16 Hệ hỗ trợ định VII TÀI LIỆU THAM KHẢO 1- Bài giảng “ trò chơi ma trận” – Nguyễn Văn Hiệu 2- Bài giảng “ Lecture – Matrix Games” – Nguyễn Văn Hiệu 3- http://vi.wikipedia.org/wiki/Minimax 4- http://123doc.vn/document/193116-he-ho-tro-ra-quyet-dinh.htm?page=6 5- Concepts of Solutions to 2-Player Matrix Games Lê Đức Thọ Trang 17

Ngày đăng: 10/10/2016, 10:04

Xem thêm: BÀI TOÁN TRÒ CHƠI MA TRẬN, BÀI TOÁN TRÒ CHƠI MA TRẬN

BÀI TOÁN TRÒ CHƠI MA TRẬN

Thông tin tài liệu

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan