BÀI TOÁN TRÒ CHƠI DODGEM

Thông tin tài liệu

Trò chơi Dogem được sáng tạo bởi Volin Vout (Berlek amp et al, 1982). Dodgem game là một chess game, giống như cờ Caro hay cờ tướng… Mỗi game đều có 2 người chơi. Một người là Min, người còn lại sẽ là Max. Hai người chơi sẽ thay phiên nhau đưa ra các nước đi của mình theo một quy luật nào đó. Trò chơi Dodgem có hai quân trắng và hai quân đen trên bàn cờ 3 x 3 như hình 1. Các trạng thái bàn cờ khác nhau trong quá trình chơi có thể biểu diễn thành một cây tìm kiếm (được gọi là cây trò chơi). Chúng ta tìm kiếm trên cây để tìm được nước đi tốt nhất. Cây trò chơi có các nút là các tình huống khác nhau của bàn cờ, các nhánh nối giữa các nút sẽ cho biết từ một tình huống bàn cờ chuyển sang tình huống khác thông qua chỉ một nước đi đơn nào đó. Tuy nhiên, các nước đi này diễn ra theo cặp do hai đấu thủ lần lượt tiến hành. Độ sâu của cây trò chơi là số tầng của cây. Cách xây dựng cây trò chơi: – Gốc của cây ứng với trạng thái ban đầu. – Gọi đỉnh ứng với trạng thái mà Trắng (Đen) đưa ra nước đi là đỉnh Trắng (Đen). Nếu một đỉnh là Trắng (Đen) ứng với trạng thái u, thì các đỉnh con của nó là tất cả các đỉnh biểu diễn trạng thái v (v nhận được từ u do Trắng (Đen) thực hiện nước đi hợp lệ). Do đó, trên cùng một mức của cây các đỉnh đều là Trắng hoặc đều là Đen, các lá của cây ứng với các trạng thái kết thúc.

MỞ ĐẦU Ngày nay, Trí tuệ nhân tạo ứng dụng nhiều vào thực tiễn Trí tuệ nhân tạo chứng tỏ mạnh cơng việc đòi hỏi khả suy nghĩ tính tốn tương tự người, đó, vấn đề tìm kiếm có đối thủ áp dụng rộng rãi trò chơi đối kháng Xuất phát từ vấn đề nêu trên, tập lớn “Phương pháp tìm kiếm có đối thủ Mơ tả trò chơi cho tốn Dodgem Sử dụng chiến lược cắt tỉa Alpha-Beta Từ trạng thái, mô tả chương trình cắt tỉa Beta phân tích độ sâu 5” nhằm mục đích làm rõ phương pháp tìm kiếm có đối thủ, mơ tả trò chơi cho tốn Dodgem sử dụng chiến lược cắt tỉa Alpha- Beta để xây dựng chương trình minh họa Những phần trình bày tập lớn bao gồm: CHƯƠNG I BÀI TỐN TRỊ CHƠI DODGEM CHƯƠNG II XÂY DỰNG CHƯƠNG TRÌNH CHƯƠNG I BÀI TỐN TRỊ CHƠI DODGEM I MƠ TẢ BÀI TỐN Trò chơi tổng quát Xét trò chơi hai đối thủ White (máy tính) Black (con người) Hai “người” thay phiên thực nước cách áp dụng luật chơi cho trước xác định Các luật hai người chơi Ta có nhận xét sau đây: – Các trò chơi biểu diễn không gian trạng thái – Mỗi tình (configuration) trò chơi biểu diễn trạng thái – Các luật chơi tương ứng với phép biến đổi trạng thái – Trạng thái bắt đầu trò chơi cho trước Trạng thái mà khơng thể có nước hợp lệ thực gọi trạng thái kết thúc Có thể có tập trạng thái kết thúc Trò chơi Dodgem Trò chơi Dogem sáng tạo Volin Vout (Berlek amp et al, 1982) Dodgem game chess game, giống cờ Caro hay cờ tướng… Mỗi game có người chơi Một người Min, người lại Max Hai người chơi thay phiên đưa nước theo quy luật Trò chơi Dodgem có hai quân trắng hai quân đen bàn cờ x hình Hình Trò chơi Dodgem Luật chơi sau: – Quân đen: lên trên, xuống dưới, sang phải; bàn cờ (nếu cột bên phải) – Quân trắng: sang trái, sang phải, lên trên; ngồi bàn cờ (nếu hàng bàn cờ) Trò chơi kết thúc người chơi đưa hết qn cờ ngồi chặn khơng cho qn đối phương di chuyển (thì coi chiến thắng) Như vậy, trò chơi Dodgem hồn tồn phù hợp với mơ hình tốn trò chơi mô tả tổng quát Cụ thể là: – Mỗi nước tạo bàn cờ với cờ khác nhau, trạng thái Tập hợp tất cờ xảy khơng gian trạng thái trò chơi Dodgem – Một cờ (tình huống) trạng thái – Luật chơi cho bên White Black mô tả Rõ ràng nước áp dụng luật cho biến đổi trạng thái – Trạng thái bắt đầu mơ tả hình vẽ – Tập hợp trạng thái kết thúc, kết luận thắng, thua mô tả điều kiện thắng, thua II GIẢI QUYẾT BÀI TỐN Cây trò chơi Các trạng thái bàn cờ khác q trình chơi biểu diễn thành tìm kiếm (được gọi trò chơi) Chúng ta tìm kiếm để tìm nước tốt Cây trò chơi có nút tình khác bàn cờ, nhánh nối nút cho biết từ tình bàn cờ chuyển sang tình khác thơng qua nước đơn Tuy nhiên, nước diễn theo cặp hai đấu thủ tiến hành Độ sâu trò chơi số tầng Cách xây dựng trò chơi: – Gốc ứng với trạng thái ban đầu – Gọi đỉnh ứng với trạng thái mà Trắng (Đen) đưa nước đỉnh Trắng (Đen) Nếu đỉnh Trắng (Đen) ứng với trạng thái u, đỉnh tất đỉnh biểu diễn trạng thái v (v nhận từ u Trắng (Đen) thực nước hợp lệ) Do đó, mức đỉnh Trắng Đen, ứng với trạng thái kết thúc Trong trò chơi Dodgem, giả sử Đen trước, ta có trò chơi biểu diễn hình Hình Cây trò chơi Dodgem với Đen trước Hàm đánh giá Trên hình 2, để tìm nước tối ưu cho quân Đen, ta phải duyệt hết qua tất đường ta tạo trò chơi Vậy để lựa chọn nước thích hợp, việc ta phải xây dựng Hàm đánh giá Hàm đánh giá Eval ứng với trạng thái u trò chơi với giá trị số Eval(u), giá trị đánh giá “độ lợi thế” trạng thái u Trạng thái u thuận lợi cho Trắng Eval(u) số dương lớn; u thuận lợi cho Đen Eval(u) số âm nhỏ; Eval(u) ≈ trạng thái không lợi cho Hàm Eval phải tính đến nhiều yếu tố: số quân lại bàn cờ, cách bố trí qn bàn cờ, … Eval(u) = +∞ (dương vô cùng) u cờ thắng Trắng Eval(u) = -∞ (âm vô cùng) u cờ thắng Đen Chú ý hàm Eval hàm đánh giá tĩnh (Static function) Nghĩa đánh giá tính tối ưu cờ cụ thể xảy mà không xem xét tồn cờ xảy chơi Chất lượng chương trình chơi cờ phụ thuộc nhiều vào hàm đánh giá Nếu hàm đánh giá cho ta đánh giá khơng xác trạng thái, hướng dẫn ta tới trạng thái xem tốt, thực tế lại bất lợi cho ta Thiết kế hàm đánh giá tốt việc khó, đòi hỏi ta phải quan tâm đến nhiều nhân tố: qn lại hai bên, bố trí quân đó,… có mâu thuẫn độ xác hàm đánh giá thời gian tính Hàm đánh giá xác đòi hỏi nhiều thời gian tính tốn, mà người chơi lại bị giới hạn thời gian phải đưa nước Bây ta đưa cách đánh giá trạng thái trò chơi Dodgem Mỗi quân Trắng vị trí bàn cờ cho giá trị tương ứng bảng hình 3a Còn quân Đen vị trí cho giá trị tương ứng bảng hình 3b: 30 35 40 -10 -25 -40 15 20 25 -5 -20 -35 10 -15 -30 a Giá trị quân trắng a Giá trị quân đen Hình Đánh giá qn trò chơi Dodgem Ngồi ra, quân Trắng cản trực tiếp quân Đen, thêm 40 điểm, cản gián tiếp thêm 30 điểm (hình 4) Tương tự, quân Đen cản trực tiếp qn Trắng thêm -40 điểm, cản gián tiếp thêm -30 điểm Hình Đánh giá tương quan quân Trắng Đen Áp dụng qui tắc trên, ta tính giá trị trạng thái hình 5a 75, giá trị trạng thái hình 5b -5 Hình Giá trị số trạng thái trò chơi Dodgem Trong đánh giá trên, ta xét đến vị trí quân mối tương quan quân Một cách đơn giản để hạn chế khơng gian tìm kiếm là, cần xác định nước cho Trắng u, ta xem xét trò chơi gốc u tới độ cao h áp dụng thủ tục Minimax cho trò chơi gốc u, độ cao h sử dụng giá trị hàm đánh giá cho đó, tìm nước tốt cho Trắng u Chiến lược cắt tỉa Alpha-Beta 3.1 Chiến lược MINIMAX Nguyên lý: Nước tối ưu dành cho v, nước duyệt qua tất đỉnh u, đỉnh tốt số đỉnh v Như vậy, vận dụng quy tắc trên, ta tìm hiểu hình bên dưới, Với Blue (Quân Trắng), ta chọn Max(các children), Red (Quân Đen), ta tìm Min(các children) Từ hình vẽ trên, ta xây dựng thủ tục đệ quy, gồm hàm, BlueValue() đại diện cho Quân trắng, nhằm tìm nước tối ưu cho ( Max(children)), ngược lại, RedValue() đại diện cho quân đen, tìm Miin(Children) cho Trong đó, MaxDepth độ sâu tối đa bạn duyệt đến, vậy, duyệt sâu, bạn tiến gần đến thắng lợi biến depth, khởi tạo giá trị ban đầu Như vậy, tùy vào quân Trắng hay quân Đen mà bạn gọi hàm BlueValue() trước RedValue() trước thông qua hàm Minimax() sau: Trong đó, v đỉnh mà ta cần tìm ( đường tối ưu giới hạn đó) Như vậy, bạn xây dựng thành cơng trò chơi Dodgame Nhưng để trò chơi diễn nhanh hơn, ta cần có hàm nhằm loại bỏ nước không cần thiết, vui lòng bạn xem thuật tốn AlphaBeta bên 3.2 Thuật tốn Alpha-Beta Trong chiến lược tìm kiếm Minimax, để tìm kiếm nước tốt cho Trắng trạng thái u, cho dù ta hạn chế khơng gian tìm kiếm phạm vi trò chơi gốc u với độ cao h, số đỉnh lớn với h >= Chẳng hạn, cờ vua, nhân tố nhánh trò chơi trung bình khoảng 35, thời gian đòi hỏi phải đưa nước 150 giây, với thời gian máy tính thơng thường chương trình bạn xem xét đỉnh độ sâu Một người chơi cờ tr.nh độ trung bình tính trước 5, nước nữa, chương trình bạn đạt trình độ người tập chơi! Khi đánh giá đỉnh u tới độ sâu h, thuật tốn Minimax đòi hỏi ta phải đánh giá tất đỉnh gốc u tới độ sâu h Song ta giảm bớt số đỉnh cần phải dánh khơng ảnh hưởng đến đánh giá đỉnh u Phương pháp cắt cụt alpha-beta cho phép ta cắt bỏ nhánh không cần thiết cho đánh giá đỉnh u Tư tưởng kỹ thuật cắt cụt alpha-beta sau: Nhớ lại rằng, chiến lược t.m kiếm Minimax chiến lược tìm kiếm theo độ sâu Giả sử q trính tìm kiếm ta xuống đỉnh a đỉnh Trắng, đỉnh a có người anh em v đánh giá Giả sử cha đỉnh a b b có người anh em u d đánh giá, giả sử cha b c (Xem hình trên) Khi ta có giá trị đỉnh c (đỉnh Trắng) giá trị u, giá trị đỉnh b (đỉnh Đen) nhiều giá trị v Do đó, eval(u) > eval(v), ta khơng cần xuống để đánh giá đỉnh a mà không ảnh hưởng dến đánh giá đỉnh c Hay nói cách khác ta cắt bỏ gốc a Lập luận tương tự cho trường hợp a đỉnh Đen, trường hợp eval(u) < eval(v) ta cắt bỏ gốc a Cụ thể hơn, ta có hình bên Trong khi, ta cố tìm giá trị cho A, Chúng ta xuống B, tìm giá trị là Min(6,9) Sau đó, ta qua C Từ đó, tính E là Max(4,-2) Do đó, C nhỏ hơn,Ngay lúc ta biết giá trị C = beta thay alpha>beta, điều làm tăng tốc độ cho chương trình Các hàm khởi tạo giá trị ban đầu sau: depth=0; alpha=infinity, beta=infinity Như vậy, tùy vào quân Trắng hay quân Đen mà bạn gọi hàm BlueValue() trước RedValue() trước thơng qua hàm AlphaBeta() sau: Trong đó, v đường tối ưu cần tìm 3.4 Các trường hợp cắt tỉa 3.4.1 Cắt tỉa Alpha Trường hợp cắt tỉa Alpha nút Max Giả sử ước xác định giá trị tốt nhánh có Min = 15 hình vẽ Ta bắt đầu tìm kiếm nhánh 2, ta tìm nhánh 2.1 giả sử ta nhận kết Min = 10 < 15 ta khơng cần tìm kiếm tiếp nhánh 2.2, giá Min 10, xét Max nút gốc Max 15 > 10 Do khơng cần xét nhánh lại 3.4.2 Cắt tỉa Beta Trường hợp cắt tỉa Beta nút Min Giả sử kết thúc trình tìm kiếm nút 1.1 đạt Max = 10 Bắt đầu tìm kiếm nhánh 1.2, ta tìm nhánh 1.2.1 giá nút 1.2.1 15, Max nút 1.2 15 > 10 Khi lấy Min nút Min

Ngày đăng: 18/09/2019, 00:09

Xem thêm: BÀI TOÁN TRÒ CHƠI DODGEM, CHƯƠNG I. BÀI TOÁN TRÒ CHƠI DODGEM, II. GIẢI QUYẾT BÀI TOÁN, Chiến lược cắt tỉa Alpha-Beta, CHƯƠNG II. XÂY DỰNG CHƯƠNG TRÌNH, Thủ tục chính chương trình

BÀI TOÁN TRÒ CHƠI DODGEM

Thông tin tài liệu

Từ khóa liên quan

Mục lục

MỞ ĐẦU

CHƯƠNG I. BÀI TOÁN TRÒ CHƠI DODGEM

I. MÔ TẢ BÀI TOÁN

1. Trò chơi tổng quát

2. Trò chơi Dodgem

II. GIẢI QUYẾT BÀI TOÁN

1. Cây trò chơi

2. Hàm đánh giá

3. Chiến lược cắt tỉa Alpha-Beta

3.1. Chiến lược MINIMAX

Nguyên lý: Nước đi tối ưu dành cho v, là nước đi duyệt qua tất cả các đỉnh con của u, là đỉnh tốt nhất trong số các đỉnh con của v.

Như vậy, vận dụng quy tắc trên, ta tìm hiểu hình bên dưới,

3.2. Thuật toán Alpha-Beta

Trong chiến lược tìm kiếm Minimax, để tìm kiếm nước đi tốt cho Trắng tại trạng thái u, cho dù ta hạn chế không gian tìm kiếm trong phạm vi cây trò chơi gốc u với độ cao h, thì số đỉnh cũng rất lớn với h >= 3.

Tài liệu cùng người dùng

Tài liệu liên quan