Nguyên lý cực đại Pontryagin cho hệ ô-tô-nôm

Thông tin tài liệu

TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI KHOA TOÁN NGUYỄN HỮU HẢI NGUYÊN LÝ CỰC ĐẠI PONTRYAGIN CHO HỆ Ô-TÔ-NÔM KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC Chuyên nghành: Giải tích HÀ NỘI - 2017 TRƯỜNG ĐẠI HỌC SƯ PHẠM HÀ NỘI KHOA TOÁN NGUYỄN HỮU HẢI NGUYÊN LÝ CỰC ĐẠI PONTRYAGIN CHO HỆ Ô-TÔ-NÔM KHÓA LUẬN TỐT NGHIỆP ĐẠI HỌC Chuyên nghành: Giải tích Người hướng dẫn khoa học TS TRẦN VĂN BẰNG HÀ NỘI - 2017 Mục lục Lời cảm ơn Lời cam đoan Lời nói đầu Một số kí hiệu Kiến thức chuẩn bị 1.1 Bài toán điều khiển tối ưu 1.2 Tính điều khiển hệ ô-tô-nôm 11 Nguyên lý cực đại Pontryagin cho hệ ô-tô-nôm 14 2.1 Nguyên lý cực đại Pontryagin cho hệ ô-tô-nôm 14 2.2 Ứng dụng 23 Kết luận 31 Tài liệu tham khảo 32 Lời cảm ơn Trước trình bày nội dung khóa luận, em xin bày tỏ lòng cảm ơn tới thầy cô giáo khoa Toán, trường Đại học Sư phạm Hà Nội 2, thầy cô giáo tổ môn Giải tích thầy cô tham gia giảng dạy tận tình truyền đạt tri thức quý báu tạo điều kiện thuận lợi cho em suốt trình học tập, nghiên cứu rèn luyện trường Đại học Sư phạm Hà Nội Đặc biệt em xin chân thành cảm ơn Thầy giáo hướng dẫn TS Trần Văn Bằng bảo tận tình, giúp đỡ em để em hoàn thành tốt khóa luận Do thời gian, lực điều kiện thân hạn chế nên khóa luận tránh khỏi sai sót Vì vậy, em mong nhận ý kiến góp ý quý báu thầy cô bạn Em xin chân thành cảm ơn! Hà Nội, tháng năm 2017 Sinh viên Nguyễn Hữu Hải Lời cam đoan Khóa luận kết nghiên cứu thân em hướng dẫn tận tình thầy giáo TS Trần Văn Bằng Trong nghiên cứu hoàn thành đề tài nghiên cứu em tham khảo số tài liệu ghi phần liệu tham khảo Khóa luận "Nguyên lý cực đại Pontryagin cho hệ ô-tô-nôm" trùng lặp với khóa luận khác Hà Nội, tháng năm 2017 Sinh viên Nguyễn Hữu Hải Lời nói đầu Lý chọn đề tài Lý thuyết điều khiển tối ưu nguyên lý gắn liền với hầu hết lĩnh vực khoa học thực tiễn Tuy nhiên mô hình điều khiển thường phức tạp Có nhiều công trình nghiên cứu điều khiển tối ưu, nhiên hầu hết điều kiện cần điều kiện đủ Điều kiện đủ quan trọng phương trình Hamilton-Jacobi-Bellman, trong điều kiện cần quan trọng phải kể đến Nguyên lý cực đại Pontryagin Nguyên lý Pontryagin học trò ông công bố vào năm 1965 Tuy nhiên điều kiện trừu tượng việc hiểu, vận dụng thực tế Với mong muốn nghiên cứu sâu nguyên lý cực đại hướng dẫn thầy giáo TS Trần Văn Bằng em mạnh dạn chọn đề tài "Nguyên lý cực đại Pontryagin cho hệ ô-tô-nôm" để làm khóa luận tốt nghiệp Mục đích nghiên cứu Khóa luận nhằm mục đích: Giúp người đọc tìm hiểu sâu nguyên lý cực đại Pontryagin cho hệ ô-tô-nôm lý thuyết điều khiển tối ưu Nhiệm vụ nghiên cứu Nghiên cứu nguyên lý cực đại Pontryagin ứng dụng nguyên lý với toán điều khiển tối ưu Đối tượng phạm vi nghiên cứu Đối tượng nghiên cứu: Nguyên lý cực đại cho hệ ô-tô-nôm Phạm vi nghiên cứu: Bài toán điều khiển tối ưu tất định đặc biệt toán điều khiển tối ưu cho hệ ô-tô-nôm Phương pháp nghiên cứu Sử dụng số phương pháp Giải tích hàm, toán tối ưu, tính điều khiển hệ ô-tô-nôm Bảng kí hiệu C, C[u(·)] Hàm chi phí C Tập điều khiển K(t, x0 ) Tập khả đạt thời điểm t T (t) Tập mục tiêu f0 C[u(·)] = t f (s, x[s], u(s))ds gradx H ˆ x, u) H, H(w, ∂H gradient= ( ∂x 1, ∂H ∂x2 , ∂H · · · , ∂x n ) ˆ ˆf (x, u) w, ˆ x) M(w, ˆ x, v) : v ∈ Ω} sup{H(w, Ω Hình lập phương đơn vị Rm Um t1 >0 Um (0, t1 ) Vm t1 >0 Vm (0, t1 ) xT Chuyển vị x < x, y > Tích vô hướng thông thường hai véc tơ x y : Rn Không gian Euclid n-chiều ∆ Lớp điều khiển thành công ix i i y Chương KIẾN THỨC CHUẨN BỊ 1.1 Bài toán điều khiển tối ưu Lý thuyết điều khiển quan tâm đến quản lý trạng thái hệ cách sử dụng điều khiển Bản chất có hệ biến đổi cố gắng để tác động đến trạng thái hệ thông qua điều khiển Động lực học hệ cách thức mà trạng thái thay đổi ảnh hưởng điều khiển, phức tạp thực tế Ngoài có hai khái niệm ràng buộc điều khiển trạng thái mục tiêu Ví dụ sau cho thấy cách điều khiển trạng thái hệ ràng buộc điều khiển mục tiêu hệ Ví dụ 1.1 (Mô hình động xe lửa) Xét xe lửa chạy đường ray theo hướng, có khối lượng (đơn vị) trang bị hai động phản lực hai đầu (Hình 1.1) Vấn đề đặt ta phải điều khiển xe từ vị trí cho trước đến địa điểm định sẵn gọi mục tiêu hay đích Để đơn giản, đặt đích gốc tọa độ kí hiệu vị trí tâm xe p(t) Nếu xe vị trí p0 thời Hình 1.1: Mô hình động xe lửa Hình 1.2: (Di chuyển sang phải)Lực hướng sang trái u(t∗ ) < điểm t = 0, với vận tốc v0 , phải kích hoạt hai động theo số phương thức (mô hình, chương trình) để đưa xe đến mục tiêu p = dừng lại (tức vận tốc 0) thời điểm t1 > Trong mô hình này, ta xác định hệ gồm có xe đường ray, trạng thái vectơ hai chiều x(t) = (p(t), p(t)); ˙ trạng thái ban đầu (p0 , v0 ) giả thiết cho Lý ta sử dụng vectơ hai chiều cho trạng thái đơn giản ta muốn biết vị trí tốc độ xe Mục tiêu hệ trạng thái (0, 0) Điều khiển u(t) hàm giá trị thực, biểu diễn lực tác động động lên xe thời điểm t Tại thời điểm t∗ , kích hoạt động bên phải nói lực tác động âm, kích hoạt động bên trái nói lực tác động dương Khi động lực hệ xác định định luật Newton F = ma, cụ thể p¨(t) = u(t) Ở dạng vectơ ta có: x(t) = p(t) p(t) ˙ , ˙ x(t) = 0 x(t) + u(t) Có ràng buộc độ lớn u(t), dựa kích thước động phản lực giới hạn chịu áp lực xe Một giả thiết hợp lý mặt toán học u(t) đo bị chặn, để đơn giản ta giả thiết |u(t)| ≤ Có lớp điều khiển tự nhiên lớp điều khiển liên tục khúc Đã cho điều khiển u(t) nghĩa cho phương thức kích hoạt động cơ, chẳng hạn:  +1, 0≤t≤1 u(t) =  −1 , < t ≤ Hình 2.4: ˆ [t] với pháp tuyến hóa vecto siêu phẳng di chuyển dọc theo x ˆ b(t) Trước ta phát biểu PMP, ta cần khái niệm Với điều khiển phản hồi (mở rộng) cho (ˆ x[·], u(·)) Ta lấy trạng thái bù ˆ w(·) lập hàm thực thời gian: n ˆ x ˆ , u) ≡ w, ˆ ˆf = H(w, wj (t)f j (x[t], u(t)) (2.2) j=0 Khi H hàm hamiltonan (1’) (2.3), tức ta viết: ∂H T ∂H ∂H ˆ˙ = gradwˆ H(w, ˆ x ˆ , u) = ( , , ··· , ) hầu khắp nơi x ∂w ∂w ∂wn (l”) ∂H ∂H ∂H T ˆ˙ = −gradxˆ H(w, ˆ x ˆ , u) = −( , w , · · · , ) hầu khắp nơi (2.3) ∂x ∂x1 ∂xn Khái niệm Hamiltonian bắt nguồn từ Cơ học Hàm H không phụ thuộc ˆ x, u) Bây ta xét vào x0 (vì f j không phụ thuộc vào x0 ) nên ta viết H(w, n H= ˆ x, v ∈ ψ Với vecto cố định wj f j (x, v) hàm vectơ w, j=0 n ˆ ∈ Rn+1 , ta định nghĩa: x ∈ R w ˆ x) = sup H(w, ˆ x, v) M(w, v∈ψ 19 Nói cách khác, M giá trị lớn H lấy vectơ ˆ x) cho, cách sử dụng giá trị chấp nhận v Và (w, bây giờ, ta phát triển PMP Định lí 2.1 (Nguyên lý cực đại Pontryagin) Chú ý đến toán điều khiển mở rộng (1) với điều khiển đo u(·) lấy giá trị tập bị chặn, cố ˆ [·]) cặp điều khiển-phản hồi tối ưu Khi định ψ ∈ Rm Giả sử (u(·), x ˆ tồn hàm liên tục tuyệt đối w(·) nghiệm (2.3) hầu khắp nơi [t0 , t1 ], với ˆ ˆ (i) H(w(t), x[t], u(t)) = M(w(t), x[t]) hầu khắp nơi ˆ (ii) M(w(t), x[t]) ≡ [t0 , t1 ] ˆ [t0 , t1 ] ˆ (iii) w0 (t) ≡ w0 (t0 ) ≤ w(t) =0 Nguyên lý nói u(·) tối ưu (1), có cặp phản ˆ ˆ hồi-liên hợp, (ˆ x[·], w(·)), cho thời điểm t, H(w(t), x[t], v) ≤ với v ∈ ψ, đẳng thức đạt v = u(t) (nó đạt giá trị khác v) Phần đạt cực trị định lý giúp ta tách lớp nhỏ ứng cử viên cho điều khiển tối ưu Chúng ta nhấn mạnh có tập khác rỗng ứng cử viên toán điều khiển tối ưu nguyên lý cực đại Giả thiết toán có điều khiển tối ưu Đây lý cần điều kiện đủ (điều kiện đảm bảo tồn điều khiển tối ưu) Chú ý 2.1 Chú ý nguyên lý cực đại Pontryagin áp dụng vào toán cực tiểu hóa Nếu ta muốn cực đại hóa chi phí: t1 J[u(·)] = g(x[s], u(s))ds ta cần áp dụng PMP vào toán cực tiểu hóa với C[u(·)] = −J[u(·)] f = −g 20 Ví dụ 2.2 Để giúp người đọc làm quen với kí hiệu khái niệm sử dụng PMP, nghiên cứu kĩ ứng dụng toán tối ưu-thời gian xe lửa  p x= q  x    ˆ= , x  p  , C[u(·)] = q t1 1dt = t1      x˙ = 1, p˙ = q, q˙ = u, ˆf (x, u) =  q  u     000 w     ˆfxˆ =  0  , w  ˆ =w    , w2 000 w˙ = w˙ = 0, w˙ = −w1 ˆ x, v) = ˆf , w ˆ = w0 (0) + w1 (0)q + [w2 (0) − w1 (0)t]v H(w, Theo PMP, u(·) điều khiển tối ưu-thời gian, có số wi (0), i = 0, 1, 2, cho H ≤ với v ∈ ψ, H = hầu khắp nơi Khi v = u(t) Chẳng hạn ψ = Ω ≡ [−1, 1], rõ ràng M = max H = w0 (0) + w1 (0)q[t] + w2 (0) − w1 (0)t , v∈ψ đạt u(t) = sgn[w2 (0) − w1 (0)t] Hàm tuyến tính w2 (0) − w1 (0)t đồng không, triệt tiêu điểm, tồn điều khiển tối ưu-thời gian hặc đồng không hầu khắp nơi bang-bang Thật đồng không ˆ w1 (0) = w2 (0) = có w0 (0) = 0(w(t) không triệt tiêu), điều suy H ≡ w0 (0) = M = maxv∈ψ H = w0 (0) = mâu thuẫn với giả thiết (ii) PMP Chú ý tất kết luận ˆ suy mà dạng xác w(t) 21 Trước minh họa cách sử dụng PMP, ta cần giảm mối lo ngại tính hầu khắp nơi phần (i) ˆ ˆ Bổ đề 2.1 Đẳng thức (i) H(w(t), x[t], u(t)) = M(w(t), x[t]) (hầu khắp nơi) PMP, thảo mãn điểm t, có dãy tk −→ t với H = M điểm tk u(tk ) −→ u(t) Nói riêng (i) điểm liên tục trái liên tục phải u(·) Chứng minh Chọn tk −→ t với u(tk ) −→ u(t) H = M tk Với v ∈ ψ ta có ˆ k ), x[tk ], u(tk )) ≥ H(w(t ˆ k ), x[tk ], v) H(w(t ˆ ˆ x, u) ta cho tk −→ t w(·), x[·] liên tục, H hàm liên tục (w, ta thu ˆ ˆ H(w(t), x[t], u(t)) ≥ H(w(t), x[t], v) Vì v ∈ ψ tùy ý, nên ta có điều phải chứng minh Hệ quả: Xét toán tối ưu hóa mô tả PMP, với u(·) bị hạn ˆ [·]) chế lớp VP S hàm trơn khúc với giá trị ψ Nếu (u(·), x ˆ có đạo ˆ cặp tối ưu tồn trạng thái bù liên tục w(·), khác 0, hàm lên tục khúc, cho ˆ˙ = −[ˆfxˆ ]T w ˆ w ∀t, trừ hữu hạn điểm (và điểm đó, giới hạn phía ˆ˙ −[ˆfxˆ ]T w ˆ tồn nhau) Thêm (i), (ii), (iii) PMP w khắp nơi Kết luận thay VP S VP CN - lớp điều khiển liên tục khúc với giá trị ψ ˆ˙ = −[ˆfxˆ ]T w ˆ trừ Chứng minh Khẳng định không hiển nhiên w số hữu hạn điểm Điều xuất phát trực tiếp từ phương pháp giải phương trình có dạng y˙ = A(t)y với A(t) liên tục khúc Đã cho giá trị y(t0 ) = y0 với t0 , phương trình vi phân giải đoạn [an , bn ] mà A(t) liên tục, cách sử dụng giá trị y(bn ) làm giá 22 trị ban đầu cho đoạn Nghiệm rõ ràng trơn khúc y˙ = A(t)y khắp nơi, ngoại trừ điểm gián đoạn A (tại giới hạn phía nhau) Để chứng minh A(t) ≡ −[ˆfxˆ (x[t], u(t))]T liên tục khúc ta cần x[·] liên tục khúc Nhưng x[·] nghiệm x˙ = f (x, u(t)) hầu khắp nơi, vế phải liên tục khúc theo t (do f liên tục u(·) liên tục khúc ) nên sinh nghiệm liên tục khúc theo cách vừa nêu 2.2 Ứng dụng Ví dụ 2.3 Chúng ta quay lại với toán điều khiển xe lửa, tiếp tục phần thảo luận toán động xe lửa, để minh họa K(t; x0 ),RC(x0 ), khái niệm tính điều khiển được, xây dựng điều khiển tối ưu tính tối ưu Ta có: p˙ = q, q˙ = u, x = t1 với C[u(·)] = p q [q[s]]2 ds (λ1 = λ3 = 0, λ2 = 1) Chúng ta cho phép u(·) t0 hàm liên tục khúc thỏa mãn −1 ≤ u(t) ≤ (u(·) ∈ VP CN ) ta xác định vị trí 0, vận tốc không mục tiêu cần đặt: T (t) ≡ (0, 0)T Ta chứng tỏ tồn điều khiển tối ưu trạng thái ban đầu x0 = (p0 , q0 )T nằm "đường cong chuyển điều khiển" (+) (−) phác họa (Hình 2.5) Nhớ lại (+) phản hồi qua mục tiêu u(t) ≡ +1 (−) phản hồi qua mục tiêu u(t) ≡ −1 Trong chương ta đưa chế điều khiển (không có hạn chế chi phí) trạng thái ban đầu mục tiêu theo cách đơn giản (Hình 2.6): (a) Nếu x0 nằm phía (+) (−), sử dụng u(t) ≡ −1 chạm (+), chuyển sang u(t) ≡ +1 (b) Nếu x0 nằm phía (+) (−), sử dụng u(t) ≡ +1 23 Hình 2.5: Hình 2.6: Quỹ đạo nét đứt trường hợp (a); Quỹ đạo chấm (b); Trạng thái chuyển điều khiển chạm (−), chuyển sang u(t) ≡ −1 Tất nhiên, cách tối ưu để thực trường hợp có hàm chi phí PMP nói điều khiển tối ưu, trừ ta đường cong (+) (−) Để áp dụng PMP, ta đặt t0 = cho thuận tiện Vì toán ô-tônôm, nên điều không làm tính tổng quát Chi phí động x0 [t] = t ˆ [t] = (x0 [t], p[t], q[t])T Để giữ [q[s]]2 ds, vectơ trạng thái mở rộng x số đến mức tối thiểu, ta viết   α(t)    ˆ˙ ˆ ˆ w(t) = = −[ˆfxˆ (x[t], u(t))]T w(t)  β(t)  , w(t) γ(t) (2.4) cho trạng thái bù liên kết với cặp thành công (x[·], u(t)) Phương 24 trình (2.4) viết   00   ˆfxˆ (x, u)T =  0  , α˙ = = β, ˙ γ˙ = −2qα − β,   2q α(t) ≡ α(0), β(t) ≡ β(0) Khi ˆ x, v) = w, ˆ ˆf (x, u) = α[q]2 + βq + γv H(w, PMP khẳng định (ˆ x[·], u(·)) tối ưu có trạng thái bù cho với t [0, t1 ], H ≡ α(0)[q[t]]2 + β(0)q[t] + γ(t)v ≤ với tất số −1 ≤ v ≤ +1 H = với v = u(t) Nói chung phương trình ˆ˙ = ˆf (x, u) (2.3) thỏa mãn hầu khắp nơi, u(·) liên x tục khúc nên hệ áp dụng Theo (iii) PMP, w0 (t) ≡ α(t) ≡ α(0) ≤ Trường hợp 1: α(0) = Khi α(t) ≡ 0, β(t) ≡ β(0), γ(t) = −β(0)t + γ(0), ˆ ˆf = β(0)q[t] + [γ(0) − β(0)t]v, H = w, ˆ x) = β(0)q[t] + |γ(0) − β(0)t| ≡ max H = M(w, −1≤v≤+1 Ta sử dụng lớp điều khiển UP C , nên hệ áp dụng điều khiển tối ưu phải thỏa mãn H = M = khắp nơi Bởi vậy, u(t) = sgn[γ(0) − β(0)t], M ≡ β(0)q[t] + |γ(0) − β(0)t| ≡ 0, ≤ t ≤ t1 Do α(0) = 0, nên theo giả thiết, γ(0) − β(0)t đồng không ˆ Do u(·) Bang-Bang với nhiều lần chuyển giá ˆ (w(t) = 0) trị điều khiển Nếu γ(t) không đổi dấu u(t) ≡ +1 u(t) ≡ −1 Trong hai trường hợp ta đạt tới mục tiêu cách xuất phát (+) (−) 25 Bây giả sử γ(t) = γ(0) − β(0)t đổi dấu t = τ > Khi γ(0) = β(0) = τ, γ(τ ) = 0, H = β(0).q[τ ] = M = Thật q[τ ] = Bây u(t) chuyển giá trị lần thời điểm τ, u(t) ≡ +1 u(t) ≡ −1 với t > τ Vì để tiến đến mục tiêu thời điểm t1 > τ, ta phải đường (+) ∪ (−) thời điểm τ Nhưng có điểm (+) ∪ (−) với q(τ ) = điểm gốc Do đạt đến mục tiêu thời điểm τ, việc chuyển giá trị không cần thiết Nhưng đến mục tiêu chuyển đổi giá trị phải bắt đầu xuất phát (+) ∪ (−) Trường hợp 2: α(t) ≡ α(0) < Vì (2.3) tuyến tính, nên không −1 ˆ tính tổng quát ta giả thiết α(t) ≡ −1 (chỉ cần nhân w(t) với α(0) để có nghiệm (2.3) - mà không thay đổi max H = 0) ˆ x, v) = −[q[t]]2 + β(0)q[t] + γ(t)v, H = (w, max H = M = −[q[t]]2 + β(0)q[t] + |γ(t)| , v∈Ω Vì giống trước ta có u(t) = sgnγ(t) Hàm γ(t) nói chung không tuyến tính: γ(t) ˙ = 2q[t] − β(0) Ta muốn u(t) = sgnγ(t) lại BangBang, tiếc γ(t) triệt tiêu tập lớn Ta chứng tỏ γ(t) triệt tiêu nhiều đoạn ( điểm) Trên khoảng ta u(t) ≡ Vì điều khiển tối ưu không "Bang-Bang" mà "Bang-coast-Bang" Cuối chứng tỏ trường hợp thứ xảy Thực tế ta có u(t) chuyển giá trị từ +1 sang -1, chuyển từ -1 sang +1 Bởi không chuyển giá trị có thể, u(t) ≡ +1 u(t) ≡ −1 Điều buộc phải xuất phát (+) ∪ (−) Bây ta vào chi tiết Ta có γ(t) ˙ = 2q[t] − β(0), γ¨ = 2u(t) = 2sgnγ(t) 26 Hình 2.7: Ở γ¨ (·) liên tục khúc Bởi vậy, γ(τ ) > ⇒ γ(t) lõm lên gần τ, γ(τ ) < ⇒ γ(t) lõm xuống gần τ Hình 2.7 dạng địa phương cho γ(t), dấu chấm điểm (τ, γ(τ )) Chú ý rằng, γ(t) có không điểm phân biệt (cố gắng phác họa nó) Chính xác hơn, γ(a) = γ(b) = γ(t) ≡ [a, b] Bởi γ(t) triệt tiêu đoạn Trên khoảng I vậy, γ(t) ≡ kéo theo γ(t) ˙ ≡ 0, 2q[t] − β(0) ≡ ⇒ q[t] ≡ số ⇒ q[t] ˙ ≡ Nhưng q[t] ˙ = u(t), nên u(t) ≡ I Cuối chứng tỏ điều khiển tồn tại, thực tế, không chuyển giá trị Giả sử u(·) chuyển từ +1 sang -1 τ Lúc u(t) = sgnγ(t) nên hàm liên tục γ(t) chuyển từ không âm sang âm τ, (như nhận xét trên) triệt tiêu lần Vì u(t) ≡ −1 với t ≥ τ (p[τ ], q[τ ]) phải nằm (+) (−) Do q(t) ˙ = u(t) ≡ −1 với t ≥ τ mục tiêu q[t1 ] = 0, nên ta có q[τ ] > Bây γ(τ ) = nên t = τ ta có H = −[q[τ ]]2 +β(0)q[τ ] = Nhưng q[τ ] > 0, nên điều suy q[τ ] = β(0) Vì γ(t) từ không âm đến âm τ, nên ≥ γ[τ ˙ ] = 2q[τ ] − β(0) = q[τ ], 27 mâu thuẫn với q[τ ] > Bởi chuyển giá trị điều khiển tối ưu Trường hợp chuyển từ −1 sang +1 hoàn toàn tương tự Bởi điều khiển tối ưu tồn với trạng thái ban đầu (+) (−) trường hợp này, u(t) ≡ +1 u(t) ≡ −1 toàn đoạn [t0 , t1 ] Ví dụ 2.4 Xét toán điều khiển xe lửa, với hàm chi phí khác: t1 C[u(·)] = (1 + [q[t]]2 )dt (λ1 = λ2 = , λ3 = 0) t0 Chúng ta cực tiểu hóa 2C[u(·)] để đơn giản viết PMP cho x˙ = + [q]2 p˙ = q, α˙ = 0, (2.3) β˙ = 0, (2.5) α˙ = 2qα − β, q˙ = u, với hàm Hamiton H = α(1 + [q]2 ) + βq + γv ˆ x) = max H = α(1 + [q]2 ) + βq + |γ| , M(w, v∈ψ nên u(t) = sgnγ(t) Chú ý α(t) ≡ α(0) Lập luận ví dụ trước, α(t) ≡ α(0) = x0 = (p0 , q0 )T nằm (+) ∪ (−) Bây giả sử α(0) < 0; giống trước, không tính tổng quát ta giả sử α(t) ≡ α(0) = −1 Trong trường hợp ta có β(t) ≡ β(0), γ(t) ˙ = 2q[t] − β(0) (2.6) H = −(1 + [q]2 ) + β(0)q[t] + γ(t)u(t) Như trước, γ¨ = 2u(t) = 2sgnγ(t), nên γ(t) có dạng địa phương phác họa Hình 2.7 Bởi vậy, γ(t) triệt tiêu khoảng 28 Hình 2.8: (hoặc điểm) I Vì điều khiển tối ưu u(·) khúc với    +1 γ(t) >    u(t) = γ(t) =     −1 γ(t) < Chúng ta chứng tỏ có điều khiển tối ưu với trạng thái ban đầu x0 , xây dựng Giả sử u(t) ≡ khoảng I, ta có γ(t) ≡ I Khi γ(t) ˙ ≡ phương trình (2.6) suy 2q[t] ≡ β(0) I Ta có H = −(1 + [q[t]]2 ) + β(0)q[t] ≡ 0, nên [q[t]]2 ≡ I Điều có nghĩa có khoảng thời gian I, u(t) ≡ cho phép xe lửa lao với vận tốc cố định +1 −1 Ta chứng tỏ PMP chọn ứng cử viên cho điều khiển tối ưu, với trạng thái ban đầu chế điều khiển cho Hình 2.8 Hình 2.8: u(t) ≡ đường nét đứt, u(t) ≡ +1 (+), u(t) ≡ −1 (−) u(t) ≡ −1 miền I, II, III, u(t) ≡ +1 miền V, VI, VII, VIII Một số phản hồi tối ưu điển hình phác họa Hình 2.9 Điều khiển cho x0 "Bang-off-Bang" với q0 < +1 Điều khiển cho x# "BangBang" Điều khiển cho x∗0 "Bang-off-Bang" với q0 < −1 29 Hình 2.9: Để chứng tỏ chế điều khiển suy PMP, chứng tỏ u(t) = sgnγ(t) chuyển từ +1 sang −1 thời điểm τ < q[τ ] ≤ Tại τ, γ(τ ) = với t ≥ τ, γ¨ (t) = u(t) = sgnγ(t) = −1 đổi giá trị Khi q[t] = u(t) = −1 với t ≥ τ Vì trạng thái mục tiêu xác định q[t1 ] = 0, nên ta phải có ≤ q[τ ] Nhưng q[τ ] = H = −(1 + [q[t]]2 ) + β(0)q(τ ) = (2.7) Bởi q[τ ] > (2.7) kéo theo β(0) q[τ ] dương Do γ(t) chuyển từ không âm sang âm τ nên ≥ γ(τ ˙ ) = 2q[τ ] − β(0) Phương trình (2.7) lập luận suy ≥ −1 + [q[τ ]]2 , tức ≥ [q[τ ]]2 Do < q[τ ] ≤ Lập luận tương tự ta có u(·) chuyển từ −1 sang +1 τ −1 ≤ q[τ ] < Các ràng buộc q[τ ] tai thời điểm τ đòi hỏi phải chuyển đến đường nét đứt Hình 2.8 theo phản hồi chuyển động xa trục p - không không đến mục tiêu Một thí nghiệm nhỏ chứng tỏ "Bang-off-Bang" cách để đạt tới gốc 30 Hình 2.10: quỹ đạo (nhớ chuyển đổi giá trị nhiều lần) Với quỹ đạo chuyển động phía trục p, việc phân tích không khó Từ trạng thái x0 2.10, ta bắt đầu với u(t) = +1 (nét đứt), u(t) = (phần chấm) u(t) = −1 (nét liền) Tuy nhiên, theo phân tích đường nét chấm xảy q[t] ≡ +1, nên đường nét chấm Quỹ đạo nét đứt (i) Chúng ta chuyển từ +1 sang −1 trừ −1 ≤ q[τ ] < Do không chuyển tới quỹ đạo "rơi" (ii) Việc chuyển từ +1 sang yêu cầu q[τ ] = có q = Lập luận tương tự với trường hợp lại t1 Nghiên cứu Hình 2.8 hàm chi phí (1 + [q]2 )dt dẫn tới nhận xét sau: vận tốc nhỏ, tích phân [q]2 nhỏ nhiều so với tích phân số hạng Vì nên điều khiển theo cách tối ưu thời gian Với vận tốc lớn [q]2 > 1, chiến lược nên (và là) giảm vận tốc nhanh Phân tích tương tự thực hàm chi phí: λ + (1 − λ)[q]2 31 KẾT LUẬN Trong khóa luận tìm hiểu Nguyên lý cực đại Pontryagin số ứng dụng cách hệ thống Các khái niệm trừu tượng xuất phát phát biểu ví dụ nguyên lý cực đại ứng dụng nguyên lý cực đại Pontryagin cho hệ ô-tô-nôm toán điều khiển tối ưu 32 Tài liệu tham khảo [1] A A Agrachev and Y Sachkol (2004), Control Theory from the Geometric View-point, Vol 87 of Encyclopedia of Mathematical Sciences, Springer-Verlag, New York [2] Andrew D Lewis (2006), The Maximum Principle of Pontryagin in control and in optimal control, Queen’s University, Kingston, ON K7L 3N6, Canada [3] Klaus schmitt, Russell C Thompson (2004), Nonlinear Analysis and Differen tial Equation An Introduction, Department of Mathematics and Statistics Utah State University [4] L D Berkovitz (1974), Optimal Control Theory, Springer-Verlag, New York [5] Jack Macki, Aaron Strauss (1982), Introduction to Optimal Control Theory, Springer New York 33 ... 1.2 Tính điều khiển hệ ô-tô-nôm 11 Nguyên lý cực đại Pontryagin cho hệ ô-tô-nôm 14 2.1 Nguyên lý cực đại Pontryagin cho hệ ô-tô-nôm 14 2.2 Ứng dụng ... tài "Nguyên lý cực đại Pontryagin cho hệ ô-tô-nôm" để làm khóa luận tốt nghiệp Mục đích nghiên cứu Khóa luận nhằm mục đích: Giúp người đọc tìm hiểu sâu nguyên lý cực đại Pontryagin cho hệ ô-tô-nôm. .. Nếu rankMf = n ∈ intC (NLA) 13 (1.3) Chương NGUYÊN LÝ CỰC ĐẠI PONTRYAGIN CHO HỆ Ô-TÔ-NÔM 2.1 Nguyên lý cực đại Pontryagin cho hệ ô-tô-nôm Ta xét ô-tô-nôm: x˙ = f (x), x[t] ∈ Rn , u(t) ∈ Rm (2.1)

Ngày đăng: 16/06/2017, 11:04

Xem thêm: Nguyên lý cực đại Pontryagin cho hệ ô-tô-nôm, Nguyên lý cực đại Pontryagin cho hệ ô-tô-nôm

Nguyên lý cực đại Pontryagin cho hệ ô-tô-nôm

Thông tin tài liệu

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan