BÀI TOÁN điều KHIỂN tối ưu và NGUYÊN lý cực đại

VIỆN HÀN LÂM KHOA HỌC VÀ CÔNG NGHỆ VIỆT NAM VIỆN TOÁN HỌC ———————o0o——————– BÀI TOÁN ĐIỀU KHIỂN TỐI ƯU VÀ NGUYÊN LÝ CỰC ĐẠI LUẬN VĂN THẠC SĨ Chuyên ngành: Toán giải tích Mã số: 60 46 01 02 Học viên thực hiện: Lớp: Người hướng dẫn khoa học: Vũ Thị Hướng Cao học K19 GS TSKH Nguyễn Đông Yên HÀ NỘI - 2013 Mục lục Danh mục ký hiệu ii Lời nói đầu 1 Kiến thức sở 1.1 Phương trình vi phân tuyến tính 1.2 Phương trình vi phân phi tuyến 3 Bài 2.1 2.2 2.3 2.4 toán điều khiển tối ưu nguyên lý cực đại Pontriagin Một số ví dụ điều khiển tối ưu Dạng tổng quát toán điều khiển tối ưu Nguyên lý cực đại Pontriagin Các ví dụ minh họa 9 12 15 17 Chứng minh nguyên lý cực đại 22 Kết luận 29 i Danh mục ký hiệu trường số thực ∅ tập rỗng x∈M phần tử x thuộc tập M y∈ /M phần tử y không thuộc tập M ∀x với x ∃x tồn x M ⊆N M tập N |x| giá trị tuyệt đối x ||x|| chuẩn x x, y tích vô hướng vectơ x, y f x0 , y giá trị toán tử fx0 y fx (x0 , y0 ) đạo hàm hàm f theo biến thứ điểm (x0 , y0 ) x(t) ˙ đạo hàm x(.) t R dx dt max f (x) x∈K f (x) x∈K đạo hàm x(.) t maximum tập số thực {f (x) | x ∈ K} minimum tập số thực {f (x) | x ∈ K} tập ma trận cấp m × n A = (aij ) ma trận A với thành phần aij A∗ ma trận chuyển vị ma trận A −1 A ma trận nghịch đảo ma trận A phần tử không không gian vectơ M (m, n) ii Lời nói đầu Nguyên lý cực đại Pontriagin [4, Theorem 1, tr 19] định lý phức tạp, bao gồm biểu thức cực trị toán học liên quan đến nghiệm hệ phương trình vi phân phi tuyến nghiệm hệ phương trình vi phân tuyến tính liên hợp, mà từ ta đoán nhận điều khiển tối ưu hay không Tức nguyên lý cực đại cho ta điều kiện cần tối ưu toán điều khiển tối ưu Có nhiều dạng phát biểu nhiều cách chứng minh nguyên lý cực đại Pontriagin khác Nguyên lý cực đại cho toán điều khiển tối ưu với thời gian cuối cố định điểm cuối chưa cho trước trường hợp nguyên lý cực đại Pontriagin [4] Dạng tổng quát nguyên lý phát biểu cho trường hợp điểm cuối cố định ràng buộc thời gian kết thúc chuyển động quỹ đạo Chứng minh nguyên lý cực đại dạng tổng quát L S Pontriagin đồng tác giả trình bày chi tiết [4], với 36 trang in, thông qua 11 bổ đề Luận văn trình bày nguyên lý cực đại cho toán điều khiển tối ưu với thời gian cuối cố định phần chứng minh ngắn nguyên lý theo chuyên khảo J Zabczyk [5, Theorem 3.1, tr 152–153] Chúng chưa rõ liệu từ nguyên lý cực đại cho toán điều khiển tối ưu với thời gian cuối cố định ta suy nguyên lý dạng tổng quát nói đến đoạn hay không Luận văn gồm ba chương Chương “Kiến thức sở” trình bày số kiến thức phương trình vi phân tuyến tính phi tuyến Đây kiến thức bản, phục vụ trực tiếp cho việc giải phương trình liên hợp phương trình vi phân tuyến tính không dừng Chương 2, công cụ chứng minh Chương Chương “Bài toán điều khiển tối ưu nguyên lý cực đại Pontriagin” đưa toán điều khiển tối ưu dạng tổng quát nguyên lý cực đại Pontriagin Chương bao gồm số ví dụ thực tế lý thuyết toán Lời nói đầu học dẫn đến toán điều khiển tối ưu số ví dụ trình bày chi tiết việc áp dụng nguyên lý cực đại Chương “Chứng minh nguyên lý cực đại” trình bày chi tiết chứng minh nguyên lý cực đại Pontriagin cho trường hợp thời gian cuối cố định Chứng minh tham khảo chuyên khảo [5, tr 153–154] Ngoài việc chuyển ngữ, tác giả luận văn đưa thêm vào chứng minh gốc J Zabczyk, gồm chưa đến hai trang in, nhiều phân tích diễn giải cần thiết Trong viết luận văn, tác giả tham khảo chuyên khảo [3, 4, 5], giáo trình [1] GS TSKH Vũ Ngọc Phát, tập giảng [2] GS TSKH Nguyễn Đông Yên Luận văn hoàn thành Viện Toán học, Viện Hàn lâm Khoa học Công nghệ Việt Nam, hướng dẫn GS TSKH Nguyễn Đông Yên Tác giả chân thành cảm ơn thầy Nguyễn Đông Yên nghiên cứu sinh thầy giúp đỡ nhiều trình tác giả làm luận văn Tác giả xin bày tỏ lòng biết ơn thầy cô cán công nhân viên Viện Toán học quan tâm giúp đỡ suốt trình học tập nghiên cứu Viện Hà Nội, ngày 25 tháng 08 năm 2013 Vũ Thị Hướng Chương Kiến thức sở Chương gồm hai mục Mục thứ trình bày số kiến thức liên quan đến phương trình vi phân tuyến tính Mục thứ hai nhắc lại vài kết phương trình vi phân phi tuyến 1.1 Phương trình vi phân tuyến tính Định lý 1.1.1 (Xem [5, tr 11]) Xét phương trình tuyến tính   dq = A(t)q(t) + a(t) dt (1.1) q(t ) = q ∈ Rn 0 đoạn [0, T ] cố định, t0 ∈ [0, T ], A(t) ∈ M (n; n), A(t) = (aij (t))ni,j=1 , a(t) ∈ Rn , a(t) = (ai (t))ni=1 , t ∈ [0, T ] Giả sử phần tử hàm A(.) khả tích địa phương Khi tồn hàm S(t), t ∈ [0, T ], lấy giá trị M (n, n) có thành phần hàm số liên tục tuyệt đối cho   d S(t) = A(t)S(t) với hầu khắp t ∈ [0, T ], dt (1.2) S(0) = I Hơn nữa, ma trận S(t) khả nghịch với t ∈ [0, T ], nghiệm (1.1) viết dạng t q(t) = S(t)S −1 (t0 )q0 + S(t)S −1 (s)a(s)ds, t ∈ [0, T ] (1.3) Ma trận S(t) gọi ma trận nghiệm phương trình (1.1) Người ta S(t) ma trận ghép cột Si (t) Chương Kiến thức sở nghiệm hệ y(t) ˙ = A(t)y(t) y(0) = ei , ei vectơ đơn vị thứ i Rn Sau ví dụ minh họa cho khái niệm ma trận nghiệm công thức (1.3) Ví dụ 1.1.1 Xét hệ phương trình vi phân tuyến tính không dừng    q˙1 (t) = t q˙ (t) = 2tq (t) + et   q(0) = ∈ R2 Đặt A(t) = 0 2t a(t) = t2 et (1.4) Để giải hệ phương trình (1.4) ta tính ma trận nghiệm S(t) Bài toán y(t) ˙ = A(t)y(t) y(0) = e1 , với y(t) = (y1 (t) y2 (t))∗ , ∗ ký hiệu phép chuyển vị ma trận, viết thành   y˙ (t) =     y˙ (t) = 2ty (t)  y1 (0) =     y (0) = Giải hệ ta thu y(t) = t2 Tương tự, giải toán y(t) ˙ = A(t)y(t) y(0) = e2 ta tìm nghiệm y(t) = Vậy ma trận nghiệm hệ (1.4) S(t) = t2 Chương Kiến thức sở Ta có −1 S(t)S −1 (s)a(s) = = = 1 s2 t2 s2 es s2 es 2 t −s s2 t2 s2 − s4 + es Áp dụng công thức (1.3) ta thu p1 (t) p2 (t) = t s ds t 2 (t s − s4 + es )ds = t3 /3 2t5 /15 + et − Bổ đề sau mô tả công thức tính đạo hàm tích hai ma trận Bổ đề 1.1.1 Giả sử A(t), B(t) ∈ M (n, n), với t ∈ [0, T ], ma trận hàm có thành phần khả vi điểm Khi đó, ta có d d d [A(t)B(t)] = A(t) B(t) + [ A(t)]B(t) dt dt dt Chứng minh Ta có  a11 (t) a12 (t) a1n (t)   (1.5) b11 (t) b12 (t) b1n (t)  a (t) a (t) a (t) 22 2n  21 A(t) =     b (t) b (t) b (t) 22 2n   21  , B(t) =    an1 (t) an2 (t) ann (t) bn1 (t) bn2 (t) bnn (t) Do vậy,  n n a1j (t)bj1 (t)      A(t)B(t) =      j=1 n n a1j (t)bj2 (t) j=1 n j=1 n  a1j (t)bjn (t)    a2j (t)bj1 (t) a2j (t)bj2 (t) a2j (t)bjn (t)   j=1 j=1 j=1     n n n  anj (t)bj1 (t) j=1 anj (t)bj2 (t) j=1 anj (t)bjn (t) j=1      Chương Kiến thức sở Lấy vi phân hai vế đẳng thức cuối ta      d  [A(t)B(t)] =  dt     n a˙ 1j (t)bj1 (t) + a1j (t)b˙ j1 (t)] j=1 n n   [a˙ 2j (t)bjn (t) + a2j (t)b˙ jn (t)]   j=1     n  ˙ [a˙ nj (t)bj1 (t) + anj (t)b˙ j1 (t)] j=1 Suy  [a˙ 1j (t)bjn (t) + a1j (t)b˙ jn (t)]  j=1 n [a˙ 2j (t)bj1 (t) +2j (t)b˙ j1 (t)] j=1 n [a˙ nj (t)bjn + anj (t)bjn ](t) j=1 d d d [A(t)B(t)] = A(t) B(t) + [ A(t)]B(t) Bổ đề chứng minh dt dt dt Mệnh đề sau kết biết Để việc trình bày trọn vẹn, đưa chứng minh chi tiết Nhắc lại ma trận chuyển vị ma trận A ký hiệu A∗ Mệnh đề 1.1.1 Nếu phương trình dq = A(t)q(t) dt (1.6) có ma trận nghiệm S(t) phương trình dp = −A∗ (t)p(t) dt (1.7) có ma trận nghiệm [S ∗ (t)]−1 Chứng minh Vì S(t) ma trận nghiệm (1.6), ta có   d S(t) = A(t)S(t) với hầu khắp t ∈ [0, T ], dt S(0) = I Ta chứng minh   d [S ∗ (t)]−1 = −A∗ (t)[S ∗ (t)]−1 dt [S ∗ (0)]−1 = I với hầu khắp t ∈ [0, T ], Tính chất [S ∗ (0)]−1 = I suy trực tiếp từ tính chất S(0) = I Theo Bổ đề 1.1.1, A(t) ma trận hàm khả vi, khả nghịch t ∈ [0, T ], A(t)A−1 (t) = I với t ∈ [0, T ], Chương Kiến thức sở nên ta có d d A(t)A−1 (t) + A(t) [A−1 (t)] = dt dt Suy d −1 d A (t) = −A−1 (t) [A(t)]A−1 (t) dt dt Vì vậy, d ∗ −1 d [S (t)] = −[S ∗ (t)]−1 S ∗ (t)[S ∗ (t)]−1 dt dt = −[S ∗ (t)]−1 S ∗ (t)A∗ (t)[S ∗ (t)]−1 (do d ∗ S (t) = S ∗ (t)A∗ (t)) dt = −A∗ (t)[S ∗ (t)]−1 Mệnh đề chứng minh 1.2 Phương trình vi phân phi tuyến Xét phương trình vi phân dx = f (x(t), t), x(t0 ) = x0 , dt (1.8) f : Rn × R −→ Rn , x(.) : [0, T ] −→ Rn , t0 ∈ [0, T ] Định nghĩa 1.2.1 Nghiệm phương trình (1.8) hàm liên tục tuyệt đối x(.) : [0, T ] −→ Rn thỏa mãn (1.8) với hầu khắp t ∈ [0, T ] Nghiệm địa phương phương trình (1.8) hàm liên tục tuyệt đối xác định [t0 , r), r > 0, thỏa mãn (1.8) với hầu khắp t ∈ [t0 , r] Nếu nghiệm địa phương xác định [t0 , r), với r > 0, mở rộng thành nghiệm địa phương khác xác định [t0 , r1 ), mà r1 > r, gọi nghiệm cực đại [t0 , r) gọi khoảng cực đại Có thể mở rộng nghiệm địa phương thành nghiệm cực đại Định lý 1.2.1 (Xem [5, tr 74]) Giả sử f : Rn × R −→ Rn liên tục Khi đó, với t0 ≥ x0 ∈ Rn tồn nghiệm địa phương phương trình (1.8) Nếu x(t), t ∈ [t0 , r], nghiệm cực đại r < +∞, lim |x(t)| = +∞ t↑r Chương Bài toán điều khiển tối ưu nguyên lý cực đại Pontriagin p(t), t ∈ [0, T ], nghiệm liên tục tuyệt đối toán Cauchy cho hệ phương trình tuyến tính x, uˆ)) x, uˆ)p − fx0∗ ((ˆ p˙ = −fx∗ (ˆ (2.17) p(T ) = gx (ˆ x(T )) Nhận xét 2.3.1 (Hàm Hamilton) Nếu định nghĩa giá trị hàm Hamilton H (p, x, u) ∈ Rn × Rn × U công thức H(p, x, u) = f (x, u) + p, f (x, u) , bất đẳng thức (2.16) viết lại thành H(p(t), xˆ(t), uˆ(t)) = max H(p(t), xˆ(t), u) u∈U (2.18) Nhận xét 2.3.2 (Quan hệ hàm Hamilton hàm Lagrange) Ta thấy hàm Hamilton định nghĩa công thức tổng lõi hàm mục tiêu tích phân f (x, u) với tích p, f (x, u) nhân tử p vế phải ràng buộc vi phân f (x, u) Điều tương tự với cách biểu diễn hàm Lagrange quy tắc nhân tử Lagrange quen thuộc nhắc lại Quy tắc nhân tử Lagrange: Xét toán min{ϕ(x) | g(x) = 0}, (P ) với ϕ : Rn → R g : Rn → Rm hàm khả vi Giả sử x¯ ∈ loc(P ), với loc(P ) ký hiệu tập nghiệm địa phương toán (P), g(¯ x) : Rn → Rm ánh xạ tràn Khi đó, tồn λ ∈ Rm cho Lx (¯ x, λ) = 0, L hàm Lagrange cho công thức L(x, λ) = ϕ(x) + λ, g(x) Nhận xét 2.3.3 (Tính khả vi hầu khắp nơi) Vì xˆ(.) khả vi hầu khắp nơi [0, T ] nên giới hạn d− xˆ(t) − xˆ(t − λ) xˆ(t) := lim tồn với hầu khắp t ∈ [0, T ] dt λ λ↓0 d xˆ(t) = f (ˆ x(t), uˆ(t)) với hầu khắp t ∈ [0, T ], nên điều kiện (2.18) dt thỏa mãn với hầu khắp t ∈ [0, T ] Kết luận Định lý phát biểu Hơn nữa, dạng đơn giản sau: “Nếu (ˆ x(.), uˆ(.)) trình tối ưu toán điều khiển tối ưu (2.14)–(2.15), tồn nghiệm p(.) (2.17) thỏa mãn (2.18) với hầu khắp t ∈ [0, T ]” 16 Chương Bài toán điều khiển tối ưu nguyên lý cực đại Pontriagin 2.4 Các ví dụ minh họa Ví dụ 2.4.1 Xét toán đưa Ví dụ 2.1.2, có hệ điều khiển x(t) ˙ = ku(t)x(t) x(0) = C, mục tiêu T (1 − u(t))x(t)dt −→ max Không giảm tính tổng quát, ta coi k = Giả sử (ˆ x(.), uˆ(.)) trình tối ưu hệ điều khiển cho, phương trình liên hợp (2.17) trở thành p(t) ˙ = −ˆ u(t)p(t) − (1 − uˆ(t)) p(T ) = p(t) ˙ = uˆ(t)(1 − p(t)) − ⇐⇒ p(T ) = Hàm Hamilton toán cho H(p, x, u) = (1 − u)x + pxu = x + ux(p − 1) Điều kiện (2.18) trở thành xˆ(t) + uˆ(t)ˆ x(t)(p(t) − 1) = max [ˆ x(t) + uˆ x(t)(p(t) − 1)] 0≤u≤1 ⇐⇒ uˆ(t)ˆ x(t)(p(t) − 1) = max [uˆ x(t)(p(t) − 1)] 0≤u≤1 Nếu xˆ(t) = đẳng thức tự động thỏa mãn Nếu xˆ(t) > với t ∈ [0, T ], d− đạo hàm trái xˆ(t) tồn uˆ(t)ˆ x(t), từ đẳng thức suy dt p(t) − > 0, uˆ(t) = p(t) − < Tại t = T ta có p(T ) = 0, uˆ(T ) = Vì uˆ(.) hàm liên tục khúc nên tồn t0 ∈ [0, T ] cho uˆ(t) = với t ∈ (t0 , T ] Thay uˆ(t) = vào phương trình liên hợp ta tìm p(t) = T − t, với t ∈ (t0 , T ] Để ý u(t) đổi giá trị từ sang p(t) − = hay T − t = 1, tức t0 = T − Vậy nửa khoảng (T − 1, T ] ta có p(t) = T − t, 17 uˆ(t) = Chương Bài toán điều khiển tối ưu nguyên lý cực đại Pontriagin Do p(.) hàm liên tục nên ta có p(T − 1)=1 Bây ta giả sử uˆ(t) = với t ∈ [t1 , T − 1] ⊆ [0, T − 1], ≤ t1 ≤ T − Thay uˆ(t) = vào phương trình liên hợp với điều kiện p(T − 1) = ta p(t) ˙ = (1 − p(t)) − p(T − 1) = p(t) ˙ = −p(t) ⇐⇒ p(T − 1) = ⇐⇒ p(t) = eT −t−1 , với t ∈ [t1 , T − 1] Vì hàm p(t) = eT −t−1 nhận hàm mũ, nhận giá trị lần t = T − 1, nên ta có p(t) = eT −t−1 với t ∈ [0, T ] Tóm lại, uˆ(t) = ≤ t ≤ T − 1, T − < t ≤ T Bây ta tìm quỹ đạo xˆ(.) tương ứng với điều khiển uˆ(.) vừa tìm cách thay uˆ(.) vào hệ điều khiển ban đầu Trên đoạn [0, T − 1] ta có xˆ˙ (t) = xˆ(t) xˆ(0) = C Suy xˆ(t) = Cet , ∀t ∈ [0, T − 1] Trên nửa khoảng (T − 1, t] ta có xˆ˙ (t) = xˆ(0) = C Giải hệ ý thêm điều kiện xˆ(.) liên tục ta xˆ(t) = CeT −1 , ∀t ∈ (T − 1, T ] Giá trị hàm mục tiêu uˆ(.) T (1 − uˆ(t))ˆ x(t)dt J(ˆ u) = T −1 T (1 − uˆ(t))ˆ x(t)dt + = (1 − uˆ(t))ˆ x(t)dt T −1 T CeT −1 dt = T −1 T −1 = Ce 18 Chương Bài toán điều khiển tối ưu nguyên lý cực đại Pontriagin Vậy chiến lược đầu tư tối ưu (nếu có) phải tái đầu tư toàn lượng thép sản suất suốt thời gian t ∈ [0, T − 1], trước thời điểm kết thúc T kế hoạch sản xuất, sau đưa toàn lượng thép sản xuất để tiêu thụ Ví dụ 2.4.2 Xét toán điều khiển tối ưu có hệ điều khiển x(t) ˙ = ax(t) + u(t) x(0) = x0 mục tiêu T (x2 (t) + u2 (t))dt −→ min, J(u) = a > 0, x(t) ∈ R, x0 ∈ R Mục tiêu cho toán viết lại thành T (−x2 (t) − u2 (t))dt −→ max J1 (u) = Ta có f (x, u) = ax + u, f (x, u) = −x2 − u2 , g(.) ≡ 0, H(p, x, u) = p(ax + u) − x2 − u2 Giả sử (ˆ x(.), uˆ(.)) trình tối ưu hệ cho, hệ phương trình liên hợp hệ điều khiển ban đầu p(t) ˙ = −ap(t) p(T ) = Từ hệ suy   dp = −adt p p(T ) = ⇐⇒ p(t) = Ce−at p(T ) = ⇐⇒ p(t) = 0, 19 ∀t ∈ [0, T ] Chương Bài toán điều khiển tối ưu nguyên lý cực đại Pontriagin Điều kiện (2.18) có dạng −ˆ x2 (t) − uˆ2 (t) = max{−ˆ x2 (t) − u2 } u∈R −ˆ u (t) = max{−u2 } ⇐⇒ u∈R Từ ta suy ∀t ∈ [0, T ] uˆ(t) = 0, Thay uˆ(t) = 0, với t ∈ [0, T ], vào hệ điều khiển ban đầu ta quỹ đạo xˆ(.) tương ứng với nghiệm hệ x(t) ˙ = ax(t) x(0) = x0 Từ suy xˆ(t) = x0 eat với t ∈ [0, T ] Vậy hệ cho có trình tối ưu (ˆ x(.), uˆ(.)), xˆ(t) = x0 eat uˆ(t) = Ví dụ 2.4.3 Xét toán điều khiển tối ưu với hệ điều khiển    x˙ (t) = x2 (t) x˙ (t) = −x (t) + u(t) 2   x (0) = x (0) = 0, mục tiêu T u2 (t)dt −→ J(u) = Viết lại mục tiêu cho thành T − u2 (t) dt −→ max J1 (u) = Ta có x(t) = (x1 (t), x2 (t))∗ ∈ R2 , f (x, u) = (x2 , −x2 + u), f (x, u) = −u2 , g(.) ≡ 20 u(t) ∈ R, ∀t ≥ 0, Chương Bài toán điều khiển tối ưu nguyên lý cực đại Pontriagin Giả sử (ˆ x(.), uˆ(.)) trình tối ưu Khi hệ phương trình liên hợp với hệ điều khiển ban đầu  ∗  p ˙ (t) p1 (t)   = −1 p˙2 (t) ⇐⇒ ⇐⇒ ⇐⇒ ⇐⇒ p2 (t)    p1 (T ) = p2 (T ) =    p˙1 (t) = p˙ t) = p (t) − p (t) (   p (T ) = p (T ) = 0,    p1 (t) = C p˙ t) = C − p (t) (   p (T ) = p (T ) = 0,    p1 (t) = C p (t) = B(C + e−t )   p (T ) = p (T ) = 0, p1 (t) = p2 (t) = Từ ta suy H(p, x, u) = −u2 , điều kiện (2.18) trở thành −ˆ u2 (t) = max{−u2 } u∈R =⇒ uˆ(t) = 0, ∀t ∈ [0, T ] Quỹ đạo xˆ(.) tương ứng với uˆ(.) ≡ nghiệm hệ phương trình:    x˙ (t) = x2 (t) x˙ (t) = −x (t) 2   x (0) = x (0) = Giải hệ vi phân tuyến tính ta xˆ(.) ≡ Vậy tồn trình tối ưu toán cho ta phải có xˆ(.) ≡ 0, uˆ(.) ≡ Vì ta lại có J(u) ≥ với u ∈ R, nên giá trị cực tiểu J(u) = đạt u(.) ≡ Tóm lại, (ˆ x(.), uˆ(.)), với xˆ(.) ≡ 0, uˆ(.) ≡ 0, trình tối ưu toán cho 21 Chương Chứng minh nguyên lý cực đại Trong chương chứng minh nguyên lý cực đại phát biểu Mục 2.3 Chương Chứng minh chủ yếu dựa theo chứng minh Zabczyk trình bày [5, tr 153–154] Để tiện theo dõi, phát biểu lại nguyên lý cực đại trình bày Chương Xét toán điều khiển tối ưu x(t) ˙ = f (x(t), u(t)) với hầu khắp t ∈ [0, T ], (3.1) x(0) = x0 , với mục tiêu T f (x(t), u(t))dt + g(x(T )) −→ max, J(u(.)) = (3.2) T > số hữu hạn cho trước Định lý 3.0.1 Giả sử hàm f, f , g fx , fx0 , gx liên tục (ˆ x(.), uˆ(.)) trình tối ưu toán điều khiển tối ưu (3.1)–(3.2) Khi đó, với giá trị t ∈ [0, T ] mà đạo hàm trái d− xˆ(t) − xˆ(t − λ) xˆ(t) := lim tồn dt λ λ↓0 f (ˆ x(t), uˆ(t)), bất đẳng thức sau nghiệm p(t), f (ˆ x(t), uˆ(t) + f (ˆ x(t), uˆ(t) ≥ max( p(t), f (ˆ x(t), u) + f (ˆ x(t), u)); u∈U (3.3) p(t), t ∈ [0, T ], nghiệm liên tục tuyệt đối toán Cauchy cho hệ phương trình tuyến tính p˙ = −fx∗ (ˆ x, uˆ)p − fx0∗ ((ˆ x, uˆ)) p(T ) = gx (ˆ x(T )) 22 (3.4) Chương Chứng minh nguyên lý cực đại Chứng minh Vì hàm liên tục tuyệt đối khả vi hầu khắp nơi nên bất đẳng thức (3.3) thỏa mãn với hầu khắp t ∈ [0, T ] Trước hết, ta xét trường hợp f (x, u) ≡ Giả sử t0 ∈ [0, T ] giá trị cho d− xˆ(t0 ) tồn dt d− xˆ(t0 ) = f (ˆ x(t0 ), u(tˆ0 ) dt Lấy tùy ý v ∈ U số thực h ≥ cho t0 − h ∈ [0, T ] Ta định nghĩa biến phân đạo hàm trái hình kim u(., h) hàm uˆ(.) sau    uˆ(t), t ∈ [0, t0 − h), u(t, h) = v, t ∈ [t0 − h, t0 ),   uˆ(t), t ∈ [t , T ] Như vậy, so với hàm điều khiển tối ưu uˆ(.), hàm u(., h) khác nửa khoảng [t0 − h, t0 ) Giá trị u(t, h) với t ∈ [t0 − h, t0 ) lấy v Vì h nhỏ v khác so với giá trị uˆ(t), t ∈ [t0 − h, t0 ), người ta mường tượng đồ thị u(., h) có hình tựa kim dựng đồ thị hàm uˆ(.) Ký hiệu x(., h) quỹ đạo (3.1) ứng với điều khiển u(., h) Ta có g(x(T, h)) = J(u(., h)) ≤ J(ˆ u(.)) = g(ˆ x(T )) = g(x(T, 0)) Suy g(x(T, h)) − g(x(T, 0)) d+ g(x(T, 0)) = lim ≤ 0, dt h h↓0 (3.5) giới hạn tồn Để tồn giới hạn (3.5) tìm giá trị nó, ta ý t0 x(t0 , h) − xˆ(t0 − h) = f (x(s, h), v)ds t0 −h Vì vậy, d+ x(t0 , h) − x(t0 , 0) x(t0 , 0) = lim dh h h↓0 x(t0 , h) − xˆ(t0 ) = lim h h↓0 x(t0 , h) − xˆ(t0 − h) xˆ(t0 ) − xˆ(t0 − h) = lim − lim h h h↓0 h↓0 = lim h↓0 h t0 f (x(s, h), v)ds − t0 −h = f (ˆ x(t0 ), v) − f (ˆ x(t0 ), uˆ(t0 )) 23 d− xˆ(t0 ) dt Chương Chứng minh nguyên lý cực đại Trong phép biến đổi trên, để có lim h↓0 h t0 f (x(s, h), v)ds = f (ˆ x(t0 ), v), t0 −h ta sử dụng định lý giá trị trung bình cho hàm ϕi (s, h) := fi (x(s, h), v), i ∈ {1, , n} Vì với i ta có ϕi (., h) hàm liên tục đoạn [t0 − h, t0 ] ứng với h > 0, nên tồn s(h) ∈ [t0 − h, t0 ] cho h t0 ϕi (s, h)ds = t0 −h [t0 − (t0 − h)]ϕi (s(h), h) = ϕi (s(h), h) h Từ suy rằng, với i ∈ {1, , n}, lim h↓0 h t0 fi (x(s, h), v)ds = lim ϕi (s(h), h) = ϕi (t0 , 0) h↓0 t0 −h = fi (ˆ x(t0 ), v) (Đẳng thức thứ hai dòng thứ không hiển nhiên, phù hợp với trực quan hình học Vì không tìm thấy chứng minh đẳng thức [5] số sách phương trình vi phân, nên đành tạm công nhận.) Để ý ϕ : R → Rn , h → x(T, h), hàm hợp hàm ϕ1 , ϕ2 , ϕ3 sau đây: ϕ1 : R → Rn , h → x(t0 , h), ϕ2 : Rn → C([t0 , T ], Rn ), x0 → x(.), với x(.) nghiệm phương trình x(t) ˙ = f (x(t), uˆ(t)) với hầu khắp t ∈ [t0 , T ], x(t0 ) = x0 , ϕ3 : C([t0 , T ], Rn ) → Rn , x(.) → x(T ) Mỗi h ≥ xác định biến phân hình kim u(., h) điều khiển tối ưu uˆ(.), xác định véc tơ x(t0 , h) giá trị hàm x(., h) : [0, T ] → Rn d+ x(t0 , 0) Theo Định lý 1.2.2 dh Định lý 1.2.3, hàm ϕ2 xác định x(t0 , 0) = xˆ(t0 ) ta có ϕ2 (ˆ x(t0 )) = x(., h) t0 Vậy hàm ϕ1 xác định ta có ϕ˙1 (0) = nghiệm phương trình   d x(t, h) = f (x(t, h), uˆ(t)) dt x(t , h) = xˆ(t ) 0 24 Chương Chứng minh nguyên lý cực đại Do đó, ϕ2 (ˆ x(t0 )) = xˆ(.) Hơn nữa, đạo hàm theo hướng d+ x(t0 , 0) xˆ(t0 ) dh nghiệm phương trình  q˙ = fx (ˆ x, uˆ)q + q(t0 ) = d x(t0 , 0) dh Ký hiệu S(t) ma trận nghiệm phương trình Theo Định lý 1.1.1 ta có + + ϕ˙ (ˆ x(t0 )), d d x(t0 , 0) (t) = S(t)S −1 (t0 ) x(t0 , 0) dh dh Vì ϕ3 hàm tuyến tính liên tục nên ϕ˙ (x(·)), z(·) = z(T ), với x(·), z(·) ∈ C([t0 , T ], Rn ) Sử dụng công thức đạo hàm hàm hợp, ta có d+ ϕ(0) = ϕ˙ (ϕ2 ◦ ϕ1 (0)), ϕ˙ (ϕ1 (0), ϕ˙ (0)) dh ⇐⇒ ⇐⇒ ⇐⇒ d+ x(T, 0) = ϕ˙ (ϕ1 (0)), ϕ˙ (0) (T ) dh d+ d+ x(T, 0) = ϕ˙ (ˆ x(t0 )), x(t0 , 0) (T ) dh dh d+ x(T, 0) = S(T )S −1 (t0 )(f (ˆ x(t0 ), v) − f (ˆ x(t0 ), uˆ(t0 ))) dh Từ suy đạo hàm phải d+ g(x(T, 0)) tồn tính sau dh d+ d+ g(x(T, 0)) = gx (ˆ x(T )), x(T, 0) dh dh = gx (ˆ x(T )), S(t)S −1 (t0 )(f (ˆ x(t0 ), v) − f (ˆ x(t0 ), uˆ(t0 ))) = [S ∗ (t0 )]−1 S ∗ (T )gx (ˆ x(T )), f (ˆ x(t0 ), v) − f (ˆ x(t0 ), uˆ(t0 )) = [S ∗ (t0 )]−1 S ∗ (T )gx (ˆ x(T )), f (ˆ x(t0 ), v) − [S ∗ (t0 )]−1 S ∗ (T )gx (ˆ x(T )), f (ˆ x(t0 ), uˆ(t0 )) Sử dụng kết d+ g(x(T, 0)) ≤ 0, ta dh [S ∗ (t0 )]−1 S ∗ (T )gx (ˆ x(T )), f (ˆ x(t0 ), v) ≤ [S ∗ (t0 )]−1 S ∗ (T )gx (ˆ x(T )), f (ˆ x(t0 ), uˆ(t0 )) ⇐⇒ p(t0 ), f (ˆ x(t0 ), v) ≤ p(t0 ), f (ˆ x(t0 ), uˆ(t0 )) , p(·) nghiệm phương trình p˙ = fx∗ (ˆ x, uˆ)p p(T ) = gx xˆ(T ), 25 Chương Chứng minh nguyên lý cực đại với ma trận nghiệm [S ∗ (t)]−1 (xem Mệnh đề 1.1.1) Vì bất đẳng thức với v thuộc U lấy tùy ý nên ta suy max p(t0 ), f (ˆ x(t0 ), u) ≤ p(t0 ), f (ˆ x(t0 ), uˆ(t0 )) u∈U Tóm lại, để (ˆ x(·), uˆ(·)) trình tối ưu toán điều khiển tối ưu x˙ = f (x, u) với hầu khắp t ∈ [0, T ] x(0) = x0 , T g(x(T )) −→ max, J(u(.)) = điều kiện cần tồn nghiệm khác không, liên tục tuyệt đối, phương trình p˙ = −fx∗ (ˆ x, uˆ)p p(T ) = gx xˆ(T ), cho max p(t), f (ˆ x(t), u) ≤ p(t), f (ˆ x(t), uˆ(t)) , u∈U t ∈ [0, T ] thỏa mãn d− xˆ(t) = f (ˆ x(t), uˆ(t)) dt Tiếp theo, xét trường hợp f (x, u) ≡ Đặt t f (x(t), u(t))dt, x (t) = 0 x¯(t) = (x (t), x1 (t), , xn (t))∗ , f¯(x, u) = (f (x, u), f (x, u), , f n (x, u))∗ , g¯(¯ x) = x0 + g(x) Khi đó, toán điều khiển tối ưu dạng Bolza x˙ = f (x, u) với hầu khắp t ∈ [0, T ] x(0) = x0 , T f (x(t), u(t))dt + g(x(T )) −→ max, J(u(.)) = 26 Chương Chứng minh nguyên lý cực đại đưa toán điều khiển tối ưu dạng Mayer x¯˙ = f¯(x, u) với hầu khắp t ∈ [0, T ] x¯(0) = (0, x0 ), J(u(.)) = g¯(¯ x(T )) −→ max Theo chứng minh trên, để (ˆ x(·), uˆ(·)) trình tối ưu, điều kiện cần tồn nghiệm p¯(t) = (p0 (t), p1 (t), , pn (t))∗ khác không, liên tục tuyệt đối, phương trình x, uˆ)p p¯˙ = f¯x∗ (ˆ (3.6) p¯(T ) = g¯x xˆ(T ), cho max p¯(t), f¯(ˆ x(t), u) ≤ p¯(t), f¯(ˆ x(t), uˆ(t)) u∈U với t ∈ [0, T ] mà max p(t), f (ˆ x(t), u) ≤ p(t), f (ˆ x(t), uˆ(t)) u∈U Hệ (3.6) viết chi tiết sau  n  − ∂f (ˆ − · · · − ∂f (ˆ = − ∂f (ˆ  x , u ˆ )p x , u ˆ )p x, uˆ)pn p ˙   0 ∂x ∂x ∂x   n   = − ∂f (ˆ − ∂f (ˆ − · · · − ∂f (ˆ  p ˙ x , u ˆ )p x , u ˆ )p x, uˆ)pn  1  ∂x ∂x ∂x     ···     ∂f ∂f ∂f n  n n p˙ = − (ˆ x, uˆ)p − n (ˆ x, uˆ)p − · · · − n (ˆ x, uˆ)p ∂xn ∂x ∂x   p0 (T ) =     ∂g   p1 (T ) = (ˆ x(T ))   ∂x1     ···      pn (T ) = ∂g (ˆ x(T )) ∂xn Từ suy p0 (·) ≡ ∗ p˙ = −fx∗ (ˆ x, uˆ)p − fx0 (ˆ x, uˆ) p(T ) = gx (ˆ x(T )), p(t) = (p1 (t), p2 (t), , pn (t))∗ Điều kiện (3.7) viết thành max p0 (t)f (ˆ x(t), u) + p1 (t)f (ˆ x(t), u) + · · · + pn (t)f n (ˆ x(t), u) u∈U ≤ p0 (t)f (ˆ x(t), uˆ(t)) + p1 (t)f (ˆ x(t), uˆ(t)) + · · · + pn (t)f n (ˆ x(t), uˆ(t)) 27 (3.7) Chương Chứng minh nguyên lý cực đại Kết hợp điều với tính chất p0 (·) ≡ ta có ˆ p(t), f (ˆ x(t), u(t)(t) + f (ˆ x(t), uˆ(t) ≥ max( p(t), f (ˆ x(t), u) + f (ˆ x(t), u)) u∈U Định lý chứng minh 28 Kết luận Luận văn trình bày - Một số kiến thức phương trình vi phân tuyến tính phi tuyến Đây kiến thức bản, phục vụ trực tiếp cho việc giải phương trình liên hợp phương trình vi phân tuyến tính không dừng, công cụ chứng minh nguyên lý cực đại - Bài toán điều khiển tối ưu dạng tổng quát nguyên lý cực đại Pontriagin - Một số ví dụ thực tế lý thuyết toán học dẫn đến toán điều khiển tối ưu số ví dụ trình bày chi tiết việc áp dụng nguyên lý cực đại - Chứng minh chi tiết nguyên lý cực đại Pontriagin cho trường hợp thời gian cuối cố định theo Zabczyk [5, tr 153–154], với nhiều phân tích diễn giải cần thiết đưa 29 Tài liệu tham khảo Tiếng Việt [1] Vũ Ngọc Phát, Nhập môn Lý thuyết điều khiển toán học, Nhà xuất Đại học Quốc gia, Hà Nội, 2001 [2] Nguyễn Đông Yên, Tập giảng cao học môn Lý thuyết điều khiển, 2003 Tiếng Anh [3] G Knowles, An Introduction to Applied Optimal Control, Academic Press, New York-London, 1981 [4] L S Pontriagin, V G Boltyanskii, R V Gamkrelidze, E F Mishchenko, The Mathematical Theory of Optimal Processes, John Wiley & Sons, New York, 1962 [5] J Zabczyk, Mathematical Control Theory: An Introduction (Reprint of the the 1995 Edition), Birkh¨auser, Boston-Basel-Berlin, 2008 30

BÀI TOÁN điều KHIỂN tối ưu và NGUYÊN lý cực đại

Thông tin tài liệu

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan