Nghiệm nhớt của phương trình đạo hàm riêng cấp 1 và bài toán điều khiển tối ưu với thời gian vô hạn

57 612 1
Nghiệm nhớt của phương trình đạo hàm riêng cấp 1 và bài toán điều khiển tối ưu với thời gian vô hạn

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

LỜI CẢM ƠN Luận văn hoàn thành Trường Đại học Sư phạm Hà Nội hướng dẫn TS Trần Văn Bằng Tác giả xin gửi lời cảm ơn chân thành tới thầy giáo, tiến sĩ Trần Văn Bằng, thầy cô giáo nhà trường thầy cô giáo giảng dạy chuyên ngành Tốn Giải tích giúp đỡ tác giả suốt trình học tập làm luận văn Cuối cùng, tác giả xin cảm ơn tới gia đình, bạn bè, đồng nghiệp động viên tạo điều kiện thuận lợi để tác giả hoàn thành luận văn Hà Nội, tháng 05 năm 2013 Tác giả Chu Thanh Vân LỜI CAM ĐOAN Tôi xin cam đoan Luận văn cơng trình nghiên cứu cá nhân tôi, hướng dẫn TS Trần Văn Bằng Trong nghiên cứu luận văn, kế thừa thành khoa học nhà khoa học đồng nghiệp với trân trọng biết ơn Hà Nội, tháng 05 năm 2013 Tác giả Chu Thanh Vân Mục lục Mở đầu Chương Kiến thức chuẩn bị 1.1 Nghiệm nhớt phương trình đạo hàm riêng phi tuyến cấp 1.1.1 Định nghĩa tính chất 1.1.2 Phép toán nghiệm nhớt 12 1.1.3 Hàm lề 16 1.2 Tính so sánh nghiệm 20 1.3 Tính quy nghiệm nhớt 23 1.3.1 Tính liên tục Lipschitz 23 1.3.2 Tính nửa lõm 26 1.3.3 Tính khả vi 29 Chương Bài toán điều khiển tối ưu với thời gian vô hạn 32 2.1 32 2.1.1 Hệ điều khiển 32 2.1.2 Nguyên lý quy hoạch động 33 2.1.3 Phương trình Hamilton-Jacobi-Bellman 34 2.1.4 2.2 Bài tốn điều khiển tối ưu với thời gian vơ hạn Định lý kiểm định 35 Ứng dụng nghiệm nhớt toán điều khiển tối ưu với thời gian vô hạn 2.2.1 38 Nguyên lý quy hoạch động phương trình HamiltonJacobi-Bellman nghiệm nhớt 40 Định lý kiểm định qua nghiệm nhớt 53 Tài liệu tham khảo 57 2.2.2 MỞ ĐẦU Lý chọn đề tài Bài toán điều khiển tối ưu xuất nhiều lĩnh vực khoa học thực tiễn (xem [1, 4, 5]) Một phương pháp tiếp cận quan trọng lý thuyết toán điều khiển tối ưu phương pháp quy hoạch động Theo phương pháp hàm giá trị toán (nếu khả vi) nghiệm cổ điển phương trình Hamilton-Jacobi-Bellman liên kết, phương trình đạo hàm riêng phi tuyến cấp Tuy nhiên đa số tình hàm giá trị nói chung khơng khả vi, vấn đề quan trọng đặt là: hàm giá trị có thỏa mãn phương trình Hamilton-Jacobi-Bellman hay khơng? Nếu có thỏa mãn theo nghĩa nào? Đầu năm 80 kỉ trước, M G Crandall đề xuất khái niệm nghiệm suy rộng cho phương trình đạo hàm riêng phi tuyến cấp một, nghiệm nhớt Cho đến khái niệm chứng minh đặc biệt hữu dụng lý thuyết điều khiển tối ưu, lý thuyết trò chơi vi phân, (xem [7, 6, 3]) Xuất phát từ lý định hướng TS Trần Văn Bằng em chọn đề tài: “Nghiệm nhớt phương trình đạo hàm riêng cấp tốn điều khiển tối ưu với thời gian vô hạn” Nội dung Luận văn gồm hai chương: Chương 1, trình bày kiến thức chuẩn bị nghiệm nhớt phương trình đạo hàm riêng cấp một, bao gồm: khái niệm, tính chất, phép tốn, Chương 2, tìm hiểu toán điều khiển tối ưu với thời gian vô hạn lý thuyết cổ điển ứng dụng nghiệm nhớt toán Mục đích nghiên cứu Tìm hiểu Nghiên cứu ứng dụng nghiệm nhớt liên tục phương trình đạo hàm riêng cấp toán điều khiển tối ưu thời gian vô hạn Nhiệm vụ nghiên cứu -Tìm hiểu nghiệm nhớt liên tục phương trình đạo hàm riêng cấp 1; -Tìm hiểu tốn điều khiển tối ưu nói chung; -Tìm hiểu tốn điều khiển tối ưu thời gian vơ hạn Đối tượng phạm vi nghiên cứu + Đối tượng nghiên cứu: Đối tượng nghiên cứu: Các điều kiện tối ưu cho toán điều khiển tối ưu thời gian vô hạn + Phạm vi nghiên cứu: Nghiên cứu toán điều khiển tối ưu tất định với hàm giá trị liên tục số không gian hàm Phương pháp nghiên cứu Sử dụng số phương pháp Giải tích hàm, phương trình đạo hàm riêng lý thuyết điều khiển tối ưu Đóng góp luận văn + Luận văn tài liệu tổng quan ứng dụng nghiệm nhớt phương trình đạo hàm riêng cấp vào tốn điều khiển tối ưu thời gian vô hạn Chương Kiến thức chuẩn bị Nội dung chương chủ yếu tham khảo từ tài liệu [3]-[7] 1.1 1.1.1 Nghiệm nhớt phương trình đạo hàm riêng phi tuyến cấp Định nghĩa tính chất Mục trình bày khái niệm nghiệm nhớt phương trình đạo hàm riêng (ĐHR) cấp số tính chất dựa vào nguyên lý so sánh nghiệm mối quan hệ với khái niệm nghiệm cổ điển phương trình Cho Ω ⊂ RN tập mở, F : Ω × R × RN → R hàm liên tục ba biến (x, r, p) Kí hiệu: C(Ω) khơng gian tất hàm thực liên tục Ω; C k (Ω), k = 1, 2, không gian tất hàm thuộc C(Ω) có đạo hàm riêng đến cấp k liên tục Ω Với hàm u ∈ C (Ω), Du(x) gradient u x ∈ Ω Xét phương trình ĐHR phi tuyến cấp (thường gọi phương trình Hamilton-Jacobi): F (x, u(x), Du(x)) = 0, x ∈ Ω (HJ) Định nghĩa 1.1.1 Hàm u ∈ C(Ω) nghiệm nhớt phương trình (HJ) với ϕ ∈ C (Ω) ta có: F (x0 , u(x0 ), Dϕ(x0 )) ≤ điểm cực đại địa phương x0 ∈ Ω u − ϕ (1.1) Hàm u ∈ C(Ω) nghiệm nhớt phương trình (HJ) với ϕ ∈ C (Ω) ta có: F (x1 , u(x1 ), Dϕ(x1 )) ≥ (1.2) điểm cực tiểu địa phương x1 ∈ Ω u − ϕ Hàm u nghiệm nhớt vừa nghiệm nhớt vừa nghiệm nhớt phương trình Hàm ϕ(x) định nghĩa thường gọi hàm thử Ví dụ 1.1.2 Hàm số u(x) = |x| nghiệm nhớt phương trình: − |u (x)| + = 0, x ∈ (−1, 1) Thật vậy, ta xét hai trường hợp: x = cực trị địa phương u − ϕ ϕ (x) = u (x) = ±1 Vì điểm điều kiện nghiệm nhớt trên, nghiệm nhớt thỏa mãn Nếu cực tiểu địa phương u − ϕ, ta tính |ϕ (0)| ≤ nên điều kiện nghiệm nhớt Bây ta chứng minh cực đại địa phương u − ϕ với ϕ ∈ C ([0, 1]) Thật vậy, cực đại địa phương u − ϕ ta có (u − ϕ)(0) ≥ (u − ϕ)(x) lân cận 0, hay ϕ(x) − ϕ(0) ≥ u(x) lân cận 0, từ ta có: ϕ (0) = lim+ x→0 u(x) ϕ(x) − ϕ(0) ≥ lim+ =1 x→0 x−0 x ϕ(x) − ϕ(0) u(x) ≤ lim+ − = −1 x→0 x→0 x−0 x Vô lý, cực đại địa phương u − ϕ ϕ (0) = lim− Để ý rằng, hàm số u(x) = |x| nghiệm nhớt phương trình: |u (x)| − = 0, x ∈ (−1, 1) Thật điều kiện nghiệm không thỏa mãn x0 = điểm cực tiểu địa phương |x| − (−x2 ) Chú ý: Đối với phương trình tiến hóa có dạng: ut (t, y) + H(t, y, u(t, y), Dy u(t, y)) = 0, (t, y) ∈ (0, T ) × D ta việc đặt: x = (t, y) ∈ Ω = (0, T ) × D ⊆ RN +1 , F (x, r, p) = qN +1 + H(x, r, q1 , , qN ) với q = (q1 , , qN , qN +1 ) ∈ RN +1 Nhận xét 1.1.3 Trong định nghĩa nghiệm nhớt ta ln giả sử x0 điểm cực đại địa phương ngặt hàm u − ϕ (nếu khơng ta thay ϕ(x) ϕ(x) + |x − x0 |2 ) Hơn (1.1) phụ thuộc vào giá trị Dϕ x0 , nên khơng tính tổng qt ta giả sử u(x0 ) = ϕ(x0 ) Đối với định nghĩa nghiệm nhớt ta có nhận xét tương tự Về mặt hình học điều có nghĩa rằng: hàm thử điều kiện nghiệm nhớt (1.1) u tiếp xúc với đồ thị u Ta ý không gian C (Ω) hàm thử Định nghĩa 1.1.1 thay C ∞ (Ω) Mệnh đề sau thể đặc trưng nghiệm nhớt mối quan hệ với nghiệm cổ điển: Mệnh đề 1.1.4 (a) Nếu hàm u ∈ C(Ω) nghiệm nhớt (HJ) Ω, u nghiệm nhớt (HJ) Ω , với tập mở Ω ⊂ Ω; (b) Giả sử hàm u ∈ C(Ω) nghiệm cổ điển (HJ), tức u khả vi điểm x ∈ Ω và: F (x, u(x), Du(x)) = 0, ∀x ∈ Ω (1.3) Khi u nghiệm nhớt (HJ); (c) Nếu hàm u ∈ C (Ω) nghiệm nhớt (HJ), u nghiệm cổ điển phương trình Mệnh đề (a) cho thấy khái niệm nghiệm nhớt có tính địa phương Vì ta lấy hàm thử (1.1) (1.2) C −hàm RN hình cầu B(x, r) với tâm x ∈ Ω Định nghĩa nghiệm nhớt có liên quan chặt chẽ đến hai tính chất nêu lý thuyết phương trình eliptic - parabolic nguyên lý cực đại nguyên lý so sánh Với phương trình (HJ) hai tính chất xây dựng tương ứng sau Định nghĩa 1.1.5 Một hàm số u ∈ C(Ω) thỏa mãn nguyên lý so sánh với nghiệm nhớt trơn ngặt với ϕ ∈ C (Ω) tập mở O ⊂ Ω cho F (x, ϕ(x), Dϕ(x)) > 0, ∀x ∈ O, u ≤ ϕ ∂O u ≤ ϕ O Ta nói hàm số u ∈ C(Ω) thỏa mãn nguyên lý cực đại với ϕ ∈ C (Ω) tập mở O ⊂ Ω cho: F (x, ϕ(x), Dϕ(x)) > 0, ∀x ∈ O u − ϕ khơng thể có cực đại khơng âm O Dễ thấy hàm u ∈ C(Ω) thỏa mãn nguyên lý cực đại thỏa mãn ngun lý so sánh Mối quan hệ chúng với khái niệm nghiệm nhớt phương trình (HJ) trình bày mệnh đề sau Mệnh đề 1.1.6 Nếu hàm số u ∈ C(Ω) thỏa mãn nguyên lý so sánh u nghiệm nhớt phương trình (HJ) Ngược lại, u nghiệm nhớt phương trình (HJ) r → F (x, r, p) hàm khơng giảm với x, p u thỏa mãn nguyên lý cực đại nguyên lý so sánh Kết tương tự với nghiệm nhớt Khi ta cần đổi chiều bất đẳng thức nguyên lý so sánh nguyên lý cực đại thay cực đại không âm cực tiểu không dương 10 Một điều cần lưu ý nghiệm nhớt khơng bảo tồn ta đổi dấu phương trình Thực tế, cực đại địa phương u − ϕ cực tiểu địa phương −u − (−ϕ), nên u nghiệm nhớt phương trình (HJ) v = −u nghiệm nhớt phương trình −F (x, −v(x), −Dv(x)) = Ω; tương tự u nghiệm nhớt phương trình (HJ) v = −u nghiệm nhớt phương trình −F (x, −v(x), −Dv(x)) = Ω Bây ta đưa đặc trưng nghiệm nhớt phương trình (HJ) thơng qua vi phân vi phân Cho hàm số u ∈ C(Ω) x ∈ Ω, xét tập hợp: D+ u(x) := D− u(x) := u(y) − u(x) − p.(y − x) ≤0 , |y − x| y→x,y∈Ω u(y) − u(x) − p.(y − x) p ∈ RN : lim inf ≥0 y→x,y∈Ω |y − x| p ∈ RN : lim sup Các tập hợp gọi tương ứng vi phân vi phân (gọi chung bán vi phân) u x Ví dụ 1.1.7 Cho u(x) = |x|, x ∈ R Khi ta dễ dàng kiểm tra được: D+ u(0) = ∅, D− u(0) = [−1, 1] Những bổ đề sau mô tả D+ u(x) D− u(x) qua hàm thử số tính chất chúng: Bổ đề 1.1.8 Cho u ∈ C(Ω) Khi đó: (a) p ∈ D+ u(x) tồn ϕ ∈ C (Ω) thỏa mãn Dϕ(x) = p u − ϕ đạt cực đại địa phương x; (b) p ∈ D− u(x) tồn ϕ ∈ C (Ω) thỏa mãn Dϕ(x) = p u − ϕ đạt cực tiểu địa phương x Bổ đề 1.1.9 Cho u ∈ C(Ω), x ∈ Ω Khi đó: (a) D+ u(x) D− u(x) tập lồi, đóng (có thể rỗng) RN ; (b) Nếu u khả vi x {Du(x)} = D+ u(x) = D− u(x); 43 I1 tích phân vế phải (2.22) Do ε α tùy ý nên v(x) ≤ ω(x) Nhận xét 2.2.5 Nếu có điều khiển tối ưu α∗ x, tức là, v(x) = J(x, α∗ ), cực tiểu (2.20) đạt α∗ : t l(yx (s, α∗ ),α∗ (s))e−λs ds + v(yx (t, α∗ ))e−λt v(x) = (2.23) với t > Trên thực tế, tính tốn sau (2.21) cho ta t l(yx (s, α∗ ),α∗ (s))e−λs ds + e−λt J(yx (t, α∗ ), α∗ (· + t)) v(x) = Vậy ta có bất đẳng thức ≥ (2.23) Đồng thời ta có: v(yx (t, α∗ )) = J(yx (t, α∗ ), α∗ (· + t)) tức là, điều khiển tối ưu x, tối ưu điểm quỹ đạo tương ứng, ta dịch chuyển thời gian cách thích hợp Đây cách Bellman thiết lập "Nguyên lý tối ưu": "Một sách tối ưu sách có tính chất: với trạng thái ban đầu định ban đầu định cịn lại phải tạo sách tối ưu trạng thái dẫn đến định ban đầu đó" Cần lưu ý (2.23) suy hàm: t l(yx (s, α), α(s))e−λs ds + v(yx (t, α))e−λt t→ số α tối ưu Nhận xét 2.2.6 Mệnh đề 2.2.2 thỏa mãn ω(x) = inf α∈B J(x, a) với B ⊂ A Mệnh đề 2.2.4 thỏa mãn tập B có tính chất sau: (i) Nếu α ∈ B, τ > t → α(t + τ ) thuộc B; 44 (ii) Nếu α1 , α2 ∈ B, s > 0, α(t) := α1 (t) t ≤ s α2 (t − s) t > s, α ∈ B Do đó, chẳng hạn hàm v(x) = inf α∈P J(x, a) thỏa mãn (2.20) với A thay P Hàm Hamiltonian phương trình Hamilton-Jacobi-Bellman tốn với thời gian vơ hạn là: H : RN × RN → R xác định H(x, p) := sup {−f (x, a) · p − l(x, a)} (2.24) a∈A Chú ý H(x, p) < +∞ với x p, (A1) (A4) Từ nguyên lý quy hoạch động ta có Mệnh đề 2.2.7 Cho giả thiết (A0) - (A4) Khi hàm giá trị v nghiệm nhớt λv + H(x, Dv) = RN (2.25) Chứng minh Lấy φ ∈ C (RN ) x điểm cực đại địa phương v−φ, tức là, có số τ > : v(x)−v(z) ≥ φ(x)−φ(z) với z ∈ B(x, r) Chọn tùy ý a ∈ A gọi yx (t) nghiệm ứng với điều khiển không đổi α(t) = a với t Với t đủ nhỏ yx (t) ∈ B(x, r) (theo (2.16)) φ(x) − φ(yx (t)) ≤ v(x) − v(yx (t)), với ≤ t ≤ t0 Bằng cách sử dụng bất đẳng thức ” ≤ ” nguyên lý quy hoạch động (2.20) ta nhận t l(yx (s), a)e−λs ds + v(yx (t))(e−λt − 1); φ(x) − φ(yx (t)) ≤ vậy, chia hai vế cho t > cho t → 0, thu được, tính khả vi φ tính liên tục v, yx , f l, −Dφ(x) · yx (0) = −Dφ(x) · f (x, a) ≤ l(x, a) − λv(x) 45 Do a ∈ A tùy ý nên chứng minh λv(x) + sup {−f (x, a) · Dφ(x) − l(x, a)} ≤ 0, a∈A hay v nghiệm nhớt (2.25) Tiếp theo, giả sử x điểm cực tiểu địa phương v − φ, tức là, có số r > cho v(x) − v(z) ≤ φ(x) − φ(z), với z ∈ B(x, r) (2.26) Với ε > t > 0, bất đẳng thức ” ≥ ” nguyên lý quy hoạch động (2.20), tồn α ∈ A (chỉ phụ thuộc vào ε t) cho t l(y x (s), α(s))e−λs ds + v(y x (t))e−λt − tε, v(x) ≥ (2.27) y x (s) = yx (s, α) quỹ đạo (S) ứng với α Bây để ý rằng, từ (2.16) (A4) suy |l(y x (s), α(s)) − l(x, α(s))| ≤ ωl (Mx s), với ≤ s ≤ t0 , (2.28) (2.16) (A2) suy |f (y x (s), α(s)) − f (x, α(s))| ≤ ωf (Mx s, |x| + Mx t0 ) với ≤ s ≤ t0 , (2.29) t0 khơng phụ thuộc vào α, ε t Theo (2.28), tích phân vế phải (2.27) viết sau t l(x, α(s))e−λs ds + o(t), t → 0, o(t) hàm g(t) cho limt→0+ |g(t)| /t = 0, trường hợp |g(t)| ≤ tωl (Mx t) Do (2.26) với z = y x (t) (2.27) cho ta t l(x, α(s))e−λs ds + v(yx (t))(1 − e−λt ) ≥ −tε + o(t) φ(x) − φ(y x (t)) − (2.30) 46 Hơn nữa, t d φ (y x (s)) ds ds φ(x) − φ(y x (t)) = − t =− Dφ (y x (s)) · f (y x (s), α(s))ds (2.31) t =− Dφ (x) · f (x, α(s))ds + o(t), ta sử dụng (2.16), (2.29) φ ∈ C đẳng thức cuối để ước lượng thay đổi Dφ · f y x (s) x Thay (2.31) vào (2.30) t cộng với ± l(x, α(s))ds ta có t t l(x, α(s))(1 − e−λs )ds {−Dφ(x) · f (x, α(s)) − l(x, α(s))}ds + (2.32) + v(yx (t))(1 − e−λt ) ≥ −tε + o(t) Số hạng ngoặc tích phân có cận sup {−Dφ(x) · f (x, a) − l(x, a)} a∈A tích phân thứ hai o(t) l bị chặn theo (A4), chia (2.32) cho t > chuyển qua giới hạn để có sup {−Dφ(x) · f (x, a) − l(x, a)} + λv(x) ≥ −ε, a∈A ta sử dụng tính liên tục v x y x Do ε tùy ý nên chứng minh v nghiệm Nhận xét 2.2.8 Chứng minh Mệnh đề 2.2.7 cho thấy, hàm thỏa mãn nguyên lý quy hoạch động (2.20) với A thay B ⊆ A, cho B chứa hàm nghiệm nhớt (2.25) Chẳng hạn hàm v # thỏa mãn (2.25) theo Nhận xét 2.2.6 47 Hệ 2.2.9 Cho giả thiết (A0)-(A4) tồn r > cho B(0, r) ⊆ cof (x, A) Khi hàm giá trị v liên tục Lipschitz RN Chứng minh Do v nghiệm bị chặn (2.25) nên ta áp dụng Mệnh đề 1.3.2 Thực vậy, theo giả thiết ta có H(x, p) ≥ sup {−f (x, a) · p} − M = a∈A {−q · p} − M sup q∈cof (x,a) ≥ sup {−q · p} − M = τ |p| − M |q|≤τ Chúng ta biết từ phần bất đẳng thức vi phân theo nghĩa nhớt Chương 1, hàm giá trị v thỏa mãn v(x) ≥ u(x) x, với nghiệm u (2.25) Do đó, theo Mệnh đề 2.2.7, v nghiệm lớn (2.25), nên v đặc trưng phương trình Hamilton-Jacobi-Bellman Thật vậy, v nghiệm (2.25) nên v đặc trưng nghiệm nhớt (2.25) Chúng ta thực điều nhờ nguyên lý so sánh, từ suy v nghiệm nhỏ Trước hết cần bổ đề mang tính kỹ thuật tính quy hàm Hamiltonian H xác định (2.24) Bổ đề 2.2.10 Cho giả thiết (A0)-(A4) Khi H liên tục thỏa mãn H(y,µ(x − y) − τ y) − H(x, µ(x − y) + γx) 2 ≤ µL|x − y| + τ K(1 + |y| ) + γK(1 + |x| ) + ωl (|x − y|) (2.33) với µ, τ, γ > 0, x, y ∈ RN , K := L + sup {|f (0, a)| : a ∈ A} Hơn (2.13) thỏa mãn, H thỏa mãn |H(x, p) − H(y, p)| ≤ |p| L |x − y| + ωl (|x − y|) (2.34) với x, y, p ∈ RN Nếu thêm giả thiết ∃M : |f (x, a)| ≤ M , với x ∈ RN , a ∈ A, (2.35) |H(x, p) − H(x, q)| ≤ M |p − q| (2.36) 48 Chứng minh Trước hết để ý rằng, (A3) suy f (z, a) · z ≤ L|z|2 + sup |f (0, a)| |z| ≤ K(1 + |z|2 ) (2.37) a∈A với z ∈ RN , a ∈ A Bây cố định ε > a cho H(y, µ(x, y) − τ y) ≤ −f (y, a) · (µ(x, y) − τ y) − l(y, a) + ε Khi vế trái (2.33) làm trội µ(f (x, a) − f (y, a)) · (x − y) + τ f (y, a) + γf (x, a) · x − l(y, a) + l(x, a) + ε, mà biểu thức nhỏ vế phải (2.33) cộng với ε nhờ (A3), (A4) (2.37) Do ε tùy ý nên ta có (2.33) Hai khẳng định cịn lại chứng minh tương tự Bổ đề 2.2.10 cho thấy, f thỏa mãn (A0) ,(2.35) (2.13) Hamiltonian H thỏa mãn giả thiết Định lý 1.2.4, nên nghiệm (2.25) nhỏ nghiệm phương trình hai thuộc BU C(RN ) Do theo Mệnh đề 2.2.7, hàm giá trị v vừa nghiệm nhớt vừa nghiệm nhớt (2.25) nên v nhỏ nghiệm nhớt BU C(RN ) lớn nghiệm nhớt thuộc BU C(RN ) Do v nghiệm nhớt (2.25) BU C(RN ), xác đồng thời nghiệm lớn nghiệm nhỏ Trong trường hợp ta nói v nghiệm đầy đủ (2.25) BU C(RN ) Tất điều giả thiết tổng quát (A0)-(A4) định lý sau: Định lý 2.2.11 Giả sử H : R2N → R hàm liên tục thỏa mãn (2.33) Nếu u1 , u2 ∈ BU C(RN ) tương ứng nghiệm nhớt nghiệm nhớt u + H(x, Du) = 0, RN , (2.38) u1 < u2 RN Đặc biệt, H cho (2.24) có giả thiết (A0)-(A4) hàm giá trị v nghiệm đầy đủ (2.25) BU C(RN ) nghiệm nhớt lớp hàm 49 Chứng minh Phần thứ hai định lý suy từ Mệnh đề 2.2.7 Bổ đề 2.2.10 sau: chia (2.25) cho λ > để ý H/λ thỏa mãn giả thiết cấu trúc (2.33) (với số mô đun ωl ) chia cho λ, mà khơng ảnh hưởng đến chứng minh sau đó) Để chứng minh phần so sánh nghiệm, xét Φ : R2N → R, |x − y|2 Φ(x, y) := u1 (x) − u2 (y) − − β( x 2ε m + y m ), x := (1 + |x|2 ) , ε, β, m tham số dương lựa chọn phù hợp Ta giả sử ơhanr chứng rằng, tồn δ > x cho u1 (x)−u2 (x) = δ Ta chọn β > cho 2β(x) ≤ δ/2,, với < m ≤ 1, δ < δ − 2β x m = Φ(x, x) ≤ sup Φ(x, y) (2.39) Vì Φ liên tục lim|x|+|y|→∞ Φ(x, y) = −∞ nên tồn x, y cho Φ(x, y) = sup Φ(x, y) (2.40) Từ bất đẳng thức Φ(x, x) + Φ(y, y) ≤ 2Φ(x, y) dễ dàng có |x − y|2 ≤ u1 (x) − u1 (y) + u2 (x) − u2 (y) ε (2.41) Khi từ tính bị chặn u1 , u2 suy √ |x − y| ≤ c ε (2.42) với số c thích hợp Thế (2.42) vào (2.41) sử dụng tính liên tục u1 , u2 , ta có √ |x − y|2 ≤ ω( ε), ε (2.43) với ω mô đun Tiếp theo, ta xây dựng C hàm thử |x − y|2 + β( x ϕ(x) := u2 (y) + 2ε |x − y|2 ψ(y) := u1 (x) − − β( x 2ε m + y m ) m + y m ) 50 để ý rằng, từ định nghĩa x, y, u1 − ϕ đạt lớn x u2 − ψ đạt nhỏ y Dễ dàng tính |x − y| + γx,γ = βm x ε |x − y| Dψ(y) = − τ y,τ = βm y ε Dϕ(x) = m−2 m−2 Theo định nghĩa nghiệm nghiệm trên, u1 (x) + H(x, Dϕ(x)) ≤ ≤ u2 (y) + H(y, Dψ(y)), (2.44) cách sử dụng (2.33) với µ = 1/ε, τ, γ định nghĩa x , ta có L |x − y|2 + τ K y + γK x + ωl (|x − y|) ε √ √ ≤ Lω( ε) + βmK( x m + y m ) + ωl (c ε), u1 (x) − u2 (y) ≤ để có bất đẳng thức cuối sử dụng (2.42) (2.43) Lúc này, cách chọn < m ≤ 1/K ta có Φ(x, y) ≤ u1 (x) − u2 (y) − β( x m + y m √ √ ) ≤ Lω( ε) + ωl (c ε), vế phải bất đẳng thức cuối làm nhỏ δ/2 với ε đủ nhỏ Điều mâu thuẫn với (2.39) (2.40) Nhận xét 2.2.12 Giả thiết tính liên tục u1 , u2 Định lý 2.2.11 thay tính liên tục Khi v nghiệm đầy đủ (2.25) lớp BC(RN ) (các hàm liên tục bị chặn từ RN → R) Để chứng minh điều này, chọn β ta có ước lượng x m + y m < sup u1 − inf u2 =: c0 β với ε > 0, m ∈ [0, 1], khơng Φ(x, y) ≤ 0, mâu thuẫn với 1/m (2.39) (2.40) Khi với ε > 0, x, y thuộc tập compact B(0, c0 ), m = {1, 1/K}, tính liên tục u1 , u2 tập hợp đủ để suy (2.43) từ (2.41) (2.42) Đó bước mà sử dụng tính liên tục u1 , u2 51 Nhận xét 2.2.13 Định lý 2.2.11 Nhận xét 2.2.12 dễ dàng mở rộng thành kết so sánh cho toán biên Dirchlet Nếu H hàm liên tục thỏa mãn (2.43), Ω ⊆ RN tập mở u1 , u2 ∈ BC(Ω) tương ứng nghiệm nhớt nghiệm nhớt u + H(x, Du) = Ω u1 ≤ u2 ∂Ω u1 ≤ u2 Ω Khác biệt chứng minh điểm cực đại Φ,(x, y) khơng thuộc Ω × Ω Nếu x ∈ ∂Ω ta có √ Φ(x, y) ≤ u1 (x) − u2 (x) + u2 (x) − u2 (y) ≤ ω(c ε), 1/m (Ω mô đun liên tục u2 B(0, c0 ) (xem chứng minh Nhận xét 2.2.12) ta sử dụng (2.42) Bằng cách chọn ε đủ nhỏ ta suy mâu thuẫn với (2.39) (2.40) Nếu x ∈ Ω y ∈ ∂Ω ta thêm bớt u1 (y) sử dụng tính liên tục u1 để suy mấu thuẫn Nhận xét 2.2.14 Một hệ trực tiếp Định lý 2.2.11 Nhận xét 2.2.6 2.2.8 đẳng thức v = v # , tức lớp hàm điều khiển đo lớp hàm điều khiển khúc sinh hàm giá trị Chúng ta kết thúc phần với vài bình luận tính tối ưu giả thiết Định lý so sánh 2.2.11 hàm Hamiltonian có dạng (2.24) Trước tiên ý rằng, bỏ giả thiết u1 u2 đồng thời bị chặn phương trình tuyến tính chiều u − xux = R có nghiệm cổ điển liên tục u1 ≡ u2 = x Nó có nghiệm nhớt u3 (x) = |x| u4 (x) = − |x| tương ứng bị chặn bị chặn nghiệm phương trình hữu hạn chiều tùy ý u − x · Du = RN Tuy nhiên có kết qủa so sánh tính lớp nghiệm không bị chặn với giả thiết thích hợp độ tăng vơ cực (xem Nhận xét 1.2.5) 52 Giả thiết tính liên tục l (A4) lới lỏng thành tính liên tục nhiên chúng tơi không đề cập chi tiết Bây tập trung vào giả thiết (A3) thông qua trường hợp chiều N = , A tập điểm, phương trình Hamilton- JacobiBellman tuyến tính f (x) lũy thừa x Với "trường hợp f giảm" f (x) := −sgnx|x|b , x ∈ R thỏa mãn (A3) với b > (với L = 0), Định lý 2.2.11 áp dụng với phương trình u + sgnx|x|b ux = R u ≡ nghiệm bị chặn Với "trường hợp f tăng " f (x) := sgnx|x|b , b > thỏa mãn (A3) b = u ≡ nghiệm bị chặn u − sgnx|x|b ux = R (2.45) b = Khi b > 1, phương trình có nghiệm cổ điển thứ hai BU C(R) : |x|1−b ) x = 0, u(0) = 0, u(x) := exp( 1−b ux (x) = sgnx|x|−b u(x) x = ux (0) = Chú ý trường véc tơ C theo biến x (A3) ln thỏa mãn x y hạn chế tập compact K với số thích hợp LK Do với hàm f trơn (A3) thực chất điều kiện độ tăng vơ cực Nói cách khác, khơng có hạn chế trường véc tơ đơn điệu không giảm, trường hợp ngược lại trường véc tơ phải có độ tăng khơng tuyến tính Ví dụ cho thấy, giả thiết tối ưu Định lý so sánh 2.2.11 trường véc tơ có độ tăng đa thức vơ cực 53 2.2.2 Định lý kiểm định qua nghiệm nhớt Trong tiểu mục rút số hệ đơn giản toán điều khiển tối ưu với thời gian vô hạn từ kết phương trình Hamilton- Jacobi- Bellman liên kết Chúng ta bắt đầu với số điều kiện cần đủ cho tính tối ưu luật điều khiển định nghĩa sau Định nghĩa 2.2.15 Một luật điều khiển (control law) hay presynthesis tập Ω ⊂ RN ánh xạ A : Ω → A cho tương ứng x ∈ Ω với hàm điều khiển A(x) =: αx Luật điều khiển gọi tối ưu tập Ω chi phí tương ứng với JA (x) := J(x, αx ) thỏa mãn JA (x) = J(x, α) = v(x) với x ∈ Ω α∈A Các ví dụ quan trọng luật điều khiển tạo ánh xạ phản hồi Φ : Ω → A phản hồi chấp nhận theo nghĩa sau Định nghĩa 2.2.16 Một ánh xạ phản hồi tập Ω ⊆ RN , Φ : Ω → A chấp nhận với x ∈ Ω tồn nghiệm yx (·, Φ) [0, +∞) y = f (y, Φ(y)) y(0) = x cho t → Φ(yx (t, Φ)) đo (yx (t, Φ)) ∈ Ω với t ≥ 0) Giả sử Φ : Ω → A ánh xạ phản hồi chấp nhận Khi đó, αx (·) := Φ(yx (·, Φ)) ∈ A luật điều khiển ta gọi luật phản hồi, αx trường gọi điều khiển lặp đóng (closed-loop control) Một luật phản hồi có thuộc tính khơng nhớ, tức với z = yx (t, αx ) ta có αz (·) = αx (· + t) Nói chung, luật điều khiển không nhớ RN gọi synthesis Như luật phản hồi synthesis 54 Trước đề cập tới điều kiện tối ưu luật điều khiển, nhắc lại phương trình Hamilton- Jacobi- Bellman λu + sup {−f (x, a) · Du − l(x, a)} = (2.46) a∈A Trong phần nói tới nghiệm dưới, ta hiểu nghiệm nhớt liên tục bị chặn Tương tự với nghiệm nghiệm Theo Nhận xét 2.2.12, "liên tục đều" thay "liên tục" Hệ 2.2.17 Giả sử ta có giả thiết (A0)-(A4) A luật điều khiển tập Ω Khi (i) (Điều kiện cần cho tính tối ưu) Nếu A tối ưu Ω tập mở chi phí tương ứng JA nghiệm nhớt (2.46) Ω (ii) (Điều kiện đủ cho tính tối ưu) Nếu tồn nghiệm u (2.46) RN , cho JA ≤ u Ω A tối ưu (iii) (Điều kiện đủ cho tính khơng tối ưu) Nếu tồn nghiệm ω (2.46) RN cho JA > ω điểm Ω A khơng tối ưu (iv) Đặc biệt với Ω = RN , tính tối ưu A tương đương với khẳng định sau: JA nghiệm (2.46) RN ; JA nghiệm (2.46) RN ; JA ≤ ω với nghiệm ω (2.46) RN Chứng minh Tất khẳng định suy tương đương tính tối ưu A đẳng thức JA = v, v hàm giá trị Do (i) suy từ Mệnh đề 2.2.7 tính địa phương khái niệm nghiệm nhớt; (ii) suy từ Định lý 2.2.11 v ≤ JA ≤ u ≤ v Ω; (iii) suy từ định lý v ≤ ω < JA ; 55 (iv) hệ hiển nhiên Định lý 2.2.11 Hệ 2.2.17 kỹ thuật kiểm định cổ điển Mục 2.1 gợi nhớ khái niệm hàm kiểm định, nghiệm nhớt u ∈ BU C(RN ) Để kiểm tra luật điều khiển A tối ưu RN ta cần có hàm kiểm định u thỏa mãn u ≥ JA Theo cách tương tự, ta gọi hàm phản kiểm định nghiệm nhớt ω ∈ BU C(RN ) Nếu tồn hàm phản kiểm định thỏa mãn ω < JA A khơng điều khiển tối ưu Ta nói α0 ∈ A điều khiển tối ưu x0 ∈ RN J(x0 , α0 ) = minα∈A J(x0 , α) = v(x0 ) Chúng ta có kết kiểm định sau: Hệ 2.2.18 Giả sử ta có giả thiết (A0)-(A4) Khi ta có (i) Điều khiển α0 tối ưu x0 tồn hàm kiểm định u cho J(x0 , α0 ) ≤ u(x0 ); (ii) α0 không điều khiển tối ưu x0 tồn hàm phản kiểm định ω cho J(x0 , α0 ) > ω(x0 ) KẾT LUẬN Luận văn tìm hiểu cách tổng quan nghiệm nhớt phương trình đạo hàm riêng phi tuyến cấp một, bao gồm: khái niệm bản, tính chất, phép tốn, tính nhất, tính quy, ; lý thuyết điều khiển tối ưu, toán điều khiển tối ưu với thời gian vô hạn ứng dụng lý thuyết nghiệm nhớt toán điều khiển tối ưu với thời gian vô hạn thông qua phương pháp quy hoạch động Bellman Tài liệu tham khảo [1] Nguyễn Hữu Dư (2005), Điều khiển tối ưu hệ tất định ngẫu nhiên, NXB ĐHQG Hà Nội [2] Hoàng Tụy (2005), Hàm thực giải tích hàm, NXB ĐHQG Hà Nội [3] Trần Đức Vân (2005), Lý thuyết phương trình vi phân đạo hàm riêng, NXB ĐHQG Hà Nội [4] M Bardi, I Capuzzo-Dolcetta (1997), Optimal control and viscosity solutions of Hamilton-Jacobi-Bellman equations, Birkhăuser, Boston, a Basel, Berlin [5] I Capuzzo-Dolcetta, P L Lions (1997), Viscosity solutions and applications (Montecatini, 1995), volume 1660 of Lecture notes in mathematics, Berlin, Springer [6] M.G Crandall, H Ishii and P.L Lions (1992), User’s Guide to Viscosity Solutions of Second Order Partial Differential Equations, Bull A.M.S., 27, 1-67 [7] M.G Crandall and P.L Lions (1983), Viscosity solutions of HamiltonJacobi equations, Trans Amer Math Soc., 277, 1-42 ... ? ?Nghiệm nhớt phương trình đạo hàm riêng cấp toán điều khiển tối ưu với thời gian vô hạn? ?? Nội dung Luận văn gồm hai chương: Chương 1, trình bày kiến thức chuẩn bị nghiệm nhớt phương trình đạo hàm. .. 2 .1. 4 2.2 Bài toán điều khiển tối ưu với thời gian vô hạn Định lý kiểm định 35 Ứng dụng nghiệm nhớt toán điều khiển tối ưu với thời gian vô hạn 2.2 .1. .. ứng dụng nghiệm nhớt liên tục phương trình đạo hàm riêng cấp toán điều khiển tối ưu thời gian vơ hạn Nhiệm vụ nghiên cứu -Tìm hiểu nghiệm nhớt liên tục phương trình đạo hàm riêng cấp 1; -Tìm hiểu

Ngày đăng: 23/07/2015, 23:54

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan