Nguyên lý cực đại pontriagin trong lý thuyết điều khiển tối ưu (LV01165)

81 285 0
Nguyên lý cực đại pontriagin trong lý thuyết điều khiển tối ưu (LV01165)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bộ giáo dục và đào tạo Tr-ờng đại học s- phạm hà nội 2 NGUYN PHI LONG NGUYấN Lí CC I PONTRIAGIN TRONG Lí THUYT IU KHIN TI U Chuyờn ngnh: Toỏn gii tớch Mó s: 60 46 01 02 LUN VN THC S TON HC Ngi hng dn khoa hc: TS. TRN VN BNG Hà Nội, 2013 LỜI CẢM ƠN Tác giả xin được bày tỏ lòng biết ơn chân thành tới TS. Trần Văn Bằng, người thầy đã truyền thụ kiến thức và hướng dẫn tận tình tác giả hoàn thành luận văn này. Tấm gương nghiên cứu khoa học nghiêm túc và sự chỉ bảo ân cần của thầy Trần Văn Bằng trong suốt quá trình tác giả viết luận văn đã giúp cho tác giả có ý thức trách nhiệm và quyết tâm cao khi hoàn thành luận văn của mình. Tác giả cũng xin được gửi lời cảm ơn chân thành và lòng biết ơn các thầy giáo dạy cao học chuyên ngành Toán giải tích, Ban giám hiệu, Phòng Sau đại học Trường Đại học sư phạm Hà Nội 2 đã truyền thụ kiến thức, đóng góp ý kiến và giúp đỡ tác giả trong suốt quá trình học tập, nghiên cứu và hoàn thành luận văn này. Nhân đây tôi xin bày tỏ lòng biết ơn sâu sắc tới gia đình, ban giám hiệu trường THPT Tự Lập - Mê Linh - Hà Nội cùng bạn bè, đồng nghiệp đã tạo kiều kiện, động viên và giúp đỡ tôi rất nhiều trong suốt quá trình học tập, nghiên cứu. Hà Nội, tháng 06 năm 2013 Học viên Nguyễn Phi Long LỜI CAM ĐOAN Tôi xin cam đoan luận văn là công trình nghiên cứu của riêng tôi dưới sự hướng dẫn của TS. Trần Văn Bằng. Trong khi nghiên cứu luận văn, tôi đã kế thừa thành quả khoa học của các nhà khoa học với sự trân trọng và biết ơn. Hà Nội, tháng 06 năm 2013 Học viên Nguyễn Phi Long Mục lục Mở đầu 1 Nội dung 3 1 Kiến thức chuẩn bị 3 1.1. Một số khái niệm trong lý thuyết độ đo . . . . . . . . . . . . . . . . . . 4 1.2. Tập lồi, không gian con afin và nón . . . . . . . . . . . . . . . . . . . . 5 1.3. Một số kết quả của giải tích hàm . . . . . . . . . . . . . . . . . . . . . 13 1.4. Hệ điều khiển và bài toán điều khiển tối ưu . . . . . . . . . . . . . . . 16 1.4.1. Hệ điều khiển . . . . . . . . . . . . . . . . . . . . . . . . . . . . 16 1.4.2. Điều khiển và quỹ đạo . . . . . . . . . . . . . . . . . . . . . . . 17 1.4.3. Hai bài toán tổng quát trong điều khiển tối ưu . . . . . . . . . . 20 1.5. Một số điều kiện cần trong phép tính biến phân . . . . . . . . . . . . . 23 2 Nguyên lý cực đại Pontriagin trong lý thuyết điều khiển tối ưu 32 2.1. Nguyên lý cực đại Pontriagin . . . . . . . . . . . . . . . . . . . . . . . 32 2.2. Sự biến thiên điều khiển . . . . . . . . . . . . . . . . . . . . . . . . . . 37 ii iii 2.2.1. Phương trình biến phân và phương trình liên hợp . . . . . . . . 38 2.2.2. Biến phân nhọn . . . . . . . . . . . . . . . . . . . . . . . . . . . 43 2.2.3. Biến phân đa nhọn . . . . . . . . . . . . . . . . . . . . . . . . . 46 2.2.4. Biến phân trên khoảng tự do . . . . . . . . . . . . . . . . . . . 48 2.3. Tập hợp khả tới và sự xấp xỉ biên bởi các nón . . . . . . . . . . . . . . 50 2.3.1. Nón tiếp xúc trên khoảng cố định . . . . . . . . . . . . . . . . . 51 2.3.2. Nón tiếp xúc trên khoảng tự do . . . . . . . . . . . . . . . . . . 52 2.3.3. Xấp xỉ tập khả tới bởi các nón . . . . . . . . . . . . . . . . . . . 54 2.3.4. Liên hệ giữa các nón tiếp xúc và hàm Hamilton . . . . . . . . . 55 2.3.5. Các quỹ đạo được điều khiển trên biên của tập khả tới . . . . . 58 2.4. Chứng minh của nguyên lý cực đại . . . . . . . . . . . . . . . . . . . . 61 2.4.1. Hệ mở rộng . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 61 2.4.2. Các quỹ đạo tối ưu nằm trên biên của tập khả tới của hệ mở rộng 62 2.4.3. Các tính chất của phản hồi liên hợp và của hàm Hamilton . . . 63 2.4.4. Các điều kiện hoành . . . . . . . . . . . . . . . . . . . . . . . . 65 2.5. Điều khiển tối ưu toàn phương tuyến tính . . . . . . . . . . . . . . . . 69 Kết luận 75 Tài liệu tham khảo 76 MỞ ĐẦU 1. Lý do chọn đề tài Lý thuyết điều khiển tối ưu là một trong những lý thuyết gắn liền với hầu hết các lĩnh vực khoa học cũng như thực tiễn. Tuy nhiên các mô hình điều khiển thường rất phức tạp. Có rất nhiều công trình nghiên cứu về các điều kiện tối ưu, tuy nhiên hầu hết chỉ là điều kiện cần hoặc điều kiện đủ. Điều kiện đủ quan trọng nhất là phương trình Hamilton-Jacobi-Bellman, trong khi đó một trong các điều kiện cần quan trọng nhất phải kể đến Nguyên lý cực đại Pontriagin mà trường hợp đặc biệt của nó là phương trình Euler-Lagrange. Nguyên lý này được Pontriagin và các học trò của ông phát hiện và công bố năm 1956. Tuy nhiên đây là một trong những điều kiện cần rất trừu tượng trong việc hiểu, vận dụng, đặc biệt là trong chứng minh. Với mong muốn có thêm hiểu biết về nguyên lý cực đại này cùng những ứng dụng của nó đối với lý thuyết điều khiển tối ưu, tôi đã chọn đề tài: Nguyên lý cực đại Pontriagin trong lý thuyết điều khiển tối ưu. 2. Mục đích nghiên cứu Tìm hiểu về Nguyên lý cực đại Pontriagin và ứng dụng trong lý thuyết điều khiển tối ưu. 3. Nhiệm vụ nghiên cứu Nghiên cứu nguyên lý cực đại Pontriagin, chứng minh nguyên lý và ứng dụng của nguyên lý đối với bài toán điều khiển tối ưu toàn phương. 2 4. Đối tượng và phạm vi nghiên cứu Đối tượng nghiên cứu: Điều kiện cần và đủ cho bài toán điều khiển tối ưu toàn phương. Phạm vi nghiên cứu: Bài toán điều khiển tối ưu tất định đặc biệt là bài toán điều khiển tối ưu toàn phương. 5. Phương pháp nghiên cứu - Sử dụng một số phương pháp của Giải tích hàm, của lý thuyết điều khiển tối ưu. - Phân tích, tổng hợp kiến thức. 6. Giả thuyết khoa học Nghiên cứu bài toán điều khiển tối ưu tất định đặc biệt là bài toán điều khiển tối ưu toàn phương. Nội dung của luận văn bao gồm hai chương: Chương 1, trình bày một số kiến thức chuẩn bị về: lý thuyết độ đo, giải tích lồi, phương trình vi phân đo được theo thời gian, giải tích hàm, lý thuyết biến phân, lý thuyết điều khiển tối ưu cần thiết cho chương sau. Nội dung của chương này được tham khảo từ các tài liệu [3, 1, 2, 4]. Chương 2, trình bày về nguyên lý cực đại Pontriagin, bao gồm: phát biểu nguyên lý, chứng minh nguyên lý và ứng dụng của nguyên lý đối với bài toán điều khiển tối ưu toàn phương. Nội dung của chương này cơ bản dựa trên bài giảng của Giáo sư Andrew D. Lewis ([3]). Chương 1 Kiến thức chuẩn bị Trong luận văn này chúng tôi sử dụng các kí hiệu chính sau đây: 1. R là tập số thực và R = {−∞} ∪R ∪ {∞} là tập số thực mở rộng. 2. Tập các ánh xạ tuyến tính từ R m vào R n kí hiệu là L (R m ; R n ). 3. Tích vô hướng trong R n được kí hiệu ·, · và chuẩn được kí hiệu bởi ·. Chúng ta cũng sử dụng · cho chuẩn của các ánh xạ tuyến tính và đa tuyến tính. 4. Cho x ∈ R n và r > 0,ta kí hiệu: B (x, r) = {y ∈ R n |y −x < r}, B (x, r) = {y ∈ R n |y −x ≤ r} là hình cầu mở và hình cầu đóng bán kính r có tâm tại x. 5. Chúng ta kí hiệu S n = {x ∈ R n+1 |x = 1} là mặt cầu đơn vị n chiều và D n = {x ∈ R n |x ≤ 1} là hình cầu đơn vị n chiều. 6. Phần trong, biên và bao đóng của tập hợp A ⊂ R n được kí hiệu theo thứ tự là int (A), bd (A) và cl (A). Nếu A ⊂ R n thì tôpô trên A là họ tất cả các tập có dạng U ∩ A với U ⊂ R n mở. Nếu S ⊂ A ⊂ R n thì int A (S) là phần trong của S đối với tôpô 3 4 cảm sinh trên A. 7. Nếu U ⊂ R n là một tập mở và φ : U → R m là ánh xạ khả vi thì đạo hàm của φ tại x ∈ U được kí hiệu bởi Dφ (x) và nó là một ánh xạ tuyến tính từ R n vào R m . Đạo hàm cấp r của φ tại x kí hiệu là D r φ (x) và nó là một ánh xạ đa tuyến tính đối xứng từ (R n ) r vào R m . 8. Nếu U a ⊂ R n a , a ∈ {1, , k} là các tập hợp mở và nếu φ : U 1 × · · · × U k → R m là hàm khả vi thì ta kí hiệu D a φ (x 1 , , x k ), đạo hàm riêng thứ a với a ∈ {1, , k}, và nó được định nghĩa là một đạo hàm tại x a của ánh xạ từ U a vào R m xác định bởi: x → φ (x 1 , , x a−1 , x, x a+1 , , x k ) . Chúng ta kí hiệu D r a φ là đạo hàm riêng cấp r theo thành phần thứ a. 9. Cho U ⊂ R n là một tập mở. Ánh xạ φ : U → R m được gọi thuộc lớp C r nếu nó khả vi r lần liên tục. 10. . f được kí hiệu là đạo hàm của hàm f : R → R k theo biến “thời gian” trong các bài toán này. 11. Chúng ta kí hiệu o  ε k  là một hàm liên tục của ε thỏa mãn lim ε→0 o  ε k  ε k = 0, nó còn được gọi là vô cùng bé bậc cao hơn ε k khi ε → 0. 12. Ma trận đơn vị cấp n được kí hiệu là I n và ma trận không cấp m × n được kí hiệu là 0 m×n . 1.1. Một số khái niệm trong lý thuyết độ đo Định nghĩa 1.1.1 (Hàm bị chặn cốt yếu liên tục tuyệt đối). Cho I ⊂ R là một khoảng và f : I → R đo được. (i) Nếu với mỗi khoảng con compact J ⊂ I, hàm f|J là khả tích thì f được gọi là khả tích địa phương. 5 (ii) Nếu tồn tại M > 0 sao cho λ ({t ∈ I||f (t)| > M}) = 0 thì hàm f được gọi là bị chặn cốt yếu và ta đặt esssup t∈I |f (t)| = inf {M ∈ R|λ ({t ∈ I||f (t)| > M}) = 0}. (iii) Nếu tồn tại một hàm khả tích địa phương g : I → R và t 0 ∈ I sao cho f (t) =  [t 0 ,t] (g | [t 0 , t]) dλ, thì f được gọi là liên tục tuyệt đối địa phương. Nếu I là compact thì liên tục tuyệt đối địa phương sẽ được gọi là liên tục tuyệt đối. Chú ý 1. Một hàm liên tục tuyệt đối có đạo hàm hầu khắp nơi. Hơn nữa, nếu f (t) = t  t 0 g (τ) dτ với g là hàm khả tích địa phương thì . f (t) = g (t) tại hầu hết t. Ngược lại, nếu một hàm liên tục tuyệt đối có đạo hàm bằng 0 hầu khắp nơi thì nó là hằng số. Định nghĩa 1.1.2 (Điểm Lebesgue). Cho I ⊂ R là một khoảng và f : I → R là hàm khả tích địa phương. Điểm t 0 ∈ I là một điểm Lebesgue của f nếu lim ε→0 1 2ε t 0 +ε  t 0 −ε |f (t) − f (t 0 )|dt = 0. Ta có phần bù của tập hợp các điểm Lebesgue có độ đo bằng 0. Tất cả các khái niệm trên đối với hàm giá trị trong R đều có thể được áp dụng với các hàm giá trị trong R n bằng việc áp dụng các định nghĩa trên đối với từng thành phần. 1.2. Tập lồi, không gian con afin và nón Một phần quan trọng trong chứng minh nguyên lý cực đại là sử dụng các nón và nón lồi để xấp xỉ tập khả tới. Dưới đây là các định nghĩa cơ bản và các tính chất mà ta sẽ sử dụng. [...]... điều khiển tối ưu Mục này nhằm trình bày khái niệm hệ điều khiển và các kí hiệu cần thiết và một số lớp các quỹ đạo của hệ Chúng tôi cũng thiết lập một số bài toán điều khiển tối ưu cụ thể làm tiền đề cho việc thảo luận về nguyên lý cực đại Pontriagin 1.4.1 Hệ điều khiển Định nghĩa 1.4.1 (Hệ điều khiển) Hệ điều khiển là một bộ ba Σ = (X, f, U ) trong đó: X ⊂ Rn là một tập mở, U ⊂ Rm và f : X × cl (U... 1.4.3 (Về bài toán điều khiển tối ưu) 1 Trường hợp hàm Lagrange L (x, u) = 1, khi đó hàm mục tiêu chính là khoảng thời gian I của quỹ đạo nên bài toán điều khiển tối ưu lúc này được gọi là bài toán điều khiển tối ưu thời gian 2 Xét hệ điều khiển tối ưu tuyến tính Σ = (A, B, Rm ) với hàm Lagrange 1 1 LQ,R (x, u) = Q (x, x) + R (u, u) , 2 2 trong đó Q là một dạng song tuyến tính đối xứng trong không gian... R là một dạng song tuyến tính xác định dương đối xứng trong không gian điều khiển Rm Bài toán điều khiển tối ưu này được gọi là bài toán điều khiển tối ưu toàn phương tuyến tính 23 1.5 Một số điều kiện cần trong phép tính biến phân Trong mục này chúng ta sẽ đề cập tới ba điều kiện cần của phép tính biến phân cổ điển có liên quan đến nguyên lý cực trị Cho X là một tập hợp con mở của Rn , L : X × Rn... đường cong đều là cực tiểu của JL Tiếp theo, ta xét một bài toán vô nghiệm trong lớp C 2 , nhưng có nghiệm trong lớp hàm ít khả vi hơn Điều này cho thấy lớp C 2 (x0 , x1 , [t0 , t1 ]) không phải luôn là không gian nghiệm Trong lý thuyết điều khiển tối ưu ta sẽ xét các lớp rất tổng quát các đường cong Điều này cũng gợi ý một số kĩ thuật mà ta sẽ gặp trong phép chứng minh của nguyên lý cực trị Ví dụ 1.5.3... (τ ) dτ, ξ (t) = exp (At) ξ (0) + 0 trong đó exp (·) là hàm mũ ma trận 1.4.2 Điều khiển và quỹ đạo Trong luận văn này chúng tôi xét các loại điều khiển và quỹ đạo sau đây: (1.2) 18 Định nghĩa 1.4.2 (Điều khiển chấp nhận được, quỹ đạo được điều khiển, cung được điều khiển) Cho Σ = (X, f, U ) là một hệ điều khiển (i) Một điều khiển chấp nhận được là một ánh xạ đo được µ : I → U trên một khoảng I ⊂ R sao... (Σ, L, S0 , S1 ) bao gồm các cung được điều khiển trên [t0 , t1 ] Bài toán 2 (Bài toán điều khiển tối ưu trên khoảng cố định) Cho Σ = (X, f, U ) là một hệ điều khiển L là một hàm Lagrange của Σ, S0 , S1 ⊂ X và t0 , t1 ∈ R thỏa mãn t0 < t1 Một quỹ đạo được điều khiển (ξ∗ , µ∗ ) ∈ Carc (Σ, L, S0 , S1 , [t0 , t1 ]) được gọi là một nghiệm của bài toán điều khiển tối ưu trên khoảng cố định đối với Σ, L,... bài toán điều khiển tối ưu Giả sử có một hệ điều khiển Σ = (X, f, U ) và ta ràng buộc vận tốc bởi các phương điều khiển: ξ (t) = f (ξ (t) , u (t)) Chú ý vận tốc chấp nhận được lúc này được tham số hóa bởi tập điều khiển U Do đó hàm Lagrange sẽ là một hàm xác định trên X × U chứ không phải trên X × Rn Ta sẽ làm rõ vấn đề này để hiểu về mối quan hệ giữa phép tính biến phân và điều khiển tối ưu Ta định... Định lí 1.5.3 thì không Cách xây dựng biến thiên trong Định lý 1.5.3, sẽ được sử dụng trong phép chứng minh nguyên lý cực trị Khi đó, những biến phân này sẽ được gọi là biến phân nhọn như hình trên đã mô tả Bây giờ ta xét một vài bài toán điển hình, qua đó đề cập tới một số tình huống thường gặp trong phép tính biến phân và lý thuyết điều khiển tối ưu Ví dụ 1.5.1 (Bài toán vô nghiệm) Cho X = R, x0... S1 Bài toán 1 (Bài toán điều khiển tối ưu trên khoảng tự do) Cho Σ = (X, f, U ) là một hệ điều khiển, L là một hàm Lagrange của Σ và S0 , S1 ⊂ X Quỹ đạo được điều khiển (ξ∗ , µ∗ ) ∈ Carc (Σ, L, S0 , S1 ) được gọi là nghiệm của bài toán điều khiển tối ưu trên khoảng tự do đối với Σ, L, S0 , và S1 nếu JΣ,L (ξ∗ , µ∗ ) ≤ JΣ,L (ξ, µ) với mỗi (ξ, µ) ∈ Carc (Σ, L, S0 , S1 ) Hãy tìm điều kiện cần cho nghiệm... phân gắn với hệ điều khiển Σ = (X, f, U ) là ξ (t) = f (ξ (t) , µ (t)) (1.1) Phương trình (1.1) và hàm f thường được gọi là hệ động lực Ví dụ 1.4.1 (Hệ afin -điều khiển) Hệ afin -điều khiển là một hệ điều khiển trong đó hệ động lực f là một hàm afin của điều khiển u: f (x, u) = f0 (x) + f1 (x) · u, với f0 : X → Rn và f1 : X → L (Rm ; Rn ) là các ánh xạ thuộc lớp C 1 Ví dụ 1.4.2 (Hệ điều khiển tuyến tính) . lý thuyết điều khiển tối ưu, tôi đã chọn đề tài: Nguyên lý cực đại Pontriagin trong lý thuyết điều khiển tối ưu. 2. Mục đích nghiên cứu Tìm hiểu về Nguyên lý cực đại Pontriagin và ứng dụng trong. trong điều khiển tối ưu . . . . . . . . . . 20 1.5. Một số điều kiện cần trong phép tính biến phân . . . . . . . . . . . . . 23 2 Nguyên lý cực đại Pontriagin trong lý thuyết điều khiển tối ưu. dụng trong lý thuyết điều khiển tối ưu. 3. Nhiệm vụ nghiên cứu Nghiên cứu nguyên lý cực đại Pontriagin, chứng minh nguyên lý và ứng dụng của nguyên lý đối với bài toán điều khiển tối ưu toàn phương. 2 4.

Ngày đăng: 24/07/2015, 10:35

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan