Phân tích thống kê trong thủy văn ( ĐH Quốc Gia HN ) - Chương 3 doc

31 793 8
Phân tích thống kê trong thủy văn ( ĐH Quốc Gia HN ) - Chương 3 doc

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

66 Chơng III Kiểm định các giả thiết thống kê 3.1.Khái niệm 3.1.1. Một số khái niệm về kiểm dịnh giả thiết thống kê Nh ở chơng 1 đã trình bày, cơ sở để áp dụng các phơng pháp thống kê là chuỗi phải đồng nhất và ngẫu nhiên. Hơn nữa khi áp dụng các đờng tần suất lý luận để mô tả phân bố của các đại lợng này phải đảm bảo sự phù hợp của giữa đờng lý luận và đờng kinh nghiệm. Chúng ta đã giả thiết rằng chuỗi quan trắc thoả mãn các tiêu chuẩn này để tiến hành các tính toán tiếp theo. Đó chính là các giả thiết thống kê. Tuy nhiên chuỗi quan trắc là một mẫu từ tổng thể, do tác động của nhiều nhân tố nên có thể cha phản ảnh đúng bản chất của tổng thể. Chính vì vậy cần tiến hành kiểm định các giả thiết trên. Vậy giả thiết thống kê là gì? Đó là giả thiết đa ra để xem xét có công nhận hay không một kết luận về thống kê. Nói riêng đó là giả thiết về tính đồng nhất, tính ngẫu nhiên và tính phù hợp với đờng tần suất nào đó của chuỗi quan trắc thuỷ văn. Kiểm định giả thiết thống kê là thủ tục để đánh giá xem giả thiết đúng hay sai và để có thể chấp nhận hay bác bỏ giả thiết đó. Trong thủ tục kiểm định thống kê chúng ta cần biết một số khái niệm sau: - Giả thiết không (Null Hypothesis-H 0 ) Giả thiết không là giả thiết ban đầu đa ra để kiểm định. Thờng giả thiết thiên về sự công nhận. - Giả thiết chệch (nghịch) (Anternative-Hypothesis) Giả thiết chệch là giả thiết ngợc lại với giả thiết không H 0 , giả thiết không công nhận. - Mức ý nghĩa (Level of significance) Mức ý nghĩa là xác suất (khá nhỏ) khi loại bỏ không chính xác giả thiết H 0 , hay còn gọi là xác suất sai lầm loại 1. Ngợc lại với mức ý nghĩa là mức tin cậy: = 1-. Giá trị càng nhỏ thì mức tin cậy càng lớn, giới hạn tin cậy càng mở rộng, càng ít phạm sai lầm loại 1, nhng lại tăng sai lầm loại 2. - Miền tới hạn - Miền tin cậy: Mỗi chỉ tiêu xác định một tập hợp (miền) tới hạn mà nếu giá trị lựa chọn rơi vào đó thì giả thiết H 0 bị bác bỏ. Phần bù của miền tới hạn gọi là miền tin cậy. Miền tới hạn đợc chọn sao cho xác suất rơi vào nó của chỉ tiêu xem xét là lớn nhất, khi đó giả thiết chệch đối lập với giả thiết H 0 đợc chấp nhận. - Biên tới hạn - Biên tin cậy 67 Biên tin cậy là giới hạn của miền tin cậy, là ranh giới giữa miền tới hạn và miền tin cậy . Nó phụ thuộc dạng phân bố của chỉ tiêu và mức ý nghĩa . - Bậc tự do (Degree of Freedom): là số giá trị độc lập có thể xác định đợc, chính bằng dung lợng mẫu trừ đi số ràng buộc: Y = n -(h+1), trong đó h là số thông số, n là dung lợng mẫu. - Các chỉ tiêu thống kê hay viết gọn là thống kê (Statistic) là chỉ tiêu để so sánh khi kiểm định. 3.1.2.Các bớc kiểm định giả thiết thống kê Quá trình kiểm định bao gồm các bớc sau: 1). Xác lập giả thiết không H 0 2). Chọn mức ý nghĩa , thờng chọn 1, 2, 5 và 10%. Khi kiểm định sẽ có 4 trờng hợp xảy ra: - Giả thiết là đúng và đợc chấp nhận. - Giả thiết đúng nhng bị loại bỏ với mức , khi đó ta đã phạm sai lầm loại 1. - Giả thiết sai và bị loại bỏ. - Giả thiết sai nhng đợc chấp nhận với mức , khi đó ta đã phạm sai lầm loại 2. 3). Xác định miền tới hạn và biên tới hạn: Điều này phụ thuộc vào dạng phân bố của chỉ tiêu và mức ý nghĩa. 4). Tính chỉ tiêu thống kê theo tài liệu quan trắc. 5). So sánh chỉ tiêu với biên tới hạn và kết luận chấp nhận hay loại bỏ giả thiết H 0 . 3.2. Kiểm định các giả thiết thống kê Có nhiều giả thiết thống kê cần kiểm định, nhng trong thuỷ văn thờng tiến hành kiểm định tính đồng nhất, tính ngẫu nhiên của chuỗi và tính phù hợp của đờng lí luận với đờng kinh nghiệm. Sau đây chúng ta sẽ tiến hành với từng giả thiết. 3.2.1. Kiểm định tính đồng nhất của chuỗi Chuỗi thuỷ văn đa vào trong tính toán phải đảm bảo tính đồng nhất. Có nhiều nguyên nhân, cả tự nhiên và nhân tạo, làm cho tính đồng nhất của chuỗi bị phá hoại. Tuy nhiên phân tích bản chất vật lý của các đặc trng thuỷ văn hoặc các nhân tố hình thành nó để chỉ ra sự đồng nhất là không đủ, vì chỉ mới là định tính. Hợp lý hơn cần sử dụng phơng pháp thống kê, nó cho phép đánh giá tính đồng nhất của các chuỗi quan trắc trong dạng định lợng. Hơn nữa cũng cần đánh giá tính đồng nhất của chuỗi khi không có thông tin về nguồn gốc gây ra sự không đồng nhất, khi đó phơng pháp thống kê sẽ là duy nhất. Mặt khác cũng có thể nguyên nhân vật lý đã biết nhng không rõ ràng, và theo quan điểm thực tế có thể không tính đến, các phơng pháp thống kê sẽ cho ta câu trả lời hợp lý nhất. Phơng pháp thống kê còn cho phép kiểm định tính đồng nhất của các chuỗi theo không gian khi cần kết hợp chúng trong một khu vực địa vật lý đồng nhất. 68 Có nhiều chỉ tiêu thống kê đợc dùng để đánh giá tính đồng nhất của các thông số phân bố mẫu, nói riêng là giá trị trung bình và phơng sai. a. Đồng nhất về giá trị trung bình Thờng bắt đầu áp dụng cho trờng hợp chuỗi có phân bố chuẩn *. Chỉ tiêu phân bố chuẩn z Coi trị số trung bình có phân bố chuẩn. Khi chuỗi gốc có phân bố chuẩn hay có dung lợng rất lớn. Chúng ta thực hiện theo các bớc kiểm định giả thiết thống kê. - Giả sử có 2 chuỗi x và y. Xác lập giả thiết H 0 : yx . - Giả sử 2 chuỗi x và y có dung lợng mẫu n x và n y , khi đó chỉ tiêu phân bố chuẩn có dạng: )( xy xy z , (3.1) trong đó: y y x x xy nn 2 2 )( , (3.2) x và y là các giá trị trung bình của mẫu; x và y là các khoảng lệch chuẩn của mẫu. - Chọn mức ý nghĩa , thờng chọn = 5%=0,05. - Xác định miền tới hạn. Tra bảng phân bố chuẩn (phụ lục 2.7) với q=1/2 (vì phân bố đối xứng) đợc giá trị z th . Với = 0,05 ta có z th = 1,96. - Tính chỉ tiêu z từ tài liệu quan trắc theo công thức (3.1). - So sánh: Nếu th zz thì ta chấp nhận giả thiết không H 0 , tức là có yx . Khi đó có thể đa vào cùng một chuỗi để tính toán. Ngợc lại, giả thiết H 0 bị bác bỏ và ta tiếp nhận giả thiết chệch y x . Sau này với các chỉ tiêu kiểm định khác, không trình bày lại các bớc kiểm định nh trên mà chỉ đa ra các chỉ tiêu cần tính và giá trị tới hạn để so sánh. Tuy nhiên phải nhớ rằng các bớc tiến hành kiểm định phải đầy đủ nh đã nêu. *. Chỉ tiêu Student Khi chuỗi không dài thì chỉ tiêu phân bố chuẩn không dủ mạnh, cần phải áp dụng chỉ tiêu khác, trong đó có chỉ tiêu Student. Chỉ tiêu này xuất phát từ phân bố Student hay phân bố t, do W.S.Gosset sử dụng lần đầu trong một bài toán thống kê (1908) (hình 3.1). Hình 3.1: Phân bố Student 69 Khi áp dụng chỉ tiêu này, phải thừa nhận phơng sai là đồng nhất: yx với là phơng sai của tổng thể. Tính đồng nhất của phơng sai sẽ xem xét ở phần sau. Chỉ tiêu có dạng: yx yxyx yyxx nn nnnn nn xy t )( 2 22 , (3.3) hoặc: , d S yx t (3.4) yx yx cd nn nn SS , (3.5) 2 11 22 2 yx yyxx c nn nn S )()( . (3.6) Các ký hiệu nh đã nêu ở trên. Giá trị tới hạn t đợc tra theo bảng Student (phụ lục 3.1) ứng với số bậc tự do: = n x + n Y -2 và mức ý nghĩa . Lu ý rằng chỉ tiêu student đối xứng nên cần tra bảng phụ lục (3.1) với q= /2. Sau đây là một số giá trị t ứng với =: (%) 5 1 0,1 t 1,96 2,58 3,29 Các bớc kiểm định vẫn tiến hành nh trên. 2 chỉ tiêu phân bố chuẩn và Student là những chỉ tiêu có tham số, áp dụng cho chuỗi quan trắc có phân bố chuẩn. *. Chỉ tiêu cho nhiều chuỗi Trong trờng hợp kiểm định nhiều chuỗi đồng thời, dùng chỉ tiêu Student dới dạng: 2 2 m m mymn nmy t )( , (3.7) trong đó: xx y m m , (3.8) với x là trung bình chung của toàn bộ n quan trắc: n i i xx 1 và k j i mn 1 , còn m x là giá trị trung bình theo mẫu quan trắc thứ m, có độ lệch lớn nhất so với trung bình chung; k là số mẫu quan trắc; là khoảng lệch chuẩn của chuỗi chung. Nếu t ứng với y m nằm trong miền tin cậy với mức ý nghĩa thì giá trị trung bình các mẫu m x là đồng nhất. Lu ý rằng chúng ta cũng phải thừa nhận các khoảng lệch chuẩn (phơng sai) của các mẫu m là đồng nhất. 70 Ví dụ 3.1: Cho số liệu Q năm trạm Hoà Bìnhsông Đà (bảng 1.7) từ 1956 đến 2002. Kiểm tra tính đồng nhất của chuỗi số liệu theo chỉ tiêu Student, biết rằng hồ chứa Hoà Bình bắt đầu hoạt động từ năm 1986. Ta chia chuỗi số liệu làm 2 phần, phần 1 từ 1956 đến 1985 gồm 30 số hạng, phần 2 gồm 17 số hạng còn lại. - Xác lập giả thiết H 0 : 2 chuỗi đồng nhất về giá trị trung bình: yx . - Giả thiết phơng sai của 2 chuỗi là đồng nhất: yx . - Tính chỉ tiêu Student từ chuỗi quan trắc theo công thức (3.3) đợc: t=0,04. - Chọn mức ý nghĩa =5%. - Tra bảng Student với mức ý nghĩa đã chọn và số bậc tự do =n x +n y -2=45, có t th =2,014. - So sánh thấy rằng t<t th , nh vậy giả thiết H 0 đợc chấp nhận và kết luận rằng chuỗi Q năm trạm Hoà Bìnhsông Đà từ 1956 đến 2002 là đồng nhất. *. Chỉ tiêu Wilcoxon Chỉ tiêu này thờng dùng để chấp nhận 2 mẫu vào cùng một tổng thể (mẫu chung), có thể cháp nhận cho cả 2 vị trí khác nhau (không gian) và cho 2 thời khoảng khác nhau (thời gian). Chỉ tiêu khá nhạy đối với trung bình mẫu, nhng không phản ứng với phơng sai mẫu, nên thờng dùng để đánh giá trung bình mẫu. Tiêu chuẩn này căn cứ trên việc thống kê số lợng nghịch thế xuất hiện do thuật toán sau: 1). Các giá trị quan trắc của 2 mẫu sắp xếp trong một chuỗi chung theo thứ tự (giảm dần hay tăng dần). Ví dụ: y 1 x 1 x 2 y 2 y 3 y 4 x 3 y 5 y 6 x 4 , (a) hay: x 1 x 2 x 3 y 1 y 2 x 4 y 3 y 4 x 5 y 5 , (b) trong đó x i là các giá trị của chuỗi 1, còn y i là các giá trị của chuỗi 2. 2). Nếu một giá trị x nào đó (hay y) xuất hiện sau giá trị y (hay x) thì cặp này hình thành một nghịch thế. Nh vậy trong dãy (a), x 1 hình thành một nghịch thế (với y 1 ) và x 2 cũng hình thành một nghịch thế (với y 1 ), x 3 hình thành 4 nghịch thế (với y 1 , y 2 , y 3 và y 4 ), còn x 4 hình thành 6 nghịch thế (với y 1 , y 2 , y 3 , y 4 , y 5 và y 6 ). Tơng tự, trong chuỗi (b) y 1 và y 2 hình thành 3 nghịch thế (với x 1 , x 2 , x 3 ), y 3 và y 4 hình thành 4 nghịch thế, còn y 5 hình thành 5 nghịch thế. 3). Lý thuyết [4,32] cho thấy rằng khi dung lợng mẫu không nhỏ hơn 10 thì số nghịch thế có phân bố gần chuẩn với kỳ vọng là: 2 nm M n . , (3.9) và phơng sai là: )( . 1 12 nm nm D n , (3.10) trong đó: m và n là số các số hạng của chuỗi x và y. 4). Miền tới hạn đợc xác định trong phạm vi: 71 u mnnmnm U 12 1 2 )( , (3.11) trong đó u đợc xác định theo bảng phân bố chuẩn với mức ý nghĩa (=0,05 thì u =2,58). hoặc: uqu uqu tMu tMu )( )( với uu D , (3.12) t P là khoảng lệch chuẩn hoá ứng với mức ý nghĩa (q=1/2 vì khoảng tin cậy đối xứng). Ví dụ với = 0,1 có q=0,05 và thu dợc t q = 2,58, còn với = 0,05 nhận đợc t q = 1,96. 5). So sánh, nếu U tính đợc nằm trong miền tới hạn thì giả thiết không H 0 bị bác bỏ, chuỗi không đồng nhất. Còn ngợc lại thì giả thiết không H 0 đợc chấp nhận và chuỗi đồng nhất. Chỉ tiêu này chỉ thích hợp khi so sánh 2 mẫu hoặc từng cặp mẫu trong nhiều điểm có cảnh quan đồng nhất. Với số mẫu lớn hơn 2 thì rất phức tạp và kém hiệu quả. Chỉ tiêu Wilcoxon là chỉ tiêu không tham số có thể áp dụng cho chuỗi gốc có phân bố bất kỳ. Ví dụ 3.2: Cũng với số liệu Q năm trạm Hoà Bìnhsông Đà (bảng 1.7) từ 1956 đến 2002. Kiểm tra tính đồng nhất của chuỗi số liệu theo chỉ tiêu Wilcoxon. Chúng ta cũng làm theo các bớc nh trên, nhng không nhắc lại lần lợt các bớc, mà chỉ tiến hành các bớc chủ yếu: - 2 chuỗi đã chia đợc gộp vào làm một và sắp xếp theo thứ tự giảm dần, đánh dấu phân biệt số hạng của chuỗi 1 và 2. - Tính số nghịch thế theo phơng pháp đã trình bày (bảng 3.1) Từ bảng (3.1) ta có tổng số nghịch thế là: U t =248. - Tính kỳ vọng và phơng sai của phân bố số nghịch thế theo các công thức (3.9) và (3.10), nhận đợc : M u =255; D u =2040; u =45,16. Bảng 3.1: Tính số nghịch thế U của chuỗi Q trạm Hoà Bìnhsông Đà TT Năm Q năm U TT Năm Q năm U 1 1989 1124 25 1976 (1720) 8 2 1992 1231 26 1974 (1740) 8 3 1987 1259 27 1990 1747 4 1980 (1260) 3 28 1984 (1750) 9 21 1969 (1630) 7 45 1999 2154 22 1985 (1650) 7 46 2002 2170 23 1972 (1690) 7 47 1971 (2180) 17 24 1991 1708 Tổng số 248 Ghi chú: Nhứng số trong dấu ngoặc đơn là của chuỗi x - Với =5%, ta có t q =1,96. 72 - Xác định miền tới hạn theo (3.11): u mnnmnm U 12 1 2 )( = 582 12 117301730 2 1730 , )( =395,2. hoặc theo (3.12): Hai giá trị tới hạn của U tính theo (3.12) là : U 1 =166 và U 2 =343. - So sánh với U t tính đợc ta thấy nó thoả mãn điều kiện (3.11) hoặc (3.12), nh vậy giả thiết H 0 đợc chấp nhận và kết luận chuỗi Q năm của trạm Hoà Bình-sông Đà đồng nhất *. Chỉ tiêu theo dấu Chỉ tiêu này cũng đợc áp dụng để kiểm định tính đồng nhất. Trong trờng hợp này chỉ xem xét dấu của sự chênh lệch giữa các số hạng của 2 chuỗi x và y: R i = x i - y i . Ta coi rằng số số hạng nh nhau và bằng n. R i = x i - y i : 0 y- x nếu(-) dấu mang x nếu)( dấu mang ii i 0 i y (3.14) Xác định số trờng hợp mang dấu cộng (K n +) và số trờng hợp mang dấu trừ (K n -). Lấy số trờng hợp nhỏ nhất trong (K n +) và (K n -), ta đợc K n (). Xác định giá trị tới hạn: 1 2 1 nk n m kn, , (3.15) k đợc tra bảng, với = 5% = 0,05 thì k = 0,98. So sánh: Nếu K n (+) < kn m , thì chuỗi không đồng nhất; Nếu K n (+) > kn m , thì chuỗi đồng nhất. Chỉ tiêu theo dấu cũng là chỉ tiêu không tham số có thể áp dụng cho chuỗi gốc có phân bố bất kỳ. Tuy nhiên chỉ tiêu này ít dùng. b. Đồng nhất về phơng sai Khi kiểm định theo chỉ tiêu Student đã thừa nhận phơng sai của các chuỗi là đồng nhất và bằng phơng sai tổng thể. Tuy nhiên cũng cần đánh giá làm rõ điều này. Việc kiểm định đợc tiến hành bằng các chỉ tiêu sau đây. *. Chỉ tiêu Fisher Hiện nay trong thuỷ văn thờng dùng chỉ tiêu Fisher hay tỷ số phơng sai để kiểm định về phơng sai. Chỉ tiêu xuất phát từ hàm mật độ xác suất do Fisher đa ra (1941) (hình 3.2), có dạng: 2 2 y x F , (3.16) trong đó: x là phơng sai lớn (lớn hơn) có số bậc tự do 1 xx n ; y là phơng sai nhỏ có 1 yy n ; n x và n y là số số hạng của 2 chuỗi x và y. Để xác định chỉ tiêu tới hạn F th , sử dụng bảng phân phối Fisher với số bậc tự do yx v, và 2 phơng sai x , y ứng với mức ý nghĩa . Bảng tra đợc đa ra trong phụ lục (3.3). Sau đây là một số giá trị ứng với số bậc tự do là yx v : (%) 1 5 10 F th 6,63 3,84 2,23 73 Hình 3.2: Phân bố Fisher Đây là tiêu chuẩn tham số nên yêu cầu chuỗi gốc phải có phân bố chuẩn. Vì trong kiểm định luôn có x > y nên gọi là kiểm định chặn một đầu. Các bớc kiểm định cũng thực hiện nh ở phần đầu chơng. Sau khi tính đợc F t và F th , tiến hành so sánh nếu thấy th FF thì chấp nhận giả thiết không và kết luận phơng sai 2 chuỗi đồng nhất. Còn nếu th FF thì phơng sai 2 chuỗi không đồng nhất. Ví dụ 3.3: Theo số liệu bảng (2.6), kiểm định phơng sai chuỗi Q max trạm Hoà Bình-sông Đà. - Chia chuỗi thành 2 phần nh đã thực hiện ở các ví dụ kiểm định trớc đây. - Tính phơng sai 2 chuỗi thành phần đợc :D x = 2 x =2506 và D y = 2 y =2313. - Tính chỉ tiêu Fisher theo công thức (3.16) đợc F t =1,174. - Tra bảng Fisher (phụ lục 3.2A,B) với mức ý nghĩa 5% và các phơng sai thành phần vừa tính, ta nhận đợc F th =2,198. Cũng có thể tính bằng hàm trong Excel. - So sánh thấy rằng F t <F th do đó phơng sai của 2 thành phần và cả chuỗi là đồng nhất. *. Chỉ tiêu cho nhiều chuỗi Trờng hợp khi kiểm định cho nhiều chuỗi ngời ta dùng chỉ tiêu: 22 2 2 1 2 max 2 K G , (3.17) trong đó: max : phơng sai lớn nhất trong các chuỗi; k , ,, 21 phơng sai của các chuỗi thành phần. Lu ý rằng chỉ tiêu này áp dụng cho các chuỗi cùng dung lợng. Ngời ta cũng sử dụng kiểm định Bartlett cho phơng sai [10], khi mà số chuỗi lớn hơn 2. Đó là một áp dụng đặc biệt của kiểm định 2 và cho bởi phơng trình: ,log)()(lg, m k kk m k kk snns 1 2 1 22 1130262 (3.18) trong đó: 2 k s là phơng sai trung bình của các mẫu; m là số mẫu; n k là dung lợng của mẫu thứ k và 2 k s là phơng sai mẫu thứ k: 74 k k k k k n i i k n xx s K 1 1 1 2 2 , (3.19) với k là số mẫu hay số phơng sai đợc ớc tính. Khi các mẫu có cùng dung lợng n k = n thì phơng trình (3.18) dẫn tới: 222 130262 kkk ssnn loglg)(, (3.20) Vì 2 tính theo (3.18), (3.20) bị lệch nên phải hiệu chỉnh bằng cách chia nó cho một hằng số C: C hc 2 2 , trong đó: )( )( 1 1 1 1 13 1 1 k k n nk C (3.21) So sánh 2 hc với giá trị tới hạn tra từ bảng 2 (Phụ lục 3.4), nếu 22 thhc thì chấp nhận H 0 với mức ý nghĩa đã chọn, nghĩa là các chuỗi đồng nhất. Trớc khi kiểm định Bartlett nên tiến hành kiểm định theo chỉ tiêu Fisher cho phơng sai lớn nhất và nhỏ nhất, nếu nó thoả mãn đồng nhất thì mới tiến hành theo Bartlett. Nếu không thoả mãn thì không cần tính tiếp, vì ít nhất đã không đồng nhất ở 2 chuỗi có phơng sai lớn nhất và nhỏ nhất vừa kiểm định và dĩ nhiên tất cả các chuỗi sẽ không đồng nhất. Các ví dụ trình bày chỉ kiểm định cho các thời đoạn khác nhau của chuỗi số liệu tại cùng một vị trí (đồng nhất về thời gian), tuy nhiên các chỉ tiêu cũng có thể áp dụng cho các chuỗi ở các vị trí khác nhau trong một khu vực địa vật lý đồng nhất (đồng nhất về không gian). c. Xây dựng đờng tần suất khi mẫu không đồng nhất Trong một số trờng hợp chuỗi quan trắc thu đợc là không đồng nhất. Khi đó các phơng pháp xây dựng đờng tần suất đã trình bày ở chơng 2 không thực hiện đợc. Tuy nhiên muốn tận dụng các thông tin đã có từ số liệu quan trắc, chúng ta phải xây dựng đờng tần suất cho chuỗi không đồng nhất. Có nhiều phơng pháp đợc giới thiệu, nhng phơng pháp đơn giản và đủ chính xác là của Velicanov và Brokovits [32]. Đây là phơng pháp bán đồ giải. Cơ sở của phơng pháp nh sau. Đờng tần suất của chuỗi không đồng nhất đợc coi là tổng có trọng số của các chuỗi đồng nhất thành phần: k kk nnn xPnxPnxPn xP )( )()( )( ' 21 2211 , (3.22) trong đó: )( ' xP là tần suất lí luận chung của toàn bộ chuỗi không đồng nhất; P 1 (x), P 2 (x), ,P k (x) là tần suất của các chuỗi đồng nhất thành phần; n là dung lợng chung; n=n 1 +n 2 + +n k; n 1 , n 2 , ,n k là dung lợng các chuỗi thành phần. Để chứng mình công thức (3.22) chúng ta xem xét một trờng hợp đơn giản, khi có 2 chuỗi thành phần, khi đó (3.22) có dạng sau: 21 2211 nn xPnxPn xP )()( )( ' (3.23) 75 Xác suất để biến x thuộc chuỗi thành phần thứ nhất P 1 (x), bằng n n nn n 1 21 1 , tơng tự xác suất để x thuộc chuỗi thành phần thứ hai P 2 (x), bằng n n 2 . Xác suất để giá trị cụ thể x i với tần suất P 1 (x i ) thuộc chuỗi P 1 (x), theo định lý nhân xác suất sẽ là: 21 1 nn n P 1 (x i ). Vì giá trị cụ thể x i bất kỳ có thể thuộc chuỗi thứ nhất hoặc thứ 2 nên xác suất xuất hiện của giá trị cụ thể x i trong toàn chuỗi không đồng nhất, theo định lý cộng xác suất, là: )()()( ' xP nn n xP nn n xP i 2 21 2 1 21 1 (3.24) Khái quát cho k chuỗi thành phần không đồng nhất nhận đợc biểu thức (3.22). Các bớc làm cụ thể tiến hành theo ví dụ sau đây. Ví dụ 3.4 [32]: Cho chuỗi dòng chảy năm của trạm Xakmara sông Xakmara gồm 80 năm. Ngời ta thấy rằng dòng chảy thời kỳ nhiều nớc và ít nớc là không đồng nhất. Yêu cầu xây dựng đờng tần suất lí luận tổng hợp. Chia toàn bộ chuỗi thành 2 chuỗi thành phần theo các thời kỳ. Nh vậy chuỗi lu lợng năm nhiều nớc có 68 số hạng, còn chuỗi năm ít nớc gồm 12 số hạng. Xây dựng các đờng cong tần suất cho toàn bộ 80 năm số liệu và cho từng chuỗi thành phần theo đờng tần suất Kritski-Menkel khi C s =C v nh đã trình bày ở chơng 2. Xây dựng đờng tần suất tổng hợp tiến hành nh sau. Từ 80 số hạng của chuỗi chung và các chuỗi thành phần (68 và 12) tính đợc tỷ trọng xác suất: n n nn n xP 1 21 1 1 )( = 80 68 =0,85; n n nn n xP 2 21 2 2 )( = 80 12 = 0,15. Bảng 3.2: Sơ đồ tính toán đờng lí luận cho chuỗi không đồng nhất Qmax trạm Xakmara sông Xakmara Chuỗi thành phần 1 Chuỗi thành phần 2 Môđun (l/skm 2 ) P 1 (x i ) 0,85.P 1 (x i ) P 2 (x i ) 0,15.P 2 (x i ) Tần suất tổng cộng )( ' xP 12 0,01 0,008 0,18 0,027 0,033 10 0,04 0,034 14,5 2,18 2,21 8 1,00 0,85 83,5 12,53 13,38 6 9,30 7,90 99,91 14,87 22,77 4 36,0 30,6 99,99 15,0 45,6 2 81,5 69,3 99,99 15,0 84,3 Tính tần suất tổng hợp của toàn chuỗi )( ' xP cho các giá trị lu lợng nằm trong khoảng dao động của chuỗi số liệu quan trắc (bảng 3.2). Dựa theo kết quả tính từ bảng (3.2) xây dựng đợc đờng tần suất lí luận tổng hợp cho mẫu không đồng nhất gồm 80 số hạng nh hình (3.3). [...]... 19 63 745 1979 961 1989 811 2000 1190 1964 990 1980 762 1990 137 0 2001 134 0 1965 1 130 1981 135 0 1991 133 0 2002 138 0 20 03 132 0 - Xác định kỳ vọng và phương sai và chỉ tiêu điểm ngoặt: E(P)=2 / 3( n- 2)= 2/ 3( 4 5- 2)= 2 /3. 43= 28,67, 16n 29 16 x 45 29 7,68, D( P ) 2 ( P ) 90 90 P E( P ) 31 28 ,67 2 ,33 Z 1,509 1,544 ( P) 7 ,681/ 2 - Với mức ý nghĩa =5%, tra bảng với q=/2=2,5% có Zth=1,96 -. .. (3 .7 2) - ước lượng hệ số bất đối xứng mẫu Phân bố của Cs có độ chệch âm và các công thức hiệu chỉnh được xác định như sau: 1) Theo các nhà thuỷ văn Mỹ: C s (1 Cs 2) Theo Blokhinov: 3) Theo Reznhicovski: C s 8 ,5 ) Cs mẫu n 2 n 5 2Cv (1 3Cv ) Cs mẫu n ( n 4 4Cv )( 1 2r 2 ) Cs mẫu n (3 .7 3) (3 .7 4) (3 .7 5) Kết quả phân tích từ chuỗi mô hình hoá theo phương pháp Monte-Carlo cho thấy rằng: - Công... ngoặt P tại thời gian i nếu, hoặc xi lớn hơn xi-1 và xi+1, hoặc xi nhỏ hơn xi-1 và xi+1 76 Có 6 khả năng sau đây trong một chuỗi (hình 3. 4)[ 10]: 1 xi-1>xi>xi+1 P = 0 Xi-1 i-1 i Xi-1 i-1 (2 ) xi-1>xi+1>xi P = 1 Xi Xi i (3 ) xi>xi-1>xi+1 P = 1 X i+1 i+1 2 (4 ) xi>xi+1>xi-1 P = 1 (5 ) xi+1>xi-1>xi P = 1 (6 ) xi+1>xi>xi-1 P = 0 X i+1 i+1 3 6 trường hợp trên có xác suất xuất hiện bằng Xi-1 i-1 nhau và các... đã chọn Thống kê tần suất kinh nghiệm theo từng khoảng (bảng 3. 7) 82 Bảng 3. 7: Kiểm định chuỗi Qmax trạm Hoà Bình-sông Đà theo đường Kritski-Menkel TT Khoảng E(p) Khoảng Qmax (m3/s) tần suất pi2 pi 1 12,5 5,9 12000 6 36 2 12,5 P 25,0 5,9 1200 0-1 0600 6 36 3 25,0 P 37 ,5 5,9 1060 0-1 0000 6 36 4 37 ,5 P 50,0 5,9 1000 0-9 780 6 36 5 50,0 P 62,5 5,9 978 0-8 830 6 36 6 62,5 P 75,0 5,9 8 83 0-8 230 6 36 7 75,0... ta có n phần tử (n quan trắc) độc lập x1; x2;, ,xn với khoảng cách giữa chúng là dx Các xi có cùng mật độ phân bố p(xi) Xác suất để biến ngẫu nhiên xi lấy giá trị trong khoảng dx là p(xi)dx Vì các xi là độc lập nên xác suất để xuất hiện đồng thời các xi là tích xác suất của từng xi: n P(x)=f(x 1). f(x 2). f(x 3) f(xn)= p( xi ) dx n i 1 (3 .6 2) Các thông số đạt giá trị tốt nhất nếu P(x) đạt giá trị cực... ai (3 .6 5) và giải các phương trình (3 .6 5) ta sẽ được các thông số ai Nhiều hàm p(x) không cho phép tìm được nghiệm giải tích của (3 .6 5), khi đó phải giải bằng phương pháp số rất phức tạp Ví dụ 3. 8 [32 ]: Đối với đường phân bố chuẩn: p( x ) ( x x )2 , exp 2 2 2 1 ta có 2 thông số là x và Hàm thích hợp khi đó sẽ là: n ln L ln 1 1 n 1 ln 2 2 2 2 1 n ( xi x ) 2 (3 .6 6) 1 89 Giải (3 .6 5). .. hiện trong các Xi i X i+1 i+1 4 trường hợp từ (2 ) đến (5 ), nghĩa là số trường hợp có điểm ngoặt ngẫu nhiên chiếm 4/6 = 2 /3 trường hợp Xi-1 i-1 5 Xi-1 i-1 Xi i Xi i X i+1 i+1 6 X i+1 i+1 Xi-1 i-1 Xi i Xi+1 i+1 Hình 3. 4: Các trường hợp xuất hiện điểm ngoặt Vì không xét được điểm ngoặt tại i =1 và i = n nên kỳ vọng (số điểm ngoặt có thể xét được) trong cả chuỗi (n- 2) điểm là: 2 (3 .2 6) E( P ) ( n 2 ) , 3. .. * n , (3 .8 3) trong đó: * là giá trị xác định theo mẫu b Khoảng tin cậy của phân vị xác suất Chúng ta cần xác định khoảng tin cậy cho một giá trị ứng với một tần suất nào đó theo hàm phân bố F(x) đã lựa chọn như ở chương 2 Khoảng tin cậy với mức tin cậy 1 như sau: F( x ) u n F( x ) F ( x ) u , n (3 .8 4) trong đó: u là nghiệm của phương trình K(u)=, với K( x ) 2 2 ( 1) t e 2i x là hàm phân. .. 1 ) Nếu dãy quan trắc 2 diễn ra hoàn toàn ngược lại thì P = 0, như vậy với một chuỗi bất kỳ sẽ có: N ( N 1) , (3 .3 2) E( P ) 4 và: P E( P ) , EP (3 .3 3) trong đó: P là số trường hợp thực tế mà số hạng sau lớn hơn số hạng trước Nếu P N ( N 1) là xu thế tăng, còn P 0 là xu thế giảm 2 Khi dãy là ngẫu nhiên hoàn toàn thì có kỳ vọng là E () = 0, và phương sai: Chỉ tiêu: D( ) Z 2( 2 N 5 ) , 9 N (. .. chuẩn với tần suất Kỳ vọng (khi 2 chưa biết): x t / 2 ,( n1 ) s x x t / 2 ,( n1 ) s , (3 .8 1) trong đó: t/2,(n- 1) tra từ bảng phân bố Student với mức và bậc tự do (n- 1); s là khoảng lệch quân phương mẫu Phương sai: s2 n 1 2 1 / 2 2 s2 n 1 2 / 2 , (3 .8 2) 2 trong đó: s2 là phương sai mẫu; 12 / 2 và / 2 tra từ bảng phân bố 2 với n-1 bậc tự do và mức ý nghĩa 93 - Với phân bố Poisson Thông số . chỉ tiêu điểm ngoặt: E(P)=2 / 3( n- 2)= 2/ 3( 4 5- 2)= 2 /3. 43= 28,67, 90 294516 90 2916 2 xn PPD )( ) ( 7,68, 5441 33 2 687 672 831 21 , , , , )( )( / P PEP Z 1,509. - Với mức ý nghĩa =5%,. đợc) trong cả chuỗi (n- 2) điểm là: )( ) ( 2 3 2 nPE , (3 .2 6) và phơng sai của số điểm ngoặt: 90 2916 2 n PPD )( ) ( (3 .2 7) Đặt: )( )( P PEP Z , (3 .2 8) Độ đo của Z coi nh độ lệch chuẩn;. k kk nnn xPnxPnxPn xP )( )( ) ( )( ' 21 2211 , (3 .2 2) trong đó: )( ' xP là tần suất lí luận chung của toàn bộ chuỗi không đồng nhất; P 1 (x), P 2 (x), ,P k (x) là tần suất của các

Ngày đăng: 10/08/2014, 10:21

Từ khóa liên quan

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan