CHƯƠNG 9: Tương quan và hồi quy tuyến tính đơn.doc

23 12.1K 46
CHƯƠNG 9: Tương quan và hồi quy tuyến tính đơn.doc

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Tương quan và hồi quy tuyến tính đơn

CHƯƠNG 9. Tương quan hồi quy tuyến tính đơn9.1. Tương quan tuyến tính đơn9.2. Hồi quy tuyến tính đơn9.3. Một số mô hình phi tuyến có thể tuyến tính hoáBài 9.1. Tương quan tuyến tính đơn 1. Hệ số tương quan mẫu:Giả sử X Y là 2 BNN. Trong nhều trường hợp X Y phụ thuộc lẫn nhau, ví dụ, GS X là chiều dài của bàn chân của 1 người Y là chiều cao của người đó.Để đo mức độ phụ thuộc tuyến tính giữa 2 BNN X Y, người ta đưa ra khái niệm hệ số tương quan ρ:[ ]YXYXYXEσσµµρ))((−−=Người ta đã chứng minh được 11≤≤−ρ.Khi ρ=0 thì không có sự tương quan tuyến tính giữa X Y. Đặc biệt khi (X, Y) có phân phối chuẩn đồng thời thì ρ=0 khi chỉ khi X, Y độc lập. Ngược lại, khi |ρ| càng gần 1 thì sự phụ thuộc tuyến tính giữa X Y càng mạnh.Nếu |ρ|=1 thì Y là một hàm tuyến tính của X.Muốn biết ρ chúng ta phải biết phân bố của tập chính bao gồm tất cả các giá trị của cặp (X, Y). Tuy nhiên, điều này là không thực tế.Vì vậy, chúng ta có bài toán ước lượng kiểm định hệ số tương quan ρ dựa vào mẫu ngẫu nhiên: (x1, y1), (x2, y2), …, (xn, yn) các giá trị của (X, Y). 1 Để ước lượng hệ số tương quan ρ, chúng ta sử dụng hệ số tương quan mẫu:∑ ∑∑== ==−−−−niniiiniiiyyxxyyxxr1 1221)()())((Chúng ta thường áp dụng công thức tính toán sau cho thuận lợi:2222)()())(()(∑∑∑ ∑∑∑∑=−−−yynxxnyxxynrChú ý: 11≤≤−rVí dụ 1. Tính hệ số tương quan mẫu r dựa trên mẫu gồm 10 quan sát sau:i 1 2 3 4 5 6 7 8 9 10xi80 85 88 90 95 92 82 75 78 85yi2.4 2.8 3.3 3.1 3.7 3 2.5 2.3 2.8 3.1GiảiCách 1. Tính trực tiếp Đầu tiên tính các tổng ∑ ∑∑∑∑22,,,, yxxyyxVà thay vào công thức tính r: 858983.0=rCách 2 : Dựa vào Excel2 GS 10 giá trị của xi được xếp vào các ô từ A1 đến J1, 10 giá trị của yi được xếp vào các ô từ A2 đến J2. Khi đó, chỉ cần viết =CORREL(A1:J1,A2:J2), kết quả nhận được là 0.858983Tiếp theo chúng ta đề cập đến bài toán kiểm định giả thiết về hệ số tương quan lý thuyết ρ.Bài toán đầu tiên quan trọng nhất là kiểm định xem X Y có tương quan với nhau hay không.2. Bài toán kiểm định giả thiết:- Giả thiết H0: ρ=0- Đối thiết H1: ρ≠0Tiêu chuẩn kiểm định được xây dựng dựa trên định lý sau:Định lý: Nếu (X, Y) có phân bố chuẩn 2 chiều thì dưới giả thiết H0, BNN 212rnrT−−=Có phân bố Student với n-2 bậc tự do.Với mức ý nghĩa α, ta sẽ bác bỏ H0 nếu |T|>tn-2(α/2).Ví dụ: Trong một mẫu gồm 42 quan sát (xi, yi) rút ra từ tập hợp chính các giá trị của (X, Y), chúng ta tính được hệ số tương quan mẫu là r=0.22. Giả sử cặp BNN (X, Y) có phân phối chuẩn đồng thời. Với mức ý nghĩa α=5%, có thể kết luận rằng X Y có tương quan hay không?GiảiTa có 3 43.1154.022.022.014022.01222====−−−rnrTVới bậc tự do 40, α=5% ta tra bảng =TINV(0.05,40)=2.021075So sánh, ta thấy |T|<2.021075, vì vậy chưa đủ cơ sở bác bỏ giả thiết H0.=>chấp nhận Ho3. Với bài toán kiểm định giả thiết:- Giả thiết H0: ρ=ρ0- Đối thiết H1: ρ≠ρ0ở đây ρ0 là một giá trị khác 0 cho trước. Chúng ta sẽ xây dựng tiêu chuẩn thống kêσmuT−=Trong đó: 3111211121;ln;ln00−−+−+===nrrmuσρρNgười ta chứng minh được rằng nếu H0 đúng, thì T có phân bố xấp xỉ phân bố chuẩn tắc N(0,1). Do đó, H0 sẽ bị bác bỏ ở mức ý nghĩa α nếu |T|>uα/2.Ví dụ: Từ mẫu cỡ n=35 rút ra từ tập chính các giá trị của (X, Y), ta tính được hệ số tương quan là mẫu là r=0.8. Với mức ý nghĩa α=5%, kiểm định giả thiết:- Giả thiết H0: ρ= 0.9- Đối thiết H1: ρ≠ 0.9GiảiTa có 4 177.0;472.1lnln;009.1lnln321319.019.012111218.018.0121112100=========−−+−+−+−+nrrmuσρρTừ đó 11.2177.0472.1099.1−===−−σmuTVới α=5%, ta tìm được uα/2= 1.96.Vì |T|=2.11> uα/2= 1.96, nên ta bác bỏ giả thiết H0, chấp nhận đối thiết H1, nghĩa là chấp nhận kết luận ρ≠0.9.Tiêu chuẩn thống kê σmuT−= cũng cho phép ta xác định được khoảng tin cậy cho hệ số tương quan lý thuyết ρ.Ví dụ: Trong một mẫu có cỡ n=52 được rút ra từ tập hợp chính các giá trị của (X, Y), ta tính được hệ số tương quan mẫu là r=0.53. Căn cứ trên kết quả đó hãy xác định khoảng tin cậy 95% cho hệ số tương quan lý thuyết ρ giữa X Y.GiảiTa có 143.0;59.0lnln714913153.0153.01211121=======−−+−+nrruσ5 Với α=5%, tra bảng ta có uα/2=1.96. Với xác suất 95% ta có:σσαα2/2/umuu<−<−σσαα2/2/uumuu+<<−⇔Thay giá trị của σα,,2/uuvào ta được 87.031.0<<mHay 87.0ln31.01121<<−+ρρ 74.1ln62.011<<⇔−+ρρ 74.11162.0ee<<⇔−+ρρ 7.5858.111<<⇔−+ρρGiải bất đẳng thức trên ta tìm được: 7.03.0<<ρĐây là khoảng tin cậy 95% cho ρ.4. Kiểm tra tính độc lậpGiả sử ta có mẫu ngẫu nhiên cỡ n các quan sát đồng thời về hai biến ngẫu nhiên X Y: (x1, y1), (x2,y2), …, (xn, yn). 6 Giả thiết H0: X Y độc lập với nhauĐối thiết H1: X Y không độc lập.- Ta ghép các giá trị mẫu (x1, x2, …, xn) thành các khoảng, chẳng hạn r khoảng. Ghép các giá trị mẫu (y1, y2, …, yn) thành s khoảng. Khi đó ta nhận được bảng hai lối vào gồm rs ô chữ nhật con. Gọi (i, j) là ô ở hàng i cột j.- Đếm số các quan sát từ mẫu đã cho rơi vào ô (i, j). Ký hiệu số đó làsjrinij,1,,1,==.Nói cách khác ijnlà số các giá trị mẫu mà có giá trị mẫu theo X rơi vào khoảng thứ i có giá trị mẫu theo Y rơi vào khoang thứ j.Cần lưu ý rằng, các khoảng theo X các khoảng theo Y không nhất thiết được phân chia theo định lượng, mà có thể theo định tính, chẳng hạn tốt, trung bình, xấu hoặc giỏi, khá, trung bình, kém hoặc màu xanh, đỏ, trắng, vàng, .- Tính ∑==sjijinn1.(lấy tổng theo hàng) ∑==riijjnn1.(lấy tổng theo cột) ∑∑= ==risjijnn1 1- Đối với mỗi ô (i, j) ở trong bảng, ta tính .nxnnji Để tiện tính toán, ta đặt số này trong ô (i, j) cạnh số ijn, nhưng ta đặt trong ngoặc.7 - Tính −==∑∑∑∑= == =−risjnnnrisjnjiijnjninnjninijn1 11 1)(21 2 2 χ- Với α đã cho, tra bảng phân phối khi-bình phương ( )2χ với (r-1)(s-1) bậc tự do ta tìm được ).(2)1)(1(αχ−− sr- Nếu )(2)1)(1(2αχχ−−≥sr ta bác bỏ tính độc lập của X Y. (Thực chất tiêu chuẩn này là ứng dụng tiêu chuẩn phù hợp 2χ).Trong thực hành ta hay sử dụng công thức : −=∑∑= =risjnnnjiijn1 121 2χKhi r=s=2 thì : .2.12.1.22211211 21 121nnnnnnnnnrisjnnnjiijn=−=∑∑= =χVí dụ : Ở các cây ngọc trâm lá có hai dạng, « lá phẳng » hoặc « lá nhăn », hoa có hai dạng, « hoa bình thường » hoặc « hoa hoàng hậu ». Quan sát một mẫu gồm 560 cây ngọc trâm ta thu được kết quả sau : HoaLáBình thường Hoàng hậu Tổng sốPhẳng 328 122 450Nhăn 77 33 110Tổng số 405 155 5608 Có thể chấp nhận giả thiết hai đặc tính về hoa lá nói trên là độc lập hay không ? Hay giữa chúng có sự tương quan ?GiảiTa có 368.0)155).(405).(110).(450(33771223285602.2.12.1.22211211===nnnnnnnnnχVới mức ý nghĩa 5%, tra bảng phân phối 2χvới 1 bậc tự do ta được 841.3)05.0(21=χ. Do 2χ<841.3)05.0(21=χ, nên ta chấp nhận giả thiết H0, chấp nhận giả thiết hai đặc tính về hoa lá nói trên là độc lập.Ví dụ : Giả sử X Y tương ứng là số đo huyết áp trọng lượng (tính bằng pound) (1pound=0.454 kg) của trẻ em 14 tuổi. Để thuận tiện, số đo huyết áp X được chia thành các mức :B1={X≤99 }B2={99<X≤110 }B3={110<X≤120 }B4={X>120 }Và Y chia làm 2 mức :A1={Y≤102 }A2={Y>102 }Dựa vào mẫu ngẫu nhiên gồm 200 trẻ em được đo huyết áp trọng lượng cho thấy số liệu sau : Huyết áp B1B2B3B4Tổng 9 Trọng lượng sốA110 20 11 5 46A26 48 50 50 154Tổng số 16 68 61 55 200Hãy kiểm định giả thiết về sự độc lập giữa trọng lượng huyết áp của trẻ em.GiảiTa có :[ ]53.221 .200)154).(55(50)46).(68(20)46).(16(102222=−+++=χVới mức ý nghĩa α=1%, tra bảng phân phối 2χvới bậc tự do là (2-1).(4-1)=3, ta tìm được 345.11)01.0(23=χ.Vì 345.11)01.0(232=>χχ nên ta bác bỏ H0 kết luận : Giữa huyết áp trọng lượng trẻ 14 tuổi có sự phụ thuộc lẫn nhau.Bài 9.2. Hồi quy tuyến tính đơnGiả sử Y là đại lượng ngẫu nhiên phụ thuộc vào X (có thể là biến ngẫu nhiên hay không ngẫu nhiên). Nếu X=x 10 [...]... (X, Y), ta tính được hệ số tương quan là mẫu là r=0.8. Với mức ý nghĩa α=5%, kiểm định giả thiết: - Giả thiết H 0 : ρ = 0.9 - Đối thiết H 1 : ρ≠ 0.9 Giải Ta có 4 CHƯƠNG 9. Tương quan hồi quy tuyến tính đơn 9.1. Tương quan tuyến tính đơn 9.2. Hồi quy tuyến tính đơn 9.3. Một số mơ hình phi tuyến có thể tuyến tính hố Bài 9.1. Tương quan tuyến tính đơn 1. Hệ số tương quan mẫu: Giả sử X Y là... là 2 BNN. Trong nhều trường hợp X và Y phụ thuộc lẫn nhau, ví dụ, GS X là chiều dài của bàn chân của 1 người Y là chiều cao của người đó. Để đo mức độ phụ thuộc tuyến tính giữa 2 BNN X Y, người ta đưa ra khái niệm hệ số tương quan ρ: [ ] YX YX YXE σσ µµ ρ ))(( −− = Người ta đã chứng minh được 11 ≤≤− ρ . Khi ρ=0 thì khơng có sự tương quan tuyến tính giữa X Y. Đặc biệt khi (X, Y) có phân... thời thì ρ=0 khi chỉ khi X, Y độc lập. Ngược lại, khi |ρ| càng gần 1 thì sự phụ thuộc tuyến tính giữa X Y càng mạnh. Nếu |ρ|=1 thì Y là một hàm tuyến tính của X. Muốn biết ρ chúng ta phải biết phân bố của tập chính bao gồm tất cả các giá trị của cặp (X, Y). Tuy nhiên, điều này là khơng thực tế. Vì vậy, chúng ta có bài toán ước lượng kiểm định hệ số tương quan ρ dựa vào mẫu ngẫu nhiên:... hình ảnh về sự phụ thuộc phi tuyến của Y đối với X. Nếu hiệu số đó bằng 0 thì điều đó có nghĩa là chỉ có tương quan tuyến tính giữa Y X. Để giải BT kiểm định giả thiết : - Giả thiết H 0 : 0 22 =− ρη (Khơng có tương quan phi tuyến) - Đối thiết H 1 : 0 22 >− ρη (Có tương quan phi tuyến) Ta dùng tiêu chuẩn thống kê sau : 22 ... |T|>t n-2 (α/2). Ví dụ: Trong một mẫu gồm 42 quan sát (x i , y i ) rút ra từ tập hợp chính các giá trị của (X, Y), chúng ta tính được hệ số tương quan mẫu là r=0.22. Giả sử cặp BNN (X, Y) có phân phối chuẩn đồng thời. Với mức ý nghĩa α=5%, có thể kết luận rằng X Y có tương quan hay khơng? Giải Ta có 3 Giả thiết H 0 : X Y độc lập với nhau Đối thiết H 1 : X Y không độc lập. - Ta ghép các giá... liệu có tương quan phi tuyến của Y đối với X hay khơng ? Giải Ta có 63.3. )24( )424( 5378.01 )37.05378.0( == − − − − T Tra bảng phân phối Fisher với α=5% phân vị (2 ; 20) bậc tự do, ta được : 3.49. Vì F>3.49, nên ta bác bỏ H 0 . Vậy ta khẳng định, có mối tương quan phi tuyến của Y đối với X. Xác suất sai của khẳng định này là 5%. 23 Đại lượng sau được dùng để ước lượng cho tỷ số tương quan. .. nhưng ta đặt trong ngoặc. 7 Hãy tính hệ số tương quan, hệ số xác định tỷ số tương quan mẫu của Y đối với X. Giải Trước hết, ta cần trình bày các số liệu trên dưới dạng bảng tương quan sau đây : X Y 8 12 20 24 82 78 87 58 70 65 65 50 62 55 52 49 60 47 44 66 41 57 52 41 57 50 47 63 n i 6 6 6 6 n=24 T i 440 333 315 310 T=1398 + Tính hệ số tương quan : Ta có : ∑ =+++= 384)24(6)20(6)12(6)8(6x ∑ == 1398Ty ∑ =+++= 7104)24(6)20(6)12(6)8(6 22222 x ∑ =+++= 8490863... chấp nhận giả thiết hai đặc tính về hoa lá nói trên là độc lập. Ví dụ : Giả sử X Y tương ứng là số đo huyết áp trọng lượng (tính bằng pound) (1pound=0.454 kg) của trẻ em 14 tuổi. Để thuận tiện, số đo huyết áp X được chia thành các mức : B 1 ={X≤99 } B 2 ={99<X≤110 } B 3 ={110<X≤120 } B 4 ={X>120 } Và Y chia làm 2 mức : A 1 ={Y≤102 } A 2 ={Y>102 } Dựa vào mẫu ngẫu nhiên gồm 200... của x i được xếp vào các ô từ A1 đến J1, 10 giá trị của y i được xếp vào các ô từ A2 đến J2. Khi đó, chỉ cần viết =CORREL(A1:J1,A2:J2), kết quả nhận được là 0.858983 Tiếp theo chúng ta đề cập đến bài toán kiểm định giả thiết về hệ số tương quan lý thuyết ρ. Bài toán đầu tiên quan trọng nhất là kiểm định xem X và Y có tương quan với nhau hay khơng. 2. Bài tốn kiểm định giả thiết: - Giả thiết... 37.06089.0 22 == r . Tính tỷ số tương quan : Ta có : 5.347484908 24 1398 2 2 2 =−=−= ∑∑ n T ji ySST 83.1868 24 1398 36 310 440 1 222 2 2 =−=−= ++ = ∑ n T k i n T i i SSF Từ đó : 5378.0 5.3474 83.1868 2 / === ∧ SST SSF XY η Hiệu số 22 ρη − giữa tỷ số tương quan lý thuyết hệ số xác định lý thuyết cho ta hình ảnh về sự phụ thuộc phi tuyến của Y đối với X. Nếu hiệu số đó bằng 0 thì điều đó có nghĩa là chỉ có tương . CHƯƠNG 9. Tương quan và hồi quy tuyến tính đơn9 .1. Tương quan tuyến tính đơn9 .2. Hồi quy tuyến tính đơn9 .3. Một số mô hình phi tuyến có thể tuyến tính. thể tuyến tính hoáBài 9.1. Tương quan tuyến tính đơn 1. Hệ số tương quan mẫu:Giả sử X và Y là 2 BNN. Trong nhều trường hợp X và Y phụ thuộc lẫn nhau, ví

Ngày đăng: 12/09/2012, 22:36

Hình ảnh liên quan

Với α=5%, tra bảng ta có uα/2=1.96. Với xác suất 95% ta có: - CHƯƠNG 9: Tương quan và hồi quy tuyến tính đơn.doc

i.

α=5%, tra bảng ta có uα/2=1.96. Với xác suất 95% ta có: Xem tại trang 6 của tài liệu.
- Với α đã cho, tra bảng phân phối khi-bình phương - CHƯƠNG 9: Tương quan và hồi quy tuyến tính đơn.doc

i.

α đã cho, tra bảng phân phối khi-bình phương Xem tại trang 8 của tài liệu.
Với mức ý nghĩa α=1%, tra bảng phân phối χ2 với bậc tự do là (2-1).(4-1)=3, ta tìm được 2(0.01)11.345 - CHƯƠNG 9: Tương quan và hồi quy tuyến tính đơn.doc

i.

mức ý nghĩa α=1%, tra bảng phân phối χ2 với bậc tự do là (2-1).(4-1)=3, ta tìm được 2(0.01)11.345 Xem tại trang 10 của tài liệu.
(xi). Ta sẽ trình bày dãy số liệu (xi, yi) thành bảng sau đây, gọi là bảng tương quan : - CHƯƠNG 9: Tương quan và hồi quy tuyến tính đơn.doc

xi.

. Ta sẽ trình bày dãy số liệu (xi, yi) thành bảng sau đây, gọi là bảng tương quan : Xem tại trang 19 của tài liệu.
Tra bảng phân phối Fisher với α=5% phân vị và (2 ; 20) bậc tự do, ta được : 3.49. - CHƯƠNG 9: Tương quan và hồi quy tuyến tính đơn.doc

ra.

bảng phân phối Fisher với α=5% phân vị và (2 ; 20) bậc tự do, ta được : 3.49 Xem tại trang 23 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan