Tổng hợp lý thuyết về môn thống kê cho KHXH

14 549 1
Tổng hợp lý thuyết về môn thống kê cho KHXH

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

MỘT SỐ KHÁI NIỆM VÀ KÍ HIỆU Khái niệm đám đông – mẫu Đám đông (tổng thể): tập hợp tất phần tử mà ta muốn nghiên cứu Mẫu: tập hợp phần tử lấy từ đám đông để nghiên cứu Kích thước mẫu: số phần tử mẫu, kí hiệu n Dãy thống kê dạng điểm cho dạng tần số: X x1 x2 … xi … xk m m1 m2 … mi … mk k Chú ý: ∑m =n i =1 i Tham số đám đông – Tham số mẫu Định nghĩa 1: Giả sử cần nghiên cứu dấu hiệu X đám đông có: E ( X ) = µ ;D ( X ) = σ ; σ ( X ) = σ Các tham số đám đông: Tham số Tên gọi Kỳ vọng Ý nghĩa Giá trị trung bình X đám đông σ2 Phương sai Bình phương độ phân tán đám đông Độ lệch tiêu chuẩn Độ phân tán đám đông µ σ Các tham số mẫu: Tham số X S2 S$ Tên gọi Trung bình mẫu (Giá trị trung bình X mẫu) Phương sai mẫu Cách tính k X = ∑ mi x i n i=1 k X = ∑ mi x i2 S2 = X − X n i=1 với ( ) Phương sai mẫu điều chỉnh n S$ = S n −1 S Độ lệch tiêu chuẩn mẫu S$ Độ lệch tiêu chuẩn mẫu điều chỉnh S = S2 S$= S$ 2 Định nghĩa 2: Giả sử đám đông có loại đối tượng phần tử mang đặc tính A phần tử không mang đặc tính A Ta có: + Tham số p tỉ lệ phần tử mang đặc tính A đám đông + Tham số f tỉ lệ phần tử mang đặc tính A mẫu f= m n với m số phần tử mang đặc tính A mẫu BÀI TOÁN ƯỚC LƯỢNG Phân biệt toán ước lượng điểm toán ước lượng khoảng: + Không có độ tin cậy: toán ước lượng điểm + Có độ tin cậy: toán ước lượng khoảng I Bài toán ước lượng điểm + Ước lượng giá trị trung bình (ước lượng kỳ vọng µ ): Tính X kết luận + Ước lượng tỉ lệ (ước lượng xác suất p): Tính f kết luận $ + Ước lượng bình phương độ phân tán (ước lượng p/sai σ ): Tính S kết luận II Bài toán ước lượng khoảng Các bước làm: + Xác định toán: ước lượng kỳ vọng hay ước lượng xác suất? Nếu ước lượng kỳ vọng rơi vào trường hợp nào? + Viết biểu thức xác định khoảng tin cậy công thức tính ε α α u ÷ t n −1  ÷ γ 2 + Biết độ tin cậy , ta tính α = − γ suy   hay $2 ;S;f $ X;S ;S;S + Tính tham số mẫu (nếu cần tham số tính tham số đó): tính ε + Tìm khoảng tin cậy kết luận Ước lượng giá trị trung bình (ước lượng kỳ vọng Khoảng tin cậy đối xứng Trường hợp σ µ ( X − ε;X + ε ) với ε tính sau: Công thức tính biết, X có phân phối chuẩn ε= mẫu lớn σ µ ): α σ u  ÷  2 n S  α  S$ ε = t n −1  ÷  2 n   n − chưa biết, X có phân phối α ε = t n −  ÷ chuẩn σ S  α  S$ ε = u  ÷  2 n   n − chưa biết, X phân α ε = u  ÷ phối chuẩn mẫu lớn 2 Ước lượng tỉ lệ (ước lượng xác suất p):  α  f (1− f ) ε = u  ÷ ( f − ε ;f + ε ) với   n Khoảng tin cậy đối xứng p BÀI TOÁN KIỂM ĐỊNH Phân biệt với toán ước lượng: + Bài toán ước lượng: có từ ước lượng, có từ độ tin cậy + Bài toán kiểm định: có từ kiểm định, có từ mức ý nghĩa Các bước làm: + Xác định toán: giả thuyết H, đối thuyết K, mức ý nghĩa α + Nêu điều kiện (nếu có) để đưa thống kê + Xác định miền bác bỏ H (miền W) + Tính giá trị quan sát thống kê Kiểm tra xem giá trị quan sát thống kê có thuộc miền W hay không: • Nếu thuộc ta bác bỏ H, chấp nhận K • Nếu không thuộc chưa bác bỏ H nên tạm thời chấp nhận H, bác bỏ K Hai vấn đề toán kiểm định: + Xác định thống kê sử dụng + Xác định miền W I Kiểm định giả thuyết giá trị trung bình (Kiểm định kỳ vọng) H : µ = µ0  K : µ > µ0 BT1:  Trường hợp H : µ = µ  K : µ < µ0 BT2:  Sử dụng thống kê H : µ = µ0  K :µ ≠ µ0 BT3:  Miền W BT1: W = { G : G ≥ u ( α ) } σ biết, X có phân phối chuẩn mẫu lớn X−µ ) ( G= σ   α  BT3: W =  G : G ≥ u  ÷    (X−µ ) T= σ chưa biết, X có phân phối chuẩn σ BT2 : W = { G : G ≤ − u ( α ) } n ( n −1 BT2: W = { T :T ≤ − t n −1 ( α ) } S X − µ0 T= S$ ) BT1: W = { T : T ≥ t n −1 ( α ) } n   α  BT3: W =  T : T ≥ t n −1  ÷    BT1: W = { G : G ≥ u ( α ) } chưa biết, X phân phối chuẩn mẫu lớn G= (X−µ ) n −1 BT2 : W = { G : G ≤ − u ( α ) } n   α  BT3: W =  G : G ≥ u  ÷    S (X−µ ) G= S$ II Kiểm định giả thuyết tỉ lệ (Kiểm định xác suất) Gọi p tỉ lệ phần tử mang đặc tính A tổng thể  H : p = p0  K : p > p0 BT1:   H : p = p0  K : p < p0 BT2:  Sử dụng thống kê Trường hợp  H : p = p0  K : p ≠ p0 BT3:  Miền W BT1: W = { G : G ≥ u ( α ) } G= Mẫu lớn BT2 : W = { G : G ≤ − u ( α ) } ( f − p0 ) n p0 ( − p0 )   α  BT3: W =  G : G ≥ u  ÷    III So sánh hai tỉ lệ (So sánh hai xác suất) Giả sử ta cần so sánh tỉ lệ phần tử mang đặc tính A đám đông Gọi p1;p tỉ lệ phần tử mang đặc tính A đám đông Ta có toán so sánh: H : p1 = p  K : p1 > p BT1:  Trường hợp Hai mẫu lớn H : p1 = p  K : p1 < p BT2:  Sử dụng thống kê G=  H : p1 = p  K : p1 ≠ p BT3:  Miền W f1 − f 1 1 f ( 1− f )  + ÷  n1 n  Ở đó: BT1: W = { G : G ≥ u ( α ) } BT2 : W = { G : G ≤ − u ( α ) }   α  BT3: W =  G : G ≥ u  ÷    n1 kích thước mẫu thứ nhất, n kích thước mẫu thứ hai f1 = m1 n1 tỉ lệ phần tử mang đặc tính A mẫu thứ f2 = m2 n tỉ lệ phần tử mang đặc tính A mẫu thứ hai f= m1 + m n1 + n tỉ lệ phần tử mang đặc tính A chung hai mẫu IV So sánh hai giá trị trung bình (So sánh kỳ vọng) Giả sử cần so sánh giá trị trung bình dấu hiệu nghiên cứu hai đám đông khác Gọi X dấu hiệu cần nghiên cứu đám đông thứ nhất, Y dấu hiệu cần nghiên cứu đám đông thứ hai E ( X ) = µ 1;E ( Y ) = µ Kí hiệu D ( X ) = σ 12 ;D ( Y ) = σ 22 Ta có toán so sánh:  H : µ1 = µ  K : µ1 > µ BT1:  Trường hợp σ ;σ 2  H : µ1 = µ  K : µ1 < µ BT2:  Sử dụng thống kê biết, X G = Y có phân phối chuẩn hai mẫu lớn σ 12 = σ 22 chưa biết, X Y có phân phối chuẩn  H : µ1 = µ  K : µ1 ≠ µ BT3:  Miền W BT1: W = { G : G ≥ u ( α ) } X−Y BT2 : W = { G : G ≤ − u ( α ) } σ12 σ 22 + n1 n X − Y) ( T=   α  BT3: W =  G : G ≥ u  ÷    n1n ( n1 + n − ) ( n1 + n ) ( n S X +nS 2 Y ) { BT2 : W = { T : T ≤ − t BT1: W = T :T ≥ t n1 +n2 −2 ( α ) n1 + n − ( α )}   α  BT3: W =  T : T ≥ t n1 + n −  ÷    BT1: W = { G : G ≥ u ( α ) } } BT2 : W = { G : G ≤ − u ( α ) } X−Y G= X Y S S + n1 − n − σ 12 ; σ 22 chưa biết, X Y phân phối chuẩn G = hai mẫu lớn   α  BT3: W =  G : G ≥ u  ÷    X−Y 2 S$X S$Y + n1 n σ 12 ; σ 22 Trường hợp chưa biết, X Y phân phối chuẩn hai mẫu bé ta giải toán so sánh kỳ vọng (bài toán 3) tiêu chuẩn hạng Mann – Whitney tiêu chuẩn hạng Wilcoxon: + Nếu số liệu cho theo cặp sử dụng tiêu chuẩn Wilcoxon + Nếu số liệu không cho theo cặp sử dụng tiêu chuẩn Mann – Whitney Lưu ý: Hai tiêu chuẩn giải toán Các bước làm tiêu chuẩn Wilcoxon: + Tính di ; di đếm số giá trị + Sắp xếp + Tính + Đặt rank ( di ) T = T+ G= + Đặt + Tính di ≠ G qs với theo thứ tự từ bé đến lớn d i > tính E( T) = T − E( T) D( T) d i ≠ Gọi số giá trị d i ≠ n + n + ( n + + 1) T + = ∑ rank ( di ) d i >0 ;D ( T ) = n + ( n + + 1) ( 2n + + 1) 24   α  W =  G : G ≥ u  ÷    miền bác bỏ H kết luận Các bước làm tiêu chuẩn Mann – Whitney: + Gộp chung dãy số liệu mẫu xếp theo thứ tự từ bé đến lớn + Tính hạng phần tử mẫu 1, tức tính rank ( x i ) ,i = 1;n1 n1 + Tính + Tính + Đặt R1 = ∑ rank ( x i ) i =1 U1 = n1n + U = U1 G= G qs E( U) = U − E( U) D( U) + Đặt + Tính n1 ( n1 + 1) − R1 n n ( n + n + 1) n1n ;D ( U ) = 2 12   α  W =  G : G ≥ u  ÷    miền bác bỏ H kết luận V Kiểm định phù hợp số liệu mẫu Bài toán: Gọi đám đông ( p1,p , ,p k tỉ lệ phần tử mang đặc tính A1;A ; ;A k p1 + p2 + + p k = ) Từ đám đông, ta lấy mẫu có kích thước n Ta có toán kiểm định: Giả thuyết H: Số liệu mẫu phù hợp với k tỉ lệ cho Đối thuyết K: Số liệu mẫu không phù hợp với k tỉ lệ cho k Giải quyết: Ta sử dụng thống kê: Ở đó: m1;m ; ;m k Miền bác H: χ2 = ∑ ( mi − npi ) npi i =1 số phần tử mang đặc tính A1;A ; ;A k W = { χ : χ ≥ χ k2 −1 ( α ) } Chú ý: Điều kiện mi ≥ 5;i = 1;k VI Kiểm định tính độc lập hai dấu hiệu Bài toán: Giả sử ta có hai dấu hiệu X Y Ta có toán kiểm định: mẫu Giả thuyết H: X Y độc lập nhau; Đối thuyết K: X Y phụ thuộc Giải quyết: Thành lập bảng số liệu: B1 B2 … Bs Tổng hàng A1 m11 m12 … m1s hg1 A2 m 21 m 22 … m 2s hg2 … … … … … … Ar m r1 m r2 … m rs hgr cot1 cot2 … cots n X Y Tổng cột  r s m 2ij  χ = n ∑ ∑ − 1 hg cot i = j = i j   Ta sử dụng thống kê: Miền bác H: { W = χ : χ ≥ χ (2r −1)( s−1) ( α ) } VII So sánh nhiều tỉ lệ (So sánh nhiều xác suất) Bài toán: Gọi tỉ lệ phần tử mang đặc tính A s đám đông Ta có toán kiểm định: Giả thuyết H : p1 = p2 = = ps Đối thuyết K: Các tỉ lệ p1;p2 ; ;ps không đồng thời Giải quyết: Thành lập bảng số liệu: B1 B2 … Bs Tổng A1 m11 m12 … m1s hg1 A2 m 21 m 22 … m 2s hg2 Tổng cot1 cot2 … cots n X Y 10 Ở đó, m1j số phần tử mang đặc tính A mẫu lấy từ đám đông thứ j số phần tử không mang đặc tính A mẫu lấy từ đám đông thứ j,  s m 2ij  χ = n ∑ ∑ − 1  i=1 j=1 hg i cot j  Ta sử dụng thống kê: Miền bác H: W = { χ : χ ≥ χ s2−1 ( α ) } 11 j = 1;s m 2j TƯƠNG QUAN VÀ HỒI QUY I Tương quan Hệ số tương quan • Ta có đánh giá mức độ phụ thuộc tuyến tính X Y dựa vào Rất yếu Yếu Trung bình 0,5 Chặt ρ sau: Rất chặt 0,7 • Khi ρ = ta nói X Y không tương quan với • Nếu ρ > X, Y đồng biến ρ < X, Y nghịch biến Hệ số tương quan mẫu Hệ số tương quan mẫu biến ngẫu nhiên X, Y là: r ( X,Y ) = XY − X.Y SX SY Với bảng số liệu: y1 y2 … ys Tổng hàng x1 m11 m12 … m1s hg1 x2 m 21 m 22 … m 2s hg2 … … … … … … xr m r1 m r2 … m rs hgr cot1 cot2 … cots n X Y Tổng cột Ta có:  1 r s XY =  ∑∑ mij x i y j ÷ n  i=1 j=1  12 Ta có dãy thống kê X: X x1 x2 … xr m hg1 hg2 … hgr X;SX Ta tính Ta có dãy thống kê Y: Y y1 y2 … ys m cot1 cot2 … cots Ta tính Y;SY Với bảng số liệu: ( X,Y ) ( x1;y1 ) ( x ;y2 ) … ( x k ;yk ) m m1 m2 … mk X x1 x2 … xk Y y1 y2 … yk m m1 m2 … mk Hoặc: k k XY = ∑ mi x i yi n = ∑ mi n i =1 i =1 Ta có: với Ta lập dãy thống kê X Y tính X;SX ; Y;SY II Hồi quy Đường hồi quy bình phương trung bình tuyến tính thực nghiệm Y − Y = r ( SY X−X SX Sai số bình phương trung bình thực nghiệm: 13 ) S2Y/X = SY2 ( − r ) Điều kiện áp dụng tốt: r ≥ 0,7 14 [...]... nhiên X, Y là: r ( X,Y ) = XY − X.Y SX SY Với bảng số liệu: y1 y2 … ys Tổng hàng x1 m11 m12 … m1s hg1 x2 m 21 m 22 … m 2s hg2 … … … … … … xr m r1 m r2 … m rs hgr cot1 cot2 … cots n X Y Tổng cột Ta có:  1 r s XY =  ∑∑ mij x i y j ÷ n  i=1 j=1  12 Ta có dãy thống kê của X: X x1 x2 … xr m hg1 hg2 … hgr X;SX Ta tính được Ta có dãy thống kê của Y: Y y1 y2 … ys m cot1 cot2 … cots Ta tính được Y;SY Với bảng... là số phần tử mang đặc tính A ở mẫu lấy ra từ đám đông thứ j còn số phần tử không mang đặc tính A ở mẫu lấy ra từ đám đông thứ j,  2 s m 2ij  χ = n ∑ ∑ − 1  i=1 j=1 hg i cot j  Ta sử dụng thống kê: 2 Miền bác H: W = { χ 2 : χ 2 ≥ χ s2−1 ( α ) } 11 j = 1;s m 2j là TƯƠNG QUAN VÀ HỒI QUY I Tương quan 1 Hệ số tương quan • Ta có đánh giá mức độ phụ thuộc tuyến tính giữa X và Y dựa vào Rất yếu Yếu... được Y;SY Với bảng số liệu: ( X,Y ) ( x1;y1 ) ( x 2 ;y2 ) … ( x k ;yk ) m m1 m2 … mk X x1 x2 … xk Y y1 y2 … yk m m1 m2 … mk Hoặc: k 1 k XY = ∑ mi x i yi n = ∑ mi n i =1 i =1 Ta có: với Ta cũng lập dãy thống kê của X và Y rồi tính X;SX ; Y;SY II Hồi quy Đường hồi quy bình phương trung bình tuyến tính thực nghiệm Y − Y = r ( SY X−X SX Sai số bình phương trung bình thực nghiệm: 13 ) S2Y/X = SY2 ( 1 − r

Ngày đăng: 23/11/2016, 09:52

Tài liệu cùng người dùng

Tài liệu liên quan