Khai thác phần mềm winstat để xử lý số liệu bằng phương pháp phân tích hồi quy

62 677 0
Khai thác phần mềm winstat để xử lý số liệu bằng phương pháp phân tích hồi quy

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

bộ giáo dục và đào tạo Trờng đại học vinh phùng duy ngọc Khai thác phần mềm Winstat để xử số liệu bằng phơng pháp phân tích hồi quy chuyên ngành: xác suất thống kê toán học chuyên ngành: xác suất thống kê toán học Mã số: 60.46.15 Mã số: 60.46.15 tóm tắt tóm tắt luận văn thạc sĩ toán học luận văn thạc sĩ toán học Vinh - 2009 2 MỞ ĐẦU Trong thời đại ngày nay, công nghệ thông tin đang trở thành nhân tố quan trọng cho sự phát triển kinh tế - xã hội. Việc khai thác và ứng dụng các phần mềm để phân tíchxử số liệu thống kê là rất bổ ích và thiết thực. Winstat là một trong những phần mềm đó. Nó là phần mềm bổ trợ cho Excel để phân tíchxử các số liệu thống kê. Phương pháp phân tích hồi quyphương pháp để xác định mức độ phụ thuộc của một lượng theo một hay nhiều đại lượng khác. Việc sử dụng phương pháp phân tích hồi quy và tương quan cho ta thấy được mối liên hệ giữa các yếu tố, thuộc tính của số liệu. Trên cơ sở đó, cùng với sự chỉ bảo và định hướng của TS. Nguyễn Trung Hoà, tác giả đã lựa chọn đề tài “Khai thác phần mềm Winstat để xử số liệu bằng phương pháp phân tích hồi quy” để nghiên cứu. Nội dung của luận văn bao gồm ba chương: Chương 1. Các kiến thức cơ sở. Chương này tác giả hệ thống những kiến thức cơ bản nhất về xác suất thống kê. Nó là công cụ để nghiên cứu tiếp chương sau. Chương 2. Phân tích hồi quy. Chương này trình bày lí thuyết mô hình phân tích Hồi quy đơn, Hồi quy đa thức, Hồi quy bội và các phương pháp phân tích và kiểm định các giả thiết thống kê. Chương 3. Phân tích hồi quy trong Winstat Chương này giới thiệu phần mềm Winstat, hướng dẫn cài đặt và sử dụng về phần mềm đó. Giới thiệu các gói lệnh phân tích hồi quy của phần mềm Winstat. Sử dụng các gói lệnh đó để phân tích ví dụ trong thực tiễn từ đó để đưa ra một số kết luận thống kê. Luận văn được hoàn thành tại trường Đại học Vinh dưới sự hướng dẫn của TS. Nguyễn Trung Hoà. Tác giả xin được bày tỏ lòng biết ơn chân thành và sâu sắc nhất đến thầy - người đã đặt ra vấn đề và thường xuyên giúp đỡ tác giả trong suốt quá trình học tập và nghiên cứu. 3 Nhân dịp này, tác giả cũng xin chân thành cảm ơn các thầy cô giáo trong khoa Toán, khoa Sau đại học và các bạn học viên lớp cao học 15 - Xác suất thống kê đã thường xuyên giúp đỡ tác giả trong quá trình học tập và hoàn thành luận văn. Mặc dù có nhiều cố gắng, song luận văn không thể tránh được những thiếu sót, tác giả rất mong được những đóng góp quý báu từ các thầy cô giáo và các bạn. Vinh, tháng 12 năm 2009 Tác giả 4 Chương 1 CÁC KIẾN THỨC CƠ SỞ 1.1. Biến ngẫu nhiên và hàm phân phối 1.1.1. Biến ngẫu nhiên Giả sử ( ,Ω F, )P là một không gian xác suất. B là σ - đại số Borel trên đường thẳng thực R. Ánh xạ :X Ω → ¡ được gọi là biến ngẫu nhiên nếu với mọi B∈ B ( ) ( ) { } 1 : : .X B X B F ω ω − = ∈ ∈ Để dễ hình dung, ta hiểu một đại lượng (hay một biến) nhận các giá trị của nó với xác suất tương ứng nào đấy gọi là đại lượng ngẫu nhiên hay biến ngẫu nhiên. Các biến ngẫu nhiên được ký hiệu là , ,X Y Z hoặc 1 2 , , ., m Y Y Y ; 1 2 , , ., n X X X còn các giá trị có thể có của chúng được ký hiệu là ,x y hoặc 1 2 , , ., n x x x ; 1 2 , , ., m y y y . Nếu tập các giá trị mà biến ngẫu nhiên nhận là một tập gồm một số hữu hạn điểm hoặc vô hạn đếm được. Khi đó biến ngẫu nhiên gọi là biến ngẫu nhiên rời rạc. Nếu tập các giá trị mà biến ngẫu nhiên lấp đầy một khoảng nào đó khi đó biến ngẫu nhiên gọi là biến ngẫu nhiên liên tục. 1.1.2. Hàm phân phối Hàm phân phối xác suất của biến ngẫu nhiên X , ký hiệu là ( ) ,F x được xác định như sau ( ) ( ) , .F x P X x x R= < ∈ Tại một điểm x bất kỳ, giá trị của hàm ( ) F x chính là xác suất để biến ngẫu nhiên nhận giá trị nhỏ hơn x (hoặc bên trái x). 1.2. Các loại biến thường gặp trong xử thống kê Trong xử thống kê, khi xem xét một tổng thể nào đó theo các tính chất (thuộc tính của nó), người ta thường xem mỗi thuộc tính có mối liên hệ đến một hoặc 5 nhiều thuộc tính khác. Mỗi thuộc tính đó có thể được xem là một biến. Thông thường các biến được phân loại như sau. 1.2.1. Biến định lượng Thông thường các số đo đều là biến định lượng. Biến định lượng có thể chia thành các loại - Biến nhận các giá trị thực liên tục: Các biến có thể có giá trị là một số thực nào đó nằm trong một đoạn thẳng trên một trục số. Ví dụ: Cân nặng, chiều cao, nồng độ … - Biến nhận giá trị thực rời rạc: Các biến có tập giá trị là tập hữu hạn các số thực. Ví dụ: Mức lương, loại giá vé xe… Biến nhận các giá trị nguyên, như: Tuổi, số người… 1.2.2. Biến định tính Thường biến định tính xác định tính chất nào đó của đối tượng nghiên cứu, giá trị của các biến thường không phải là các số. Ví dụ: Giới tính, lí do vay mượn, quan điểm về một vấn đề…là các biến định tính. Biến định tính được chia làm hai loại. - Biến định tính có thứ tự là biến mà các giá trị của nó có khả năng được sắp xếp theo một thứ tự nào đó, biểu thị mức độ quan trọng khác nhau của các giá trị đó. Ví dụ: Nhà cửa, nguồn nước sử dụng… - Biến định tính không có thứ tự là biến mà các giá trị có thể của nó không được xếp theo thứ tự hơn kém. Ví dụ: Dân tộc, tôn giáo… 1.2.3. Biến độc lập Biến độc lập còn gọi là biến mô tả, xuất hiện trong các công thức biểu diễn của mô hình, hoặc dùng để thể hiện các đặc trưng mang tính nguyên nhân của hiện tượng, hoặc có tác động vào quá trình đang được nghiên cứu. 1.2.3. Biến phụ thuộc Biến phụ thuộc còn gọi là biến được mô tả thể hiện kết quả của hiện tượng, thường nằm ở vế phải của công thức, là đối tượng chính, mục tiêu của công việc nghiên cứu. Chú ý: * Sự phân biệt giữa các loại biến đó cũng có tính tương đối, tuỳ thuộc vào 6 mục đích của vấn đề và ý đồ của người nghiên cứu mà một biến ở chỗ này được xem là biến định lượng mà ở nơi khác có thể được cho là biến định tính. Ví dụ: “Đồ đạc tiện nghi trong gia đình” là biến định tính nếu xét dưới góc độ xem xét chất lượng đời sống sinh hoạt, song lại là một biến định lượng khi muốn xác định tài sản gia đình. Một biến định tính lúc này không được xem là có thứ tự, lúc khác lại được xem là có thứ tự. * Trong mô hình nhiều mức, một biến có thể vừa là biến phụ thuộc, vừa là biến độc lập.Ví dụ: “chi tiêu cho ăn uống hàng ngày” là biến “được mô tả” (biến phụ thuộc) nếu xét trong mối quan hệ với các yếu tố thu nhập và điều kiện sống, song lại là biến “dùng để mô tả” (biến độc lâp) khi muốn biểu diễn ảnh hưởng của nó đến sức khoẻ của các thành viên trong gia đình. * Các loại biến vừa nêu trên có thể là tất định, có thể mang yếu tố ngấu nhiên và trong luận văn này ta giới hạn việc xem xét các loại biến đó là biến ngẫu nhiên hoặc qua một phép biến đổi đơn giản chúng được quy về một biến ngẫu nhiên. 1.3. Mẫu ngẫu nhiên và mẫu quan sát 1.3.1. Khái niệm về mẫumẫu ngẫu nhiên Định nghĩa: Mẫu ngẫu nhiên kích thước n đối với một biến ngẫu nhiên X là tập hợp n biến ngẫu nhiên 1 2 , , ., n X X X độc lập, có cùng phân phối xác suất với ,X kí hiệu là: ( ) 1 2 , , ., n W X X X= . • Biến ngẫu nhiên X được gọi là biến ngẫu nhiên gốc. • Các biến ngẫu nhiên i X được gọi là các bản sao của .X • Phương pháp nghiên cứu không toàn bộ là phương pháp nghiên cứu thông qua mẫu ngẫu nhiên và mẫu quan sát. 1.3.2. Mẫu quan sát Mẫu quan sát ( ) 1 2 , , ., n W x x x= là một thể hiện cụ thể của mẫu ngẫu nhiên hay nó là tập hợp các số liệu quan sát cụ thể về một biến ngẫu nhiên gọi tắt là các số liệu thực nghiệm. 7 Bảng phân phối tần số thực nghiệm: k 1 x 2 x … i x . k x n 1 n 2 n … i n … k n • i x là giá trị phân biệt thứ i của các quan sát • i n là số lượng các quan sát nhận giá trị tương ứng • Bảng trên được gọi là bảng mẫu thu gọn. Bảng phân phối tần số ghép lớp: k 1 y 2 y i y k y n 1 n 2 n … i n … k n Trong đó: • 1i i y y h + − = (không đổi) • i n là số các giá trị quan sát thuộc nửa khoảng ; 2 2 i i h h y y   − +   . 1.4. Thống kê và một số thống kê đặc trưng của mẫu ngẫu nhiên 1.4.1. Thống kê Thống kê là một hàm ( ) 1 2 , , ., n G f X X X= của các biến ngẫu nhiên. Một thống kê cũng là một biến ngẫu nhiên. Giá trị cụ thể của hàm G tương ứng với tập giá trị quan sát ( ) 1 2 , , ., n x x x là số ( ) 1 2 , , ., n Gqs f x x x= nó là một thể hiện của thống kê G , thu được từ mẫu quan sát (số liệu) về biến ngẫu nhiên gốc X và được gọi là giá trị quan sát của thống kê G . 1.4.2. Thống kê trung bình mẫu Giả sử ( ) 1 2 , , ., n W X X X= là mẫu ngẫu nhiên, khi đó trung bình mẫu của mẫu ngẫu nhiên W là thống kê. 1 1 . n i i X X n = = ∑ 8 Vì mỗi i X là một bản sao của biến ngẫu nhiên gốc X nên chúng đều có cùng kỳ vọng và phương sai với ,X do đó thống kê trung bình mẫu X là một biến ngẫu nhiên có kỳ vọng và phương sai mẫu tương ứng là: 1 1 1 1 1 n n i i i i E X E X EX n n n n µ µ = =   = = = =  ÷   ∑ ∑ 2 2 2 2 2 1 1 1 1 1 n n i i i i DX D X DX n n n n n σ σ = =   = = = =  ÷   ∑ ∑ Với mẫu quan sát ( ) 1 2 , , ., n W X X X= và nếu: x i 1 x 2 x 3 x … x k n i 1 n 2 n 3 n … n k là bảng thu gọn thì trung bình mẫu quan sát sẽ được tính theo công thức: 1 1 k qs i i i X x n x n = = = ∑ Trung bình mẫu quan sát là số cụ thể, là một thể hiện của trung bình mẫu. 1.4.3. Phương sai mẫu 2 S và *2 S - Phương sai mẫu 2 S Là thống kê trong trường hợp kỳ vọng của X chưa biết và được xác định bởi: ( ) 2 2 1 1 1 n i i S X X n = = − − ∑ 2 S cũng là một biến ngẫu nhiên. Nếu biến ngẫu nhiên gốc X có phương sai 2 σ thì phương sai mẫu 2 S có kỳ vọng ( ) 2 2 E S σ = với mẫu quan sát tương ứng ( ) 1 2 , , ., n W X X X= và nếu chúng được thu gọn dưới dạng: x i 1 x 2 x 3 x … x k n i 1 n 2 n 3 n … n k 9 thì giá trị quan sát của phương sai mẫu được tính bởi: ( ) 2 2 1 1 1 k i i i S n x x n = = − − ∑ - Phương sai *2 S Là thống kê trong trường hợp kỳ vọng của X bằng µ đã biết và được xác định bởi: ( ) 2 2 1 1 n i i S X n µ ∗ = = − ∑ 2 S ∗ cũng là một biến ngẫu nhiên. Phương sai mẫu 2 S ∗ có kỳ vọng ( ) 2 2 E S σ ∗ = . Với mẫu quan sát tương ứng ( ) 1 2 , , ., n W x x x= và nếu chúng được thu gọn dưới dạng: i x 1 x 2 x 3 x … k x i n 1 n 2 n 3 n … k n 10

Ngày đăng: 19/12/2013, 10:40

Hình ảnh liên quan

Bảng phõn phối tần số thực nghiệm: - Khai thác phần mềm winstat để xử lý số liệu bằng phương pháp phân tích hồi quy

Bảng ph.

õn phối tần số thực nghiệm: Xem tại trang 8 của tài liệu.
là bảng thu gọn thỡ trung bỡnh mẫu quan sỏt sẽ được tớnh theo cụng thức: - Khai thác phần mềm winstat để xử lý số liệu bằng phương pháp phân tích hồi quy

l.

à bảng thu gọn thỡ trung bỡnh mẫu quan sỏt sẽ được tớnh theo cụng thức: Xem tại trang 9 của tài liệu.
S cũng là một biến ngẫu nhiờn. - Khai thác phần mềm winstat để xử lý số liệu bằng phương pháp phân tích hồi quy

c.

ũng là một biến ngẫu nhiờn Xem tại trang 9 của tài liệu.
nhỡn thấy bảng số liệu sau. - Khai thác phần mềm winstat để xử lý số liệu bằng phương pháp phân tích hồi quy

nh.

ỡn thấy bảng số liệu sau Xem tại trang 35 của tài liệu.
Trong bảng số liệu sau: - Khai thác phần mềm winstat để xử lý số liệu bằng phương pháp phân tích hồi quy

rong.

bảng số liệu sau: Xem tại trang 40 của tài liệu.
Đưa ra bBảng số liệu minh hoạ bờn dưới là bảng trắc nghiệm kết quả thi tốt nghiệp của hai trường THPT  Ngụ Quyền và Bạch Đằng năm học 2008 - 2009. - Khai thác phần mềm winstat để xử lý số liệu bằng phương pháp phân tích hồi quy

a.

ra bBảng số liệu minh hoạ bờn dưới là bảng trắc nghiệm kết quả thi tốt nghiệp của hai trường THPT Ngụ Quyền và Bạch Đằng năm học 2008 - 2009 Xem tại trang 51 của tài liệu.
Bảng số liệu là điểm cỏc mụn thi tốt nghiệp của 299 học sinh (Lờ Lợi cú 168 học sinh, Lam kinh cú 231 học sinh), năm học 2008-2009 của hai trường Lờ Lợi và Lam Kinh. - Khai thác phần mềm winstat để xử lý số liệu bằng phương pháp phân tích hồi quy

Bảng s.

ố liệu là điểm cỏc mụn thi tốt nghiệp của 299 học sinh (Lờ Lợi cú 168 học sinh, Lam kinh cú 231 học sinh), năm học 2008-2009 của hai trường Lờ Lợi và Lam Kinh Xem tại trang 52 của tài liệu.
Winstat cho ta những nhận xột sau:bảng kết quả sau - Khai thác phần mềm winstat để xử lý số liệu bằng phương pháp phân tích hồi quy

instat.

cho ta những nhận xột sau:bảng kết quả sau Xem tại trang 54 của tài liệu.
Qua bảng kết quả trờn ta thấy phương trỡnh hồi quy đơn biểu diễn mối quan hệ giữa điểm Toỏn và điểm Vvăn là  - Khai thác phần mềm winstat để xử lý số liệu bằng phương pháp phân tích hồi quy

ua.

bảng kết quả trờn ta thấy phương trỡnh hồi quy đơn biểu diễn mối quan hệ giữa điểm Toỏn và điểm Vvăn là Xem tại trang 54 của tài liệu.
Qua bảng số liệu trờn ta thấy: - Khai thác phần mềm winstat để xử lý số liệu bằng phương pháp phân tích hồi quy

ua.

bảng số liệu trờn ta thấy: Xem tại trang 55 của tài liệu.

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan