Phân tích diện tích gieo trồng một số cây hàng năm

44 781 2
Phân tích diện tích gieo trồng một số cây hàng năm

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Phân tích diện tích gieo trồng một số cây hàng năm

TRƯỜNG ĐẠI HỌC CÔNG NGHIỆP HÀ NỘI KHOA CÔNG NGHỆ THÔNG TIN o0o BÁO CÁO BÀI TẬP LỚN MÔN: PHÂN TÍCH THỐNG KÊ SỐ LIỆU ĐỀ TÀI: DIỆN TÍCH GIEO TRỒNG MỘT SỐ CÂY HÀNG NĂM GV hướng dẫn: Th.S Nguyễn Thị Thanh Huyền Lớp: KHMT1 – K5 Nhóm thực hiện: Nhóm 10 STT Họ Tên 1 Nguyễn Trọng Nghĩa 2 Bùi Văn Nội 3 Lê Văn Vinh MỤC LỤC Hà Nội, tháng 08 năm 2013 PHÂN TÍCH THỐNG KÊ SỐ LIỆU DIỆN TÍCH GIEO TRỒNG MỘT SỐ CÂY HÀNG NĂM LỜI NÓI ĐẦU “Phân tích thống kê số liệu” là một ngành khoa học có ứng dụng tương đối rộng rãi trong các lĩnh vực của đời sống như nông nghiệp, kinh tế, y học, các ngành khoa học…. Nó giúp chúng ta có những đánh giá, dự báo về một sự kiện, một đối tượng nào đó, từ đó giúp chúng ta đưa ra được những giải pháp đúng đắn để phát huy cũng như hạn chế, khắc phục những ưu và nhược điểm của sự kiện, đối tượng đó. Đối với Nhóm 10- ĐH Khoa Học Máy Tính 1-K5 thì “Phân tích thống kê số liệu” là một môn mới và xa lạ. Tuy nhiên trong quá trình học và nghiên cứu môn nhóm đã được tìm hiểu và được sự hướng dẫn của cô giáo Nguyễn Thị Thanh Huyền. Do vậy nhóm đã quyết định chọn đề tài bài tập lớn là: “Phân tích diện tích gieo trồng một số cây hàng năm” để nghiên cứu. Vận dụng những kiến thức đã học được nhóm đã nghiên cứu và đưa ra những dự báo, đánh giá về tình hình diện tích gieo trồng các loại cây hàng năm của các vùng miền trên cả nước, thấy được sự chênh lệch giữa các loại cây, từ đó sẽ đưa ra các dự báo thích hợp. NHÓM 10… KHMT1_K5 2 PHÂN TÍCH THỐNG KÊ SỐ LIỆU DIỆN TÍCH GIEO TRỒNG MỘT SỐ CÂY HÀNG NĂM Nhóm 10 xin chân thành cảm ơn cô giáo Nguyễn Thị Thanh Huyền đã tận tình giúp nhóm hoàn thành bài tập lớn này. Hà Nội, tháng 08 năm 2013 Nhóm thực hiện: Nhóm 10-khmt1k5 NHÓM 10… KHMT1_K5 3 PHÂN TÍCH THỐNG KÊ SỐ LIỆU DIỆN TÍCH GIEO TRỒNG MỘT SỐ CÂY HÀNG NĂM BẢNG PHÂN CÔNG CÔNG VIỆC NHÓM 10… KHMT1_K5 4 Mã Sv Họ tên Công việc được phân 0541060034 Nguyễn Trọng Nghĩa -Thực hiện phân tích dữ liệu thu thập. -Dự báo bằng chuỗi thời gian, mô hình hồi quy đơn biến. Thực hiện trên phần mềm StatGraphics. -Tổng hợp báo cáo 05410600 Bùi Văn Nội -Thực hiện phân tích dữ liệu thu thập. -Phân tích dữ liệu bằng mô hình hồi quy đơn biến, đa biến. -Thực hiện trên phần mềm StatGraphics 0541060052 Lê Văn Vinh -Thực hiện phân tích dữ liệu thu thập. -Phân tích dữ liệu bằng mô hình hồi quy đơn biến, đa biến. -Làm báo cáo chương 1. PHÂN TÍCH THỐNG KÊ SỐ LIỆU DIỆN TÍCH GIEO TRỒNG MỘT SỐ CÂY HÀNG NĂM CHƯƠNG 1: CƠ SỞ LÝ THUYẾT 1.1. Mô hình hồi quy đơn biến 1.1.1. Khái niệm Giả xử nhận thấy giá trị của y có xu hướng tăng hoặc giảm một cách tuyến tính khi tăng x, ta có thể chọn một mô hình biểu diễn quan hệ của y theo x bằng cách vẽ một đường cũng được “làm khớp ” cho một tập dữ liệu. Tuy nhiên vấn đề là: Làm thế nào vẽ một đường đi qua tất cả các điểm, ít nhất là một điểm sẽ lệch đáng kể so với đường thẳng được làm khớp. Các giải pháp cho vẫn đề: Xây dựng một mô hình hồi quy tuyến tính đơn giản, sao cho giá trị trung bình của y tương ứng với giá trị của x. Đồ thị là đường thẳng và các điểm đi chệch so với đường thẳng này do ngẫu nhiên, và bằng e, tức là: y=A+Bx+e Trong đó: A và B là các tham số chưa biết trong xác định mô hình. Nếu ta giả xử giá trị kỳ vọng E(e)=0, thì giá trị trung bình của y là: y= A+Bx Do đó, xét giá trị trung bình của y tương ứng giá trị xác định của x, đồ thị là đường thẳng. Viết dạng tổng quát, với một mô hình tuyến tính đơn giản, ta có y= A+Bx+e Trong đó : - y là biến phụ thuộc (biến được mô hình hóa, còn gọi là biến đáp ứng) - x là biến độc lập - e là lỗi ngẫu nhiên - A hệ số tự do - B độ nghiêng của đường thẳng NHÓM 10… KHMT1_K5 5 PHÂN TÍCH THỐNG KÊ SỐ LIỆU DIỆN TÍCH GIEO TRỒNG MỘT SỐ CÂY HÀNG NĂM 1.1.2. Tính hệ số tự do(A), độ nghiêng(B) theo phương pháp bình phương cực tiểu Vấn đề đầu tiên của phân tích hồi quy đơn giản là tìm ước lượng của A và B của mô hình hồi quy dựa trên một dữ liệu mẫu. Giả sử chúng ta có một mẫu của n điểm dữ liệu (x1,y1), (x2,y2), , (xn,yn). Mô hình đường thẳng cho các y tương ứng với x là: y=AB + x+e Đường thẳng của các trung bình là E(y) = A+Bx và đường được làm khớp với dữ liệu mẫu . Như vậy, là một ước lượng của các giá trị trung bình của y, và a, b là ước lượng của A và B tương ứng. Đối với một điểm số liệu, nói rằng các điểm (xi,yi), giá trị quan sát của y là yi và các giá trị dự đoán của y sẽ là: và độ lệch của giá trị thứ i của y từ giá trị dự đoán của nó là: Các giá trị của a và b làm cho tối thiểu SSE được gọi là các ước tính theo phương pháp bình phương cực tiểu của các tham số quần thể A và B và phương trình dự báo được gọi là đường bình phương cực tiểu. Công thức tính toán cho đường bình phương cực tiểu: NHÓM 10… KHMT1_K5 6 PHÂN TÍCH THỐNG KÊ SỐ LIỆU DIỆN TÍCH GIEO TRỒNG MỘT SỐ CÂY HÀNG NĂM 1.1.3. Đánh giá phương sai () Trong hầu hết các tình huống thực tế, phương sai của số ngẫu nhiên e chưa biết và phải được ước tính từ dữ liệu mẫu. Với đo phương sai của cá giá trị y về đường hồi quy, trực giác ta ước tính bằng cách chia tổng số lỗi SSE cho một số thích hợp. 1.1.4. Kiểm định về năng lực mô hình  Kiểm định 1 phía Kiểm định thống kê: Vùng bác bỏ ( dựa trên bậc tự do df = (n-2))  Kiểm định 2 phía Kiểm định thống kê: Vùng bác bỏ ( dựa trên bậc tự do df = (n-2)) 1.2. Mô hình hồi quy đa biến 1.2.1. Giới thiệu các mô hình tuyến tính tổng quát  Một số mô hình:  Ta có thể chuyển mô hình bậc hai về mô hình bậc nhất: Mô hình bậc hai: Đặt Trở thành mô hình bậc nhất: NHÓM 10… KHMT1_K5 7 PHÂN TÍCH THỐNG KÊ SỐ LIỆU DIỆN TÍCH GIEO TRỒNG MỘT SỐ CÂY HÀNG NĂM Do vậy, chúng ta chỉ xét mô hình hồi quy bậc nhất đa biến.  Mô hình tuyến tính đa biến tổng quát Trong đó: - y: biến phụ thuộc (biến được mô hình hóa) - x 1 , x 2 , … , x k : biến độc lập - e: lỗi ngẫu nhiên - B i : xác định sự đóng góp của các biến độc lập x i 1.2.2. Hồi quy đa biến a) Giả định Các giả định cần thiết cho một mô hình hồi quy tuyến tính đa biến Trong đó e là sai số ngẫu nhiên :  Đối với các giá trị bất kỳ của x 1 , x 2 ,…, x k lỗi ngẫu nhiên e có phân bố chuẩn với trung bình bằng 0 và phương sai bằng  Các lỗi ngẫu nhiên là độc lập b) Phương pháp bình phương tối thiểu Xét tương tự mô hình hồi quy tuyến tính một biến đơn giản. Giả sử ta có bảng dữ liệu mẫu: Điểm dữ liệu Giá trị y x 1 x 2 … x k 1 y 1 x 11 x 21 … x k1 2 y 2 x 12 x 22 … x k2 . . . . . . . . . . . . . . . . . . N y n x 1n x 2n … x kn Ta sẽ sử dụng phương pháp bình phương tối thiểu và tính B 0 , B 1 , B 2 ,…., B k sao cho cực tiểu. SSE = = Chúng ta có có thể viết ngắn gọn: Y=, X=, b= Sau đó chúng ta viết biểu biểu thức dưới dạng ma trận sau: (X’X)b = X’Y NHÓM 10… KHMT1_K5 8 PHÂN TÍCH THỐNG KÊ SỐ LIỆU DIỆN TÍCH GIEO TRỒNG MỘT SỐ CÂY HÀNG NĂM Trong đó X’ là chuyển vị của X Suy ra : b = (X’X) -1 XY c) Đánh giá phương sai Vì phương sai sẽ hiếm khi được biết trước, chúng ta phải sử dụng các dữ liệu mẫu để ước tính giá trị của nó Ước lượng của , phương sai trong mô hình hồi quy đa biến Trong đó d) Đánh giá và kiểm định  Kiểm định một phía: H 0 : B i =0; H a : B i <0 (hoặc B i >0) Kiểm định thống kê t = Vùng loại bỏ t < -tα (hoặc t > t α)  Kiểm định hai phía: H 0 : B i =0; H a : B i ≠0 Kiểm định thống kê t = Vùng loại bỏ t < -tα/2 (hoặc t > tα/2 e) Kiểm tra năng lực của mô hình Kiểm tra năng lực của mô hình: E(y) = B 0 + B 1x1 + … + B kxk H 0 : B i =0; H a : B i ≠0 Kiểm định thống kê: F= Vùng bác bỏ: F > Fα f) Sử dụng mô hình để ước lượng và dự báo  Một khoảng tin cậy(1-α)100% đối với E(y) t α/2 s NHÓM 10… KHMT1_K5 9 PHÂN TÍCH THỐNG KÊ SỐ LIỆU DIỆN TÍCH GIEO TRỒNG MỘT SỐ CÂY HÀNG NĂM Trong đó: = b 0 +b 1 x 1 * +b 2 x 2 * +…+b χ x χ * x*=(1 x 1 * x 2 * … x χ * )’ là một giá trị cụ thể của x s và (X’X) -1 đạt được từ phân tích bình phương cực tiểu t α/2 dựa trên số bậc tự do kết hợp với s, là [n-(k+1)]  Một khoảng dự báo(1-α)100% đối với E(y) t α/2 s Trong đó: = b 0 +b 1 x 1 * +b 2 x 2 * +…+b χ x χ * x*=(1 x 1 * x 2 * … x χ * )’ là một giá trị cụ thể của x s và (X’X) -1 đạt được từ phân tích bình phương cực tiểu t α/2 dựa trên số bậc tự do kết hợp với s, là [n-(k+1)] 1.3. Mô hình tương quan 1.3.1. Tổng quan Để mô tả độ tương quan giữa hai biến, chúng ta cần phải ước tính hệ số tương quan (coefficient of correlation). Và, để hiểu “cơ chế” của hệ số tương quan, chúng ta cần làm quen với khái niệm hiệp biến(covariance). Chúng ta biết rằng với một biến X hay Y, có ba thông số thống kê mô tả: số cỡ mẫu, số trung (mean), và phương sai (variance), mà tôi đã bàn qua trong bài ‘Độ lệch chuẩn hay sai số chuẩn?’. Nhưng để mô tả mối tương quan giữa hai biến X và Y, chúng ta cần đến hiệp biến. Có thể hiểu hiệp biến qua hình học lượng giác như sau. Chúng ta biết rằng cho một tam giác vuông, nếu gọi cạnh huyền là c và hai cạnh còn lại là a và b, Định lí Pythagoras cho biết bình phương cạnh huyền bằng tổng bình phương hai cạnh kia: Nhưng cho một tam giác thường, thì mối liên hệ giữa c và hai cạnh a và b phức tạp hơn với mối liên hệ được định lượng bằng hàm cosine của góc C như sau: Tương tự như vậy, cho hai biến X và Y, và nếu hai biến này hoàn toàn độc lập với nhau, chúng ta có thể phát biểu rằng phương sai của biến X + Y bằng phương sai của X cộng với phương sai của Y: var(X + Y) = var(X) + var(Y) trong đó, “var” là viết tắt của phương sai (tức variance). Chú ý rằng X+Y là một biến mới. Chúng ta cũng chú ý rằng công thức này tương đương với Định lí Pythagoras cho tam giác vuông. NHÓM 10… KHMT1_K5 10 [...]... thông số a , b, c vẫn xác định dựa vào khái niệm bình phương tối thiểu mà ta vừa nghiên cứu ở trên CHƯƠNG 2: THU THẬP DỮ LIỆU ĐỂ PHÂN TÍCH 2.1 Dữ liệu thu thập Bảng diện tích gieo trồng một số cây hang năm từ năm 2000-2011 NHÓM 10… KHMT1_K5 20 PHÂN TÍCH THỐNG KÊ SỐ LIỆU DIỆN TÍCH GIEO TRỒNG MỘT SỐ CÂY HÀNG NĂM 2.2 Chọn phương pháp để phân tích dữ liệu - Đề tài : Phân tích diện tích gieo trồng một số cây. .. KHMT1_K5 25 PHÂN TÍCH THỐNG KÊ SỐ LIỆU DIỆN TÍCH GIEO TRỒNG MỘT SỐ CÂY HÀNG NĂM  Giá trị độ nhọn của phân bố có giá trị < 0 nên tập số liệu có xu hướng phân bố xung quanh giá trị trung bình 3.1.4 Diện tích gieo trồng Lạc Biểu đồ diện tích gieo trồng Lạc Quan sát hai biểu biểu đồ, ta thấy:  Diện tích gieo trồng Lạc trải rộng từ hơn 223.7 (nghìn ha) tới gần 269.6 (nghìn ha)  Diện tích gieo trồng Lạc... KHMT1_K5 27 PHÂN TÍCH THỐNG KÊ SỐ LIỆU DIỆN TÍCH GIEO TRỒNG MỘT SỐ CÂY HÀNG NĂM 3.1.6 Diện tích gieo trồng Lúa Biểu đồ diện tích gieo trồng Lúa Quan sát hai biểu biểu đồ, ta thấy:  Diện tích gieo trồng Lúa trải rộng từ hơn 7207.4 (nghìn ha) tới gần 7666.3 (nghìn ha)  Diện tích gieo trồng Lúa chủ yếu là 7367(nghìn ha) cho đến 7532(nghìn ha)  Điều này cho thấy diện tích gieo trồng Lúa tăng dần rùi lại... StatGraphics 3.4.1 Phân tích chuỗi thời gian dự báo diện tích Ngô Biểu đồ diện tích gieo trồng Ngô từ năm 2000-2011 Nhận định: Dựa vào biểu đồ ta nhận thấy số diện tích gieo trồng Ngô có biến đổi theo tuần tự chu kỳ Ta có thể dử dụng mô hình phân tích chuỗi thời gian để dự báo diện tích Ngô vào một năm tiếp theo Sử dụng phân tích chuỗi thời gian để dự báo diện tích gieo trồng Ngô 2 năm tiếp theo NHÓM... trị < 0 nên tập số liệu có xu hướng lớn hơn giá trị trung bình và đồ thị phân bố có xu hướng lệch trái so với giá trị trung bình  Giá trị độ nhọn của phân bố có giá trị > 0 nên tập số liệu có xu hướng phân bố tản ra xa giá trị trung bình NHÓM 10… KHMT1_K5 26 PHÂN TÍCH THỐNG KÊ SỐ LIỆU DIỆN TÍCH GIEO TRỒNG MỘT SỐ CÂY HÀNG NĂM 3.1.5 Diện tích gieo trồng Đậu tương Biểu đồ diện tích gieo trồng Đậu tương... Đặc trưng diện tích gieo trồng Ngô Biểu đồ diện tích gieo trồng Ngô Quan sát hai biểu biểu đồ, ta thấy:  Diện tích gieo trồng Ngô trải rộng từ hơn 729.5 (nghìn ha) tới gần 1140.2 (nghìn ha)  Diện tích gieo trồng Ngô tập trung chủ yếu trong khoảng 870 (nghìn ha) đến 1110(nghìn ha)  Diện tích gieo trồng Ngô chủ yếu là 1000(nghìn ha) cho đến 1100(nghìn ha)  Điều này cho thấy diện tích gieo trồng ngô... Đặc trưng diện tích gieo trồng Mía Biểu đồ diện tích gieo trồng Mía Quan sát hai biểu biểu đồ, ta thấy:  Diện tích gieo trồng Mía trải rộng từ hơn 265.6 (nghìn ha) tới gần 320.0 (nghìn ha)  Diện tích gieo trồng Mía tập trung chủ yếu trong khoảng 270 (nghìn ha) đến 298(nghìn ha)  Diện tích gieo trồng Mía chủ yếu là 260(nghìn ha) cho đến 288(nghìn ha)  Điều này cho thấy diện tích gieo trồng Mía giảm... StatGraphics 3.2.1 Áp dụng hồi quy đơn biến xét sự thay đổi diện tích gieo trồng ngô qua cá năm Trong STATGRAPHIC: Để phân tích hồi quy đơn biến ta làm như sau: vào Improve =>Regression Analysis => One factor => Simple Regression NHÓM 10… KHMT1_K5 28 PHÂN TÍCH THỐNG KÊ SỐ LIỆU DIỆN TÍCH GIEO TRỒNG MỘT SỐ CÂY HÀNG NĂM Chọn biến Tổng Diện Tích và Diện Tích Lúa ta được kết quả: Dependent variable: Y (Tong Dien... Coefficient: Hệ số tương quan - R-squared: hệ số xác định (bình phương R) Standard Error of Est: độ lệch chuẩn Mean absolute erro: Sai số trung bình tuyệt đối NHÓM 10… KHMT1_K5 29 PHÂN TÍCH THỐNG KÊ SỐ LIỆU DIỆN TÍCH GIEO TRỒNG MỘT SỐ CÂY HÀNG NĂM Từ kết quả trên, ta thấy mô hình tương quan Diện tích Lúa và Tổng Diện Tích có dạng: Y = 6466,46 + ,361854*X1 hệ số tương quan R = 0,334436, cho thấy Diện Tích Ngô”... Hệ số tương quan - R-squared: hệ số xác định (bình phương R) Standard Error of Est: độ lệch chuẩn Mean absolute erro: Sai số trung bình tuyệt đối NHÓM 10… KHMT1_K5 31 PHÂN TÍCH THỐNG KÊ SỐ LIỆU DIỆN TÍCH GIEO TRỒNG MỘT SỐ CÂY HÀNG NĂM Từ kết quả trên, ta thấy mô hình tương quan Diện tích Lạc và năm có dạng: Y = 8534,63 + ,636483*X2 hệ số tương quan R = 0,690391, cho thấy Diện Tích Ngô” và “Tổng Diện . Văn Vinh MỤC LỤC Hà Nội, tháng 08 năm 2013 PHÂN TÍCH THỐNG KÊ SỐ LIỆU DIỆN TÍCH GIEO TRỒNG MỘT SỐ CÂY HÀNG NĂM LỜI NÓI ĐẦU Phân tích thống kê số liệu” là một ngành khoa học có ứng dụng tương. là: Phân tích diện tích gieo trồng một số cây hàng năm để nghiên cứu. Vận dụng những kiến thức đã học được nhóm đã nghiên cứu và đưa ra những dự báo, đánh giá về tình hình diện tích gieo trồng. KHMT1_K5 3 PHÂN TÍCH THỐNG KÊ SỐ LIỆU DIỆN TÍCH GIEO TRỒNG MỘT SỐ CÂY HÀNG NĂM BẢNG PHÂN CÔNG CÔNG VIỆC NHÓM 10… KHMT1_K5 4 Mã Sv Họ tên Công việc được phân 0541060034 Nguyễn Trọng Nghĩa -Thực hiện phân

Ngày đăng: 11/04/2015, 13:59

Mục lục

  • LỜI NÓI ĐẦU

  • BẢNG PHÂN CÔNG CÔNG VIỆC

  • CHƯƠNG 1: CƠ SỞ LÝ THUYẾT

    • 1.1. Mô hình hồi quy đơn biến

      • 1.1.1. Khái niệm

      • 1.1.2. Tính hệ số tự do(A), độ nghiêng(B) theo phương pháp bình phương cực tiểu

      • 1.1.3. Đánh giá phương sai ()

      • 1.1.4. Kiểm định về năng lực mô hình

      • 1.2. Mô hình hồi quy đa biến

        • 1.2.1. Giới thiệu các mô hình tuyến tính tổng quát

        • 1.2.2. Hồi quy đa biến

        • 1.3. Mô hình tương quan

          • 1.3.1. Tổng quan

          • 1.3.2. Ví dụ

          • 1.3.3. Khoảnh tin cậy 95 % của hệ số tương quan

          • 1.3.4. Kiểm định 2 hệ số tương quan

          • 1.4. Chuỗi thời gian

            • 1.4.1 Định Nghĩa

            • 1.4.2 Phương pháp phân rã

            • CHƯƠNG 2: THU THẬP DỮ LIỆU ĐỂ PHÂN TÍCH

              • 2.1 . Dữ liệu thu thập

              • 2.2 .Chọn phương pháp để phân tích dữ liệu

              • CHƯƠNG 3: PHÂN TÍCH VÀ DỰ BÁO QUA PHẦN MỀM STARTGRAPHIC

                • 3.1 Sử dụng phương pháp phân tích đặc trưng trong StatGraphics.

                  • 3.1.1 Đặc trưng diện tích gieo trồng Ngô

                  • 3.1.2 Đặc trưng diện tích gieo trồng Mía

                  • 3.1.3 Diện tích gieo trồng Bông

                  • 3.1.4 Diện tích gieo trồng Lạc

Tài liệu cùng người dùng

Tài liệu liên quan