hướng dẫn sử dụng phần mềm mini tab xử lý số liệu với nghiên cứu khoa học

34 6.7K 224
hướng dẫn sử dụng phần mềm mini tab xử lý số liệu với nghiên cứu khoa học

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Bài 1 Giới thiệu phần mềm MinitabMinitab 14 for Windows XP ñược sử dụng ñể minh hoạ cho các bài tập trong phần giáo trìnhnày. Nếu bạn ñọc sử dụng các phiên bản khác của Mintab có thể sẽ không hỗ trợ một số cáccông cụ và dao diện sẽ khác so với giáo trình này.1.1. Khởi ñộng MinitabNếu cài ñặt Minitab 14 for Windows XP theo mạc ñịnh ta có thể khởi ñộng phần mềm bằngcách1) Chọn biểu tượng Minitab trên Desktop của màn hình hoặc2) theo ñường dẫn Stat > Program > MINITAB 14 > MINITAB 14 hoặc3) C:Program FilesMINITAB 14Mtb14.exeGiao diện phần mềm Minitab 14 for Windows XP gồm một số thành phần chính: 1) MenuBar, 2) Standard toolbar, 3) Project Manager Toolbar, 4) Worksheet Toolbar, 5) Title, 6)Session Window, 7) Data Window 8) Project Manager Window và 9) Status bar.

Phần B ỨNG DỤNG MINITAB TRONG XỬ SỐ LIỆU Bài Giới thiệu phần mềm Minitab Minitab 14 for Windows XP ñược sử dụng ñể minh hoạ cho tập phần giáo trình Nếu bạn ñọc sử dụng phiên khác Mintab không hỗ trợ số công cụ dao diện khác so với giáo trình 1.1 Khởi ñộng Minitab Nếu cài ñặt Minitab 14 for Windows XP theo mạc ñịnh ta khởi ñộng phần mềm cách 1) Chọn biểu tượng Minitab Desktop hình 2) theo ñường dẫn Stat > Program > MINITAB 14 > MINITAB 14 3) C:\Program Files\MINITAB 14\Mtb14.exe Giao diện phần mềm Minitab 14 for Windows XP gồm số thành phần chính: 1) Menu Bar, 2) Standard toolbar, 3) Project Manager Toolbar, 4) Worksheet Toolbar, 5) Title, 6) Session Window, 7) Data Window 8) Project Manager Window 9) Status bar Menu Bar Standard Toolbar Project Manager Toolbar Title Worksheet Toolbar Session Window Project Manager Windows Data Window (Worksheet Windows) Status Bar Bài tập Thiết kế thí nghiệm 18 Bài Nhật ñồ thống kê 2.1 Tóm tắt liệu ñối với biến ñịnh lượng Ví dụ M-1.1: Khối lượng (gram) 16 chuột thời ñiểm cai sữa sau: 54,1 49,8 24,0 46,0 44,1 34,0 52,6 54,4 56,1 52,0 51,9 54,0 58,0 39,0 32,7 58,5 ðể tính tham số thống kê mô tả Số liệu ñược nhập vào vào cột Windows Worksheet Thay dấu phẩy (,) dấu chấm (.) phần thập phân Ô số liệu khuyết ñược thay dấu (*), không ñược ñể trống Cột số liệu phải dạng số ðối với tiêu nghiên cứu, số liệu ñược nhập dạng cột Chọn Stat Basic Statistics Tên cột số liệu nằm hàng thứ ðặt tên cột ngắn gọn, không nên dùng ký tự ñặc biệt (:, /…) ký tự tiếng Việt (ô, ă…) Trong worksheet không ñặt tên cột trùng Phần mềm Minitab không phân biệt ñược ký tự viết hoa viết thường (ví dụ: MINITAB = Minitab = minitab) Display Descriptive Statistics Phần ô bên trái hộp thoại hiển thị cột (C1) tên cột số liệu (P) Chọn P nhấn Select ñể hiển thị cột cần tính tham số thống kê mô tả vào ô Variables Chọn OK ñể hiển thị kết Kết thu ñược từ Minitab sau Descriptive Statistics: P Variable P N 16 N* Mean 47.58 SE Mean 2.54 StDev 10.16 Minimum 24.00 Q1 40.28 Median 51.95 Q3 54.33 Maximum 58.50 Phần B Ứng dụng Minitab 19 Minitab cho kết theo mạc ñịnh Có thể sử dụng Option sau ñây ñể cho kết theo lựa chọn phù hợp Chọn Statistics…có thể lựa chọn tham số sau ñây Một số thuật ngữ options Minitab thống kê mô tả Minitab Tiếng Việt Minitab Tiếng Việt Mean Trung bình Trimmed mean Trung bình hiệu chỉnh SE of Mean Sai số tiêu chuẩn Sum Tổng số Standard deviation ðộ lệch chuẩn Minimum Giá trị bé Variance Phương sai Maximum Giá trị lớn Coefficient of variation Hệ số biến ñộng Range Khoảng biến ñộng First quartile Tứ vị thứ Sum of squares Tổng bình phương Median Trung vị Skewness ðộ lệch Third quartile Tứ vị thứ Kurtosis ðộ nhọn Interquartile Tứ vị thứ MSSD N nonmissing N không khuyết Cumulative N N cộng gộp N missing N khuyết Percent Phần trăm N total N tổng số Cumulative percent Phần trăm công gộp Chọn Graphs…ñể hiển thị ñồ thị sau ñây (tick √ vào) Histogram of data ñể có tổ chức ñồ Histogram of data, with normal curve ñể có tổ chức ñồ với ñường cong chuẩn Individual value plot ñể thể ñiểm giá trị Boxplot of data ñể có ñược ñồ thị hộp Chọn OK ñể có ñược ñồ thị Bài tập Thiết kế thí nghiệm 20 Ví dụ chọn Boxplot of data ñể có ñược ñồ thị hộp ñây Khai báo vào By variables (Optional) ñể tính tham số thống kê theo phân loại nhóm Xét Ví dụ M-1.1, giả sử chuột ñầu tiên sinh lứa thứ chuột sinh lứa thứ Ta bố trí cấu trúc số liệu thành cột, cột C1 (P) cột C2 (LUA) Kết từ Minitab Descriptive Statistics: P Variable P LUA N 8 N* 0 Mean 44.88 50.28 SE Mean 3.82 3.32 StDev 10.79 9.39 Minimum 24.00 32.70 Q1 36.53 42.23 Median 47.90 53.00 Q3 53.73 57.53 Phần B Ứng dụng Minitab 21 2.2 Tóm tắt liệu ñối với biến ñịnh tính ðối với biến ñịnh tính số liệu thô thu thập ñược từ thí nghiệm ñược trình bày theo cách sau ñây: Ví dụ M-1.2: Số bò sữa ba trại A, B, C 106, 132 122 Chọn ngẫu nhiên kiểm tra bệnh viêm nội mạc tử cung trại, kết sau: Cách 1: Trại A Bò số Kết + Trại B Bò số Kết Trại C Bò số Kết + Cách 2: Trại A B C + A B + C - A B C - A + B C - A + B C - A + B C + A B C - A B + C - A 10 B 10 + C 10 - A 11 + B 11 C 11 + A 12 B 12 C 12 - A 13 B 13 C 13 + Viêm nội mạc tử cung A 14 B 14 C 14 - A 15 B 15 C 15 - A 16 B 16 + C 16 - A 17 + B 17 C 17 - B 18 + C 18 + B 19 C 19 + B B B 20 21 22 + - C 20 + Tổng số Có Không A 11 17 B 16 22 C 12 20 Số liệu ñược nhập vào vào cột Windows Worksheet (với cách 1) Nhập liệu vào cột, Trại vào cột C1 (TRAI) cột Kết xét nghiệm vào cột C2 (KETQUA) Lưu ý: Sau nhập thông tin vào cột C1 C2 ký hiệu thay ñổi tương ứng C1-T C2-T Minitab thông báo thông tin cột dạng số mà dạng ký tự (Text) Với số liệu dạng thô (cách 1) tạo thành bảng tóm tắt cách lệnh sau Stat Tables Chi-Square Cross Tabulation and Khai báo vào ô For rows For columns Bài tập Thiết kế thí nghiệm 22 Options Display hiển thị: Count tần số ñối với trường hợp Row percents tỷ lệ (phần trăm) theo hàng Column percents tỷ lệ (phần trăm) theo cột Total percents tỷ lệ (phần trăm) theo hàng/cột tổng số Chọn OK ñể có kết Tabulated statistics: TRAI; KETQUA Rows: TRAI A B C All Columns: KETQUA - + All 11 16 12 39 6 20 17 22 20 59 Cell Contents: Count ðối với biến ñịnh tính mô tả biểu ñồ (Bar Chart), biểu ñồ bánh (Pie Chart) Graph Bar Chart…Counts of unique values Chọn OK Chọn Multiple Graphs… Chọn OK ñể có biểu ñồ thực tương tự ñể có biểu ñồ bánh Phần B Ứng dụng Minitab 23 Số liệu ñược nhập vào vào cột Windows Worksheet (với cách 2) Nhập liệu vào cột, Trại vào cột C1 (TRAI), cột Kết xét nghiệm vào cột C2 (KETQUA) Tần suất vào cột C3 (TANSUAT) dạng ký tự (Text) Với số liệu dạng thô (cách 1) tạo thành bảng tóm tắt cách lệnh sau Stat Tables Chi-Square Cross Tabulation and Khai báo vào ô For rows, For columns Frequencies are in Chọn Counts Row percents Display ñể có kết Tabulated statistics: TRAI; KETQUA Using frequencies in TANSUAT Rows: TRAI Columns: KETQUA + All A B C 11 64.71 16 72.73 12 60.00 35.29 27.27 40.00 17 100.00 22 100.00 20 100.00 All 39 20 59 66.10 33.90 100.00 Cell Contents: Count % of Row Biểu ñồ cách nhập số liệu thứ hoàn toàn giống cách nhập số liệu thứ 1, nhiên cách khai báo hộp thoại có số ñiểm khác Graph table Bar Chart…Values from Khai báo vào ô Graph variables Categorical variables Bài tập Thiết kế thí nghiệm 24 Bài Ước lượng kiểm ñịnh giá trị trung bình 3.1 Kiểm ñịnh phân phối chuẩn ðối với tất phép thử ñối với biến ñịnh lượng, ñều giả thiết số liệu thu thập ñược (số liệu thô) ñều tuân theo phân phối chuẩn Nếu số liệu không tuân theo phân phối chuẩn phép thử ñây hiệu lực Trong trường hợp cần biến ñổi số liệu phân phối chuẩn sử dụng kiểm ñịnh phi tham số Giả thiết phép thử: H0: Số liệuphân bố chuẩn H1: Số liệu phân bố chuẩn Ví dụ M-1.3: Tăng trọng trung bình (gram/ngày) 36 lợn nuôi vỗ béo giống Landrace ñược rút ngẫu nhiên từ trại chăn nuôi Số liệu thu ñược sau: 577 596 594 612 600 584 618 627 588 601 606 559 615 607 608 591 565 586 621 623 598 602 581 631 570 595 603 605 616 574 578 600 596 619 636 589 Cán kỹ thuật trại cho tăng trọng trung bình toàn ñàn lợn trại 607 gram/ngày Theo anh chị kết luận ñó ñúng hay sai, sao? Biết ñộ lệch chuẩn tính trạng 21,75 gram Nhập số liệu vào Worksheet Stat Basic Statistics Normality Test Chọn OK ñể có kết Giá trị P-Value = 0,997 ñồ thị lớn 0,05 (α), H0 ñược chấp nhận Kết luận số liệu tuân theo phân phối chuẩn Phần B Ứng dụng Minitab 25 3.2 Phép thử Z Sử dụng phép thử Z ñể kiểm ñịnh giá trị trung bình biết ñộ lệch chuẩn quần thể (σ σ) Minitab tính khoảng tin cậy (CI 95%) thực phép kiểm ñịnh ðối với kiểm ñịnh phía ta có giả thiết: H0: µ = µ với ñối thiết µ ≠ µ 0; ñó µ giá trị trung bình quần thể µ giá trị trung bình quần thể kiểm ñịnh Stat Basic Statistics 1-sample Z Trong Samples in columns khai báo cột số liệu (P) Trong Standard deviation ñiền giá trị 21,75 (ñộ lệch chuẩn quần thể σ) Trong Test mean ñiền giá trị 607 (giá trị quần thể kiểm ñịnh µ0) Chọn OK ñể có kết One-Sample Z: P Test of mu = 607 vs not = 607 The assumed standard deviation = 21.75 Variable P N 36 Mean 599.194 StDev 18.656 SE Mean 3.625 95% CI (592.090; 606.299) Z -2.15 P 0.031 Với xác suất phép thử P = 0,031 < 0,05 (α), bác bỏ H0 chấp nhận ñối thiết H1 Kết luận: Tăng trọng lợn Landrace trại nêu không 607 gram/ ngày (P < 0,05) Khoảng tin cậy 95% 592,090 – 606,299 gram/ ngày Lưu ý: Trong số trường hợp, số liệu ñã ñược tóm tắt (số liệu tinh) dạng tham số thống kê mô tả Như ví dụ _ 1.3 ta có n = 36; x = 599,194 gram Vì giá trị sử dụng ñể khai báo vào lựa chọn Summarized data, giá trị khác (σ µ) ñược khai báo tương tự ñể có kết sau One-Sample Z Test of mu = 607 vs not = 607 The assumed standard deviation = 21.75 N 36 Mean 599.194 SE Mean 3.625 95% CI (592.089; 606.299) Z -2.15 P 0.031 Bài tập Thiết kế thí nghiệm 26 3.3 Phép thử T Trong trường hợp ñộ lệch chuẩn quần thể (σ), phép thử T ñược sử dụng ñể kiểm ñịnh giá trị trung bình ñộ lệch chuẩn mẫu (s) ñược sử dụng thay ñộ lệch chuẩn quần thể Giả thiết phép thử, cấu trúc số liệu tương tự phép thử Z Stat Basic Statistics 1-sample t Khai báo ñối với số liệu thô ñối với số liệu tinh Chọn OK ñể có kết One-Sample T: P Test of mu = 607 vs not = 607 Variable P N 36 Mean 599.194 StDev 18.656 SE Mean 3.109 95% CI (592.882; 605.507) T -2.51 Với P = 0,017 ta có kết luận tương tự ñối với sử phép thử Z P 0.017 Bài tập Thiết kế thí nghiệm 36 Ví dụ M-1.8: Một thí nghiệm ñược tiến hành ñể xác ñịnh ảnh hưởng công thức thức ăn (A1, A2 A3) ñến tăng trọng trung bình ngày (gram / ngày) bê ñực Bê ñực ñược cân chia thành khối dựa theo khối lượng bắt ñầu thí nghiệm Trong khối có ñộng vật thí nghiệm ñược chọn ñược phân ngẫu nhiên với nghiệm thức Số liệu thu thập sau kết thúc thí nghiệm sau: A1 A2 A3 I 826 806 827 800 753 773 Khối II III 864 795 834 810 871 729 881 709 801 736 821 740 IV 850 845 860 840 820 835 Cấu trúc số liệu mô hình thí nghiệm ví dụ 1.8 tương tự ví dụ 1.7 Trong ví dụ 1.8 có ñơn vị thí nghiệm nghiệm thức khối tác ñộng khối công thức thí nghiệm tồn tương tác khối công thức thí nghiệm Stat ANOVA General Linear Model Chọn Comparisons ñể so sánh cặp ñôi Chọn OK ñể có kết General Linear Model: KL versus CT; KHOI Factor CT KHOI Type fixed fixed Levels Values A1; A2; A3 I; II; III; IV Analysis of Variance for KL, using Adjusted SS for Tests Source CT KHOI CT*KHOI Error Total DF 12 23 S = 13.2602 Seq SS 8025.6 33816.8 8087.4 2110.0 52039.8 Adj SS 8025.6 33816.8 8087.4 2110.0 R-Sq = 95.95% Adj MS 4012.8 11272.3 1347.9 175.8 F 22.82 64.11 7.67 P 0.000 0.000 0.001 R-Sq(adj) = 92.23% Xác suất phép thử ñối với yếu tố Thức ăn P = 0,000 tương tác (CT*KHOI) P = 0,001 < 0,05 (α), bác bỏ giả thiết H0 chấp nhận ñối thiết H1 Kết luận công thức ăn có ảnh ñến tăng trọng bê có tương tác công thức thức ăn khối lượng bê vỗ béo (P < 0,05) Phần B Ứng dụng Minitab 37 5.3 Thí nghiệm kiểu Ô vuông latinh ðối với mô hình thí nghiệm Ô vuông latinh, ô yếu tố thí nghiệm ta yếu tố khác (yếu tố hàng cột) tác ñộng lên ñối tượng thí nghiệm Ví dụ M-1.9a: Một thí nghiệm ñược tiến hành nhằm xác ñịnh ảnh hưởng loại thức ăn bổ sung khác (A, B, C D) ñến lượng cỏ khô mà bê nuôi vỗ béo thu nhận ñược (kg/ngày) Thí nghiệm ñược thiết kế theo mô hình ô vuông la tinh với ñộng vật giai ñoạn, giai ñoạn 20 ngày Trong giai ñoạn 10 ngày ñầu ñược coi giai ñoạn thích nghi, 10 ngày giai ñoạn thí nghiệm ñể thu thập số liệu Số liệu thu ñược khối lượng cỏ khô trung bình bê thu nhận ñược 10 ngày thí nghiệm Hãy rút kết luận từ thí nghiệm nêu Giai ñoạn Cấu trúc số liệu ANOVA Stat Bê 10,0 (B) 9,0 (D) 11,1 (C) 10,8 (A) 10,2 (C) 11,3 (A) 9,5 (D) 11,4 (B) 8,5 (D) 11,2 (B) 12,8 (A) 11 (C) 11,1 (A) 11,4 (C) 11,7 (B) 9,9 (D) Chọn OK ñể có kết General Linear Model: KLCO versus GD; BE; TA Factor GD BE TA Type fixed fixed fixed Levels 4 Values 1; 2; 3; 1; 2; 3; A; B; C; D Analysis of Variance for KLCO, using Adjusted SS for Tests Source GD BE TA Error Total DF 3 15 S = 0.380515 Seq SS 1.4819 3.5919 12.0219 0.8688 17.9644 Adj SS 1.4819 3.5919 12.0219 0.8688 R-Sq = 95.16% Adj MS 0.4940 1.1973 4.0073 0.1448 F 3.41 8.27 27.68 P 0.094 0.015 0.001 R-Sq(adj) = 87.91% Unusual Observations for KLCO Obs 11 KLCO 12.8000 Fit 12.2875 SE Fit 0.3008 Residual 0.5125 St Resid 2.20 R R denotes an observation with a large standardized residual General Linear Model Bài tập Thiết kế thí nghiệm 38 Kết phân tích cho thấy xác suất phép thử ñối với yếu tố thí nghiệm (TA) P = 0,001, giả thiết H0 bị bác bỏ kết luận Có ảnh hưởng thức bổ sung ñến lượng cỏ khô mà bê thu nhận ñược (P < 0,05) Ngoài Minitab ñã hiển thị giá trị ngoại lai (Unusual Observation) số liệu nêu ñối với mô hình xử thống kê ñã lựa chọn Giá trị 12,8000 nằm hàng thứ 11 cột KLCO phần cửa số số liệu Khi giả thiết H0 bị bác bỏ, ta tiến hành so sánh cặp ñôi nghiệm thức yếu tố thí nghiệm Trong hộp thoại General Linear Model, chọn Comparisons… Khai báo yếu tố (TA) cần so sánh cặp Terms: Chọn phương pháp so sánh (Method): Tukey, Bonferroni Sidak, Chọn OK ñể có kết Ngoài kết so sánh tương tự mục 5.1 tài liệu ta có thêm phần so sánh xác suất hiệu chỉnh (Adjusted P-Value) sau: Tukey Simultaneous Tests Response Variable KLCO All Pairwise Comparisons among Levels of TA TA = A subtracted from: TA B C D Difference of Means -0.425 -0.575 -2.275 TA = B TA C D TA D T-Value -1.580 -2.137 -8.455 Adjusted P-Value 0.4536 0.2427 0.0006 T-Value -0.557 -6.876 Adjusted P-Value 0.9411 0.0019 T-Value -6.318 Adjusted P-Value 0.0030 subtracted from: Difference of Means -0.150 -1.850 TA = C SE of Difference 0.2691 0.2691 0.2691 SE of Difference 0.2691 0.2691 subtracted from: Difference of Means -1.700 SE of Difference 0.2691 Cách ñọc kết so sánh tương tự mục 5.1, bạn ñọc sử dụng hai cách ñể so sánh sai khác nghịêm thực Ví dụ so sánh sai khác loại thức ăn bổ sung A B ta có Adjusted P-Value = 0,4536 kết luận sai khác lượng cỏ thu nhận loại thức ăn bổ sung A B (P > 0,05) Nếu thí nghiệm ñược tiến hành nhiều ô vuông latinh khác việc phân tích số liệu bao gồm ảnh hưởng ảnh hưởng yếu tố ô vuông (hàng, cột, yếu tố thí nghiệm) ảnh hưởng ô Phần B Ứng dụng Minitab 39 Ví dụ M-1.9b: Giả sử, thí nghiệm ñược thiết kế tương tự ví dụ M1.9a, có có ô vuông la tinh ñược thiết kế ñồng thời ô ñều có ñộng vật thí nghiệm công thức thí nghiệm khác Số liệu ô vuông la tinh thứ ví dụ M-1.9a, ô vuông la tinh thứ bảng bên Hãy tiến hành phân tích ñể ñưa kết luận ñưa nhận xét mô hình thiết kế ví dụ M-1.9a M-1.9b Cấu trúc số liệu Giai ñoạn Stat Bê 10,9 (C) 11,2 (A) 9,4 (D) 11,2 (B) 10,5 (B) 9,6 (D) 11,4 (C) 10,9 (A) 11,1 (A) 11,4 (C) 11,7 (B) 9,8 (D) 8,8 (D) 12,9 (B) 11,4 (A) 11,2 (C) ANOVA General Linear Model Lưu ý: Model: ñã khai báo dòng lệnh OV GD( OV) BE( OV) TA Chi tiết kiến thức mô hình xem Chương (tr.77) GTTKTN-2007 Chọn OK ñể có kết General Linear Model: KLCO versus OV; TA; GD; BE Factor OV GD(OV) BE(OV) TA Type fixed fixed fixed fixed Levels 8 Values 1; 1; 2; 3; 4; 1; 2; 3; 1; 2; 3; 4; 1; 2; 3; A; B; C; D Analysis of Variance for KLCO, using Adjusted SS for Tests Source OV GD(OV) BE(OV) TA Error Total DF 6 15 31 S = 0.448307 Seq SS 0.1953 2.1444 5.4994 22.6634 3.0147 33.5172 Adj SS 0.1953 2.1444 5.4994 22.6634 3.0147 R-Sq = 91.01% Adj MS 0.1953 0.3574 0.9166 7.5545 0.2010 F 0.97 1.78 4.56 37.59 P 0.340 0.171 0.008 0.000 R-Sq(adj) = 81.41% Unusual Observations for KLCO Obs KLCO Fit SE Fit Residual St Resid 11 12.8000 12.0344 0.3268 0.7656 2.49 R 24 12.9000 12.0781 0.3268 0.8219 2.68 R R denotes an observation with a large standardized residual Bài tập Thiết kế thí nghiệm 40 5.4 Thí nghiệm nhân tố chéo Với mô hình thí nghiệm nhân tố chéo nhau, nghiên cứu tác ñộng yếu tố thí nghiệm ta nghiên cứu mối tương tác yếu tố Về mặt cấu trúc liệu Minitab hoàn toàn tương tự với thiết kế thí nghiệm theo khối mục 5.2 tài liệu khai báo câu lệnh có thêm phần tương tác Ví dụ M-1.10: Một nghiên cứu ñược tiến hành ñể xác ñịnh ảnh hưởng việc bổ sung loại vitamin (A B) vào thức ăn ñến tăng trọng (kg/ngày) lợn Hai mức ñối với vitamin A (0 mg) mức ñối với vitamin B (0 mg) ñược sử dụng thí nghiệm Tổng số 20 lợn thí nghiệm ñược phân tổ hợp (công thức thí nghiệm) cách ngẫu nhiên Số liệu thu ñược kết thúc thí nghiệm ñược trình bày sau: Cấu trúc số liệu A B Stat mg mg mg mg mg mg 0,585 0,567 0,473 0,684 0,536 0,545 0,450 0,702 0,458 0,589 0,869 0,900 0,486 0,536 0,473 0,698 0,536 0,549 0,464 0,693 ANOVA General Linear Model Chọn OK ñể có kết General Linear Model: TT versus VITA; VITB Factor VITA VITB Type fixed fixed Levels 2 Values 0; 0; Analysis of Variance for TT, using Adjusted SS for Tests Source VITA VITB VITA*VITB Error Total DF 1 16 19 Seq SS 0.05192 0.06418 0.02911 0.17648 0.32169 Adj SS 0.05192 0.06418 0.02911 0.17648 Adj MS 0.05192 0.06418 0.02911 0.01103 F 4.71 5.82 2.64 P 0.045 0.028 0.124 Các giá trị xác suất 0,045; 0,028 0,124 ñều ñược xem xét ñể ñưa ñịnh với yếu tố (Vitamin A Vitamin B) tương tác (Vitamin A × Vitamin B) Với xác suất 0,045 0,028 < 0,05 kết luận Vitamin A B có ảnh hưởng ñến tăng trọng lợn tương tác (P = 0,14 > 0,05) Phần B Ứng dụng Minitab 41 5.5 Thí nghiệm hai nhân tố phân cấp Với mô hình phân cấp, nhân tố cấp (A) cố ñịnh cấp (B) ngẫu nhiên Như B làm ổ (nested) A Ví dụ M-11: Mục ñích thí nghiệm xác ñịnh ảnh hưởng lợn ñực giống lợn nái ñến khối lượng sinh hệ Mô hình phân cấp yếu tố ñược sử dụng Bốn lợn ñực giống ñược chọn ngẫu nhiên (a = 4), ñực phối với lợn nái (b = 3) nái sinh ñược lợn (r = 2) Khối lượng (kg) sinh lợn thu ñược sau: ðực Nái 4 10 11 12 1,2 1,2 1,2 1,3 1,1 1,2 1,2 1,2 1,1 1,2 1,2 1,1 1,2 1,2 1,3 1,3 1,2 1,2 1,3 1,3 1,4 1,4 1,3 1,3 Cấu trúc số liệu Lưu ý: Có thể chọn hai cách khai báo Minitab có ñể kết phân tích phương sai Với cách lựa chọn thứ Stat ANOVA General Linear Model Minitab hiển thị kết phân tích phương sai Với cách lựa chọn thứ hai Stat ANOVA Fully Nested ANOVA kết phân tích phương sai Minitab cung cấp bảng giá thành phần phương sai ước tính giá trị trung bình bình phương Stat ANOVA Model General Linear Stat ANOVA ANOVA Fully Nested Trong ô Model: ñã khai báo D N( D) thể Nái (N) làm ổ (nested) ðực (D) ô Random factors: N thể yếu tố Nái (N) ngẫu nhiên Chọn OK ñể có kết quả: Bài tập Thiết kế thí nghiệm 42 General Linear Model: P versus D; N Factor D N(D) Type fixed random Levels 12 Values 1; 2; 3; 1; 2; 3; 4; 5; 6; 7; 8; 9; 10; 11; 12 Analysis of Variance for P, using Adjusted SS for Tests Source D N(D) Error Total DF 12 23 Seq SS 0.093333 0.040000 0.020000 0.153333 S = 0.0408248 Adj SS 0.093333 0.040000 0.020000 Adj MS 0.031111 0.005000 0.001667 R-Sq = 86.96% F 6.22 3.00 P 0.017 0.042 R-Sq(adj) = 75.00% Nested ANOVA: P versus D; N Analysis of Variance for P Source D N Error Total DF 12 23 SS 0.0933 0.0400 0.0200 0.1533 MS 0.0311 0.0050 0.0017 F 6.222 3.000 P 0.017 0.042 Variance Components Source D N Error Total Var Comp 0.004 0.002 0.002 0.008 % of Total 56.63 21.69 21.69 StDev 0.066 0.041 0.041 0.088 Expected Mean Squares D N Error 1.00(3) + 1.00(3) + 1.00(3) 2.00(2) + 2.00(2) 6.00(1) Trong trường hợp ta ñều có giá trị xác suất ñối với yếu tố ðực yếu tố Nái tương ứng 0,017 0,042, giả thiết H0 bị bác bỏ Kết luận có sai khác ñực ñực (P < 0,05) Cách tính phương sai thành phần ước tính dựa vào bảng Expected Mean Squares ñược triển khai cụ thể sau: MSError = 0,0017 = 1,00(σ²ε) σ²ε = 0,0017/1,00 ≈ 0,002 MSN = 0,0050 = 1,00(σ²ε) + 2,00(σ²N) σ²N = [0,0050 – 1,00(0,0017)] / 2,00 ≈ 0,002 MSD = 0,0311 = 1,00(σ²ε) + 2,00(σ²N) + 6,00(σ²D) σ²D ≈ 0,004 Phần B Ứng dụng Minitab 43 5.6 Thí nghiệm nhân tố phân lô Ví dụ M-1.12a: Một thí nghiệm ñược tiến hành ñể nghiên cứu ảnh hưởng bãi chăn thả A (1, 2,3 4) lượng khoáng bổ sung B (1 2) ñến suất sữa Có tất 24 bò tham gia thí nghiệm Thí nghiệm ñược thiết kế theo mô hình hai nhân tố kiểu chia ô với yếu tố A ñược bố trí ô lớn yếu tố B ô nhỏ khối Năng suất sữa trung bình ñược ghi lại sau (kg /ngày): Khối Khối Khối A4 A1 A2 A3 A2 A1 A4 A3 A1 A2 A4 A3 B2 30 B2 27 B1 26 B2 26 B1 32 B2 30 B1 34 B1 33 B2 34 B1 30 B2 36 B1 33 B1 29 B1 25 B2 28 B1 24 B2 37 B1 31 B2 37 B2 32 B1 31 B2 31 B1 38 B2 32 Cấu trúc số liệu Stat ANOVA General Linear Model Chọn OK ñể có kết General Linear Model: SLS versus KHOI; A; B Factor KHOI A B Type random fixed fixed Levels Values 1; 2; 1; 2; 3; 1; Analysis of Variance for SLS, using Adjusted SS for Tests Source KHOI A KHOI*A B A*B Error Total DF 23 Seq SS 212.583 71.167 26.083 8.167 5.833 18.000 341.833 Adj SS 212.583 71.167 26.083 8.167 5.833 18.000 Adj MS 106.292 23.722 4.347 8.167 1.944 2.250 F 24.45 5.46 1.93 3.63 0.86 P 0.001 0.038 0.191 0.093 0.498 Lưu ý: Trong ví dụ nêu khối ñược coi yếu tố ngẫu nhiên ô Random factor ñã khai báo yếu tố khối (KHOI) Tương tác khối yếu tố A (KHOI*A) sai số ô lớn Chính giá trị F = 5,46 thương MS(A) / MS(KHOI*A) = 23,722/4,347 Bài tập Thiết kế thí nghiệm 44 Trong kết phân tích ta quan tâm ñến xác suất ñối với yếu tố A, B tương tác A*B Các giá trị 0,038; 0,093 0,498 Với giá trị ta kết luận suất sữa có khác bãi chăn thả (P < 0,05), nhiên việc bổ sung khoáng chất không làm ảnh hưởng ñến suất sữa ảnh hưởng tương tác bãi chăn thả việc bổ sung khoáng (P > 0,05) Ví dụ M-1.12b: Xem xét ví dụ M-1.12a, giả sử thí nghiệm ñược thực khối có yếu tố A B ñược thiết kê 12 ô lớn Năng suất sữa trung bình ñược ghi lại sau (kg /ngày): 10 11 12 A4 A1 A2 A3 A2 A1 A4 A3 A1 A2 A4 A3 B2 30 B1 29 B2 27 B1 25 B1 26 B2 28 B2 26 B1 24 B1 32 B2 37 B2 30 B1 31 Cấu trúc số liệu B1 34 B2 37 Stat B1 33 B2 32 ANOVA B2 34 B1 31 B1 30 B2 31 B2 36 B1 38 B1 33 B2 32 General Linear Model Chọn OK ñể có kết quả: General Linear Model: SLS versus A; B; O Factor A O(A) B Type fixed random fixed Levels 12 Values 1; 2; 3; 2; 6; 9; 3; 5; 10; 4; 8; 12; 1; 7; 11 1; Analysis of Variance for SLS, using Adjusted SS for Tests Source A O(A) B A*B Error Total DF 8 23 Seq SS 71.167 238.667 8.167 5.833 18.000 341.833 Adj SS 71.167 238.667 8.167 5.833 18.000 Adj MS 23.722 29.833 8.167 1.944 2.250 F 0.80 13.26 3.63 0.86 P 0.530 0.001 0.093 0.498 Trong ví dụ này, yếu tố ô (O) ñược coi ngẫu nhiên Ô nested yếu tố A Sai số ô lớn O(A) Chính mà giá trị F yếu tố A ñược tính 23,722/ 29,833 = 0,80 Ba giá trị xác suất quan tâm ñến bao gồm 0,530; 0,093 0,498 tương ứng với yếu tố A, B tương tác A*B Với cách thiết kế thí nghiệm theo mô hình thứ (M-1.12b) ta ñã không tìm thấy ảnh hưởng yếu tố (P > 0,05) Phần B Ứng dụng Minitab 45 Bài Tương quan hồi quy ðể tính hệ số tương quan xây dựng phương trình hồi quy, số liệu phải tạo thành cặp ñược nhập vào cột ñối tiêu Ví dụ M-1.11: Tiến hành cân khối lượng (P), ño ñường kính lớn (D) ñường kính bé (d) 22 trứng gà Số liệu thu ñược trình bày bảng ñây P (gram) 66,80 60,10 71,20 61,60 61,20 59,00 67,90 59,00 51,50 62,60 64,20 D (mm) 58,37 54,95 60,58 56,73 57,36 53,26 57,07 58,17 52,28 55,62 56,82 d (mm) 45,12 44,35 45,56 44,34 43,57 44,86 46,27 42,82 41,91 44,95 44,79 P (gram) 71,20 54,20 54,50 69,10 55,90 66,00 68,00 62,00 56,70 67,00 53,80 D (mm) 61,15 54,24 54,99 60,99 54,41 58,19 59,93 56,80 55,66 58,49 52,44 d (mm) 46,00 42,58 42,32 44,85 42,62 45,69 45,50 44,20 42,41 45,56 43,38 Cấu trúc số liệu Worksheet Lưu ý: ðể tính hệ số tương quan xây dựng phương trình hồi quy, số liệu phải tạo thành cặp ñược nhập vào cột ñối tiêu 1) Cột Khối lượng C1 (KL) 2) Cột ðường kính lớn C2 (DL) 3) Cột ðường kính bé C3 (DB) Hệ số tương quan Giả thiết ñối với kiểm ñịnh hai phía H0: ρ = ñối thiết H1: ρ ≠ 0, ñó ρ tương quan biến nghiên cứu Stat Basic Statistics Correlation Chọn OK ñể có kết Correlations: KL; DL; DN DL DN KL 0.897 0.000 DL 0.905 0.000 0.648 0.001 Cell Contents: Pearson correlation P-Value Chọn Display p-values ñể hiển thị xác suất ñối với hệ số tương quan Chọn Store matrix (display nothing) ñể nhớ ma trận hệ số tương quan vào nhớ ñệm không hiển thị kết hình Hệ số tương quan khối lượng ñường kính lớn 0,897; khối lượng ñường kính bé 0,905; ñường kính lớn ñường kính bé 0,648 Xác suất ñối với hệ số tương quan (p-values) ñều bé 0,05 (α) kết luận mối quan hệ tiêu khác Bài tập Thiết kế thí nghiệm 46 Phương trình hồi quy tuyến tính Có thể xây dựng hồi quy ñơn biến y = a + bx ña biến y = a + b1x1 + b2x2 + +bnxn Có thể xây dựng phương trình hồi tuyến tính ñơn biến quy ước tính khối lượng trứng thông qua ñường kính lớn/ñường kính bé ña biến thông qua ñường kính lớn ñường kính bé Stat Regression Regression Response: Khai báo cột C1 (KL) biến phụ thuộc Predictors: Khai báo cột C2 (DL) biến ñộc lập Chọn OK ñể có kết Regression Analysis: KL versus DL The regression equation is KL = - 53.7 + 2.04 DL Predictor Constant DL Coef -53.67 2.0379 S = 2.69651 SE Coef 12.78 0.2250 R-Sq = 80.4% T -4.20 9.06 P 0.000 0.000 R-Sq(adj) = 79.4% Analysis of Variance Source Regression Residual Error Total DF 20 21 SS 596.60 145.42 742.02 MS 596.60 7.27 F 82.05 P 0.000 Unusual Observations Obs DL 57.1 58.2 KL 67.900 59.000 Fit 62.629 64.871 SE Fit 0.579 0.658 Residual 5.271 -5.871 St Resid 2.00R -2.25R R denotes an observation with a large standardized residual Phương trình hồi quy ước tính khối lượng (Y) thông qua ñường kính lớn (X) Y = -53,7 + 2,04X Bảng thứ phần kết kiểm ñịnh hệ số phương trình hồi quy Với xác suất P = 0,000 ta kết luận hệ số phương trình hồi quy khác (P < 0,05) Hệ số xác ñịnh phương trình R² = 80,4%, hiệu chỉnh R² = 79,4% Phần B Ứng dụng Minitab 47 Các quan sát ngoại lai (Unusual Observations) mô hình ví dụ nêu Các giá trị hàng thứ ví dụ ñược coi ngoại lai Stat Regression Regression Predictors: Khai báo cột C2 (DL) C3 (DN) biến ñộc lập ðể xây dựng phương trình hồi quy ña biến, biến ñộc lập bao gồm từ biến Chọn OK ñể có kết Regression Analysis: KL versus DL; DN The regression equation is KL = - 117 + 1.21 DL + 2.48 DN Predictor Constant DL DN Coef -116.555 1.21473 2.4764 S = 0.759757 SE Coef 5.472 0.08323 0.1623 R-Sq = 98.5% T -21.30 14.60 15.26 P 0.000 0.000 0.000 R-Sq(adj) = 98.4% Analysis of Variance Source Regression Residual Error Total Source DL DF DF 19 21 SS 731.05 10.97 742.02 MS 365.53 0.58 F 633.24 P 0.000 Seq SS 596.60 Ta có kết hoàn toàn tương tự việc xây dựng phương trình hồi quy ñơn giản Y = - 117 + 1.21X1 + 2.48X2 Trong ñó: Y = khối lượng trứng, X1 = ñường kính lớn X2 = ñường kính bé ðiều khác biệt trường hợp hệ số xác ñịnh R² = 98,5% lớn nhiều so với trường hợp ñơn biến R² = 80,4% Bài tập Thiết kế thí nghiệm 48 Bài Bảng tương liên Khi so sánh tỷ lệ nghiên cứu mối liên hệ yếu tố ñối với biến ñịnh tính ta ñặt giả thiết H0: Không có sai khác có ý nghĩa thống kê tỷ lệ Không có mối liên hệ yếu tố (tuỳ theo mục tiêu toán ñặt ra) Ví dụ M-1.12: Một thí nghiệm ñược tiến hành nhằm ñánh giá liên hệ tỷ lệ viêm nội mạc tử cung giống Trong tổng số 700 bò sữa nghiên cứu tập (cohort studies), có 500 giống Holstein Friesian 200 giống Jersey Kết nghiên cứu thu ñược sau: Cấu trúc nhập số liệu vào Minitab tương tự mục 2.2 Giống Viêm nội mạc tử cung Tổng số Có Holstein Jersey Tổng số Stat Tables Square Không 100 400 500 10 190 200 110 590 700 Cross Tabulation and Chi- Chọn Chi-Square (χ²) tần suất ước tính ≥ Other Stats tần suất ước tính ô < Chi-Square Analysis – phân tích χ² Expected cell count - tần suất ước tính ô Fisher’s exact test for 2× ×2 table – phép thử xác Fisher ñối với bảng 2×2 Khi sử dụng Chi-Square , giá trị ô ước tính bé 5, Minitab có dòng lệnh cảnh báo: * NOTE * cells with expected counts less than Phần B Ứng dụng Minitab 49 Trong trường hợp ta cần sử dụng Other Stats Với lựa chọn ta có phần Output tương tự Chọn OK ñể có kết Tabulated statistics: GIONG; KETQUA Using frequencies in TANSUAT Rows: GIONG Columns: KETQUA - + All H 400 80.00 421.4 100 20.00 78.6 500 100.00 500.0 J 190 95.00 168.6 10 5.00 31.4 200 100.00 200.0 All 590 84.29 590.0 110 15.71 110.0 700 100.00 700.0 Cell Contents: Count % of Row Expected count Pearson Chi-Square = 24.268; DF = 1; P-Value = 0.000 Likelihood Ratio Chi-Square = 29.054; DF = 1; P-Value = 0.000 Trong phần kết ñối với ô ta có giá trị Ví dụ ñối với ô thứ là: 1) Tần suất quan sát (400), 2) Phần trăm theo hàng (80%) 3) tần suất ước tính (421,4) Giá trị Chi-Square χ² = 24,268, bậc tự DF = xác suất P-value = 0,000 Với xác suất giả thiết H0 bị bác bỏ kết luận Có mối liên hệ bệnh viêm nội mạc tử giống bò (P< 0,001) Bài tập Thiết kế thí nghiệm 50 Bài Dung lượng mẫu 8.1 Ước lượng kiểm ñịnh giá trị trung bình Ví dụ M-1.13: Cần quan sát bò sữa ñể ước tính ñược suất chu kỳ tiết sữa 305 ngày với mức ñộ tin cậy 95% nằm khoảng ± 75kg so với giá trị thực quần thể Biết sản lượng sữa có phân bố chuẩn σ = 500kg 8.2 Ước lượng kiểm ñịnh tỷ lệ Ví dụ M-1.14: Cần dung lượng mẫu ñể xác ñịnh tỷ lệ nhiễm loại vi khuẩn thân thịt lợn lò mổ với ước tính chênh lệch không 5% Biết tỷ lệ hành p = 0,2 kiểm ñịnh mức tin cậy 95% 8.3 Kiểm ñịnh hai giá trị trung bình Ví dụ M-1.15: Muốn thiết kế thí nghiệm ñể so sánh sản lượng sữa dê Bách Thảo công thức thí nghiệm với yêu cầu α = 0,05; β = 0,2; chênh lệch mong ñợi 30 kg sữa biết σ = 50 kg 8.4 Kiểm ñịnh hai tỷ lệ Ví dụ M-1.16: Một tiến cứu ñược tiến hành ñể nghiên cứu tỷ lệ tổn thương núm vú bò sữa hệ thống vắt sữa tự ñộng (A) hệ thống bình tay (B) Thời gian nghiên cứu ñược tiến hành 12 tháng với dự ñoán tỷ lệ tổn thương hệ thống B 34,5% (p1 = 0,345); α = 0,05; β = 0,20; n1 = n2 Biết tỷ lệ tổn thương hệ thống vắt sữa tự ñộng 15% (p2 = 0,15) Hãy tính dung lượng mẫu cần thiết ñối với nhóm ñể thoả mãn ñiều kiện toán

Ngày đăng: 15/05/2017, 07:28

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan