Bài Tập Xác Suất Thống Kê (Có Lời Giải)

18 2 0
Tài liệu đã được kiểm tra trùng lặp
Bài Tập Xác Suất Thống Kê (Có Lời Giải)

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Trang 1

Đ i H c Qu c Gia Thành Ph H Chí Minhại Học Quốc Gia Thành Phố Hồ Chí Minhọc Quốc Gia Thành Phố Hồ Chí Minhốc Gia Thành Phố Hồ Chí Minhốc Gia Thành Phố Hồ Chí Minh ồ Chí MinhTrường Đại Học Bách Khoa TPHCMng Đ i H c Bách Khoa TPHCMại Học Quốc Gia Thành Phố Hồ Chí Minhọc Quốc Gia Thành Phố Hồ Chí Minh

BÀI T P L N MÔN: XÁC SU T TH NG KÊẬP LỚN MÔN: XÁC SUẤT THỐNG KÊỚN MÔN: XÁC SUẤT THỐNG KÊẤT THỐNG KÊỐNG KÊ

Đ TÀI 3Ề TÀI 3

Gi ng viên : Hoàng Văn Hàảng viên : Hoàng Văn Hà

Trương Gia Kiệtng Gia Ki tệt2013584

Nguy n Hoàng B o Hânễn Hoàng Bảo Hânảo Hân2010246Nguy n Th Thanh Tuy nễn Hoàng Bảo Hânị Vân Anhền2010760

Trang 2

BÁO CÁO PHÂN CÔNG NHIỆM VỤ CỦA NHÓM 3

3Nguy n Hoàng B o Hânễn Hoàng Bảo Hânảo Hân2010246Hoạt động 24Nguy n Th Thanh Tuy nễn Hoàng Bảo Hânị Vân Anhền2010760Hoạt động 2

Trang 4

Hoạt động 1

1)Đọc dữ liệu , khai biến và làm sạch dữ liệu trong R

Sau khi đọc bảng dữ liệu ta nhận xét rằng dữ liệu bao gồm 78 đối tượng tham gia và có7 biến bao gồm :

- Person: số thứ tự của người tham gia thử nghiệm - gender: giới tính của người tham gia (1 = nam, 0 = nữ) - Age: tuổi (năm)

- Height: chiều cao (cm)

- pre.weight: cân nặng trước khi áp dụng chế độ ăn kiêng (kg) - Diet: chế độ ăn kiêng (3 chế độ khác nhau)

- weight6weeks: cân nặng sau 6 tuần ăn kiêng

Ta khai biến trong R:

Ta nhận thấy trong bảng dữ liệu ở đối tượng 25 và 26 còn trống ô ở mục gender do đóta cần gán giá trị cho nó Nhìn vào dataframe của data, ta nhận ra rằng giá trị của biếngender được liệt kê với giá trị 0 trước 1 sau, và sẽ lặp lại khi biến Diet thay đổi giá trị

Trang 5

Với logic này, đề xuất gán các giá trị NA tại ô thứ 25, 26 của biến gender bằng

giá trị 0 Thay 0=Nữ và 1= Nam cho cột gender.ta được bảng dữ liệu data hoàn chỉnhtrong R như sau:

Trang 7

2) Làm rõ dữ liệu

Ta thực hiện phân tích mẫu dựa trên yếu tố về giới tính và so sánh về số lượng quabiểu đồ barplot:

Trang 8

Tính toán các Thống kê mô tả của mẫu:

Dùng các lệnh summary và desc.

R không có hàm tính sai số chuẩn, và trong hàm summary, R cũng không cung cấp độlệch chuẩn Để có các số này, chúng ta có thể tự viết một hàm đơn giản (hãy gọi làdesc) như sau:

desc <- function(x)

{ av <- mean(x) sd <- sd(x) se <- sd/sqrt(length(x)) c(MEAN=av, SD=sd, SE=se) }

Trang 9

Ta thực hiện vẽ đồ thị của các biến trong data như sau:

Trang 10

Ta tiếp đến phân loại ra ba chế độ ăn khác nhau:

Ta có ba bảng liệt kê mỗi chết độ ăn như sau:

Trang 12

Đồ thị của 3 chế độ ăn trên đường tròn :

Trang 13

Tính toán thống kê của 3 chế độ ăn thông qua lệnh summary.dataframe:

Tiếp đến ta so sánh sự hiệu quả giữa 3 chế độ ăn ( thông qua lượng cân nặng mất đi = cân nặng trước khi tham gia – cân nặng sau 6 tuần) Thực hiện các câu lệnh để tìm cân nặng mất đi( weightloss) và sử dụng biểu đồ boxplot để so sánh:

Trang 14

NHẬN XÉT

CÂN NẶNG GIẢM ĐƯỢC THÔNG QUA CHẾ ĐỘ 1:

- Có 25% cân nặng giảm ít hơn hoặc bằng 2 - Có 50% cân nặng giảm ít hơn hoặc bằng 3 - Có 75% cân nặng giảm ít hơn hoặc bằng 4 - Cân nặng giảm nhiều nhất khoảng 7 (IQR ≈ 2) - Cân nặng giảm ít nhất khoảng -1

- Có thể có các giá trị ngoại vi trên giá trị cao nhất

CÂN NẶNG GIẢM ĐƯỢC THÔNG QUA CHẾ ĐỘ 2:

- Có 25% cân nặng giảm ít hơn hoặc bằng 1.9 - Có 50% cân nặng giảm ít hơn hoặc bằng 3.4 - Có 75% cân nặng giảm ít hơn hoặc bằng 4.2

- Cân nặng giảm nhiều nhất khoảng 7.65 (IQR ≈ 2.3) - Cân nặng giảm ít nhất khoảng -1.55

CÂN NẶNG GIẢM ĐƯỢC THÔNG QUA CHẾ ĐỘ 3:

- Có 25% cân nặng giảm ít hơn hoặc bằng 3.5 - Có 50% cân nặng giảm ít hơn hoặc bằng 5.5 - Có 75% cân nặng giảm ít hơn hoặc bằng 7

- Cân nặng giảm nhiều nhất khoảng 12.25 (IQR ≈ 3.5) - Cân nặng giảm ít nhất khoảng -1.75.

Trang 15

3) Dùng kiểm định t.test cho hai biến pre.weight và weight6weeks

Trang 16

4) ANOVA một nhân tố: Chế độ ăn kiêng Diet nào hiệu quả

nhất trong việc giảm cân.

Chúng ta cần kiểm tra nhân tố chính đó là Diet bao gồm 3 mức : chế độ ăn kiêng 1,2và 3 (diet_1,diet_2,diet_3).Để xác đinh chế độ ăn kiêng nào hiệu quả nhất chúng ta cầnphải dựa vào biến weightloss ở 3 chế độ.

Lập bảng phương sai ANOVA với x là lượng cân giảm và group là nhóm, ta được bảng dữ liệu như bên dưới :

Trang 17

Phân tích anova bảng dữ liệu bằng lệnh aov ta xác định được các giá trị như: sự biếnthiên giữa các nhóm (SSB), sự biến thiên trong từng nhóm (SSW) , trung bình phươnggiữa các nhóm và trong từng nhóm , thống kê F:

So sánh sự hiệu quả giữa 3 chế độ ăn trông qua biến cân nặng trung bình giữa 3 chế độvà LSD.

Trang 18

5) ANOVA hai nhân tố: Chế dộ ăn kiêng Diet và giới tínhgender ảnh hưởng thế nào đến việc giảm cân weightlost

Ngày đăng: 17/05/2024, 15:03

Tài liệu cùng người dùng

Tài liệu liên quan