Bài tập lớn thống kê ứng dụng

38 4.8K 60
Bài tập lớn thống kê ứng dụng

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI VIỆN KINH TẾ VÀ QUẢN LÝ - o0o - TIỂU LUẬN HỌC PHẦN THỐNG KÊ ỨNG DỤNG Giảng viên hướng dẫn : Ths Lê Văn Hòa Nhóm sinh viên : Phạm Hồng Thương 20136566 : Nguyễn Thị Thùy Linh 20135898 : Trần Thị Thảo 20136440 : Dương Văn Thắng 20136451 : Tống Bá Đạt 20135323 : Đỗ Ngọc Sơn 20136314 Hà Nội – Tháng 10/2015 LỜI CẢM ƠN Thống kê ứng dụng môn học cần thiết học tập giảng dạy giáo dục đại học Việt Nam nói chung sinh viên ngành kinh tế nói riêng Đặc biệt sinh viên chuyên ngành khối kinh tế - xã hội Những tình thực tế giúp sinh viên hiểu sâu hiểu kĩ lý thuyết hơn, vận dụng học vào tình cụ thể mà sau gặp công việc Làm quen với thách thức cần phải đưa định dự án kinh doanh doanh nghiệp mà công tác Để hoàn thành tiểu luận này, nhóm chúng em nỗ lực nhiều chúng em xin gửi lời cảm ơn sâu sắc tới thầy giáo, Thạc sĩ Lê Văn Hòa, môn Quản trị kinh doanh Viện Kinh tế Quản lý, Trường Đại học Bách khoa Hà Nội đồng hành chúng em suốt trình nghiên cứu học tập, cảm ơn thầy tận tình giảng dạy truyền thụ kiến thức, kinh nghiệm phong cách trình bày, để chúng em có thêm học quý báu Do chưa có hội va chạm tiếp xúc với môi trường thực tế kinh doanh nên nhóm chưa hiểu rõ hiểu sai yêu cầu tình huống, làm sai sót, mong nhận góp ý sửa chữa thầy bạn Chúng em xin trân trọng cảm ơn! Hà Nội ngày tháng 10 năm 2015 Nhóm thực MỤC LỤC Lời cảm ơn .1 Tình 1:Công ty sô-cô-la Heavenly Chocolates Tóm tắt liệu đồ thị tham số thống kê mô tả 1.1.Đối với thời gian truy cập website công ty 1.2.Đối với số trang đọc 1.3.Đối với số tiền chi tiêu bình quân giao dịch Tóm tắt tần số số tiền chi tiêu số tiền chi tiêu bình quân giao dịch theo ngày thứ tuần 3.Tóm tắt tần số số tiền chi tiêu số tiền chi tiêu bình quân giao dịch theo loại trình duyệt web sử dụng 4.Sự liên hệ thời gian truy cập website số tiền chi tiêu 4.1.Biểu đồ thể mối liên hệ gian thời gian truy cập website số tiền chi tiêu 10 5.Mối liên hệ số trang xem website số tiền chi tiêu .10 5.1.Biểu đồ thể mối liên hệ số trang xem website số tiền chi mua hàng .11 6.Sự liên hệ thời gian truy cập website với số trang xem .11 6.1.Biểu đồ thể liên hệ thời gian truy cập website số trang xem 11 Tình 2: .12 Công ty sản xuất đồ chơi trẻ em Specialty Toys 12 1.Đồ thị phân phối 12 2.Xác suất hết hàng phương án đặt hàng đề 13 3.Lơi nhuận kì vọng 14 3.1 Giả định bán 10000 sản phẩm 14 3.2 Giả định bán 20000 sản phẩm 14 3.3 Giả định bán 30000 sản phẩm 14 4.Lợi nhuận dự kiến 15 5.Khuyến nghị 16 Tình 3:Công ty nghiên cứu thị trường Metropolitan Research(Chapter 8, Auto) .17 1.Phân tích thông kê mô tả 17 2.Ước lượng trung bình khoảng 18 Thảo luận hàm ý .18 4.Xác định cỡ mẫu .19 5)Thông tin thêm 19 Tình huống4:Thu nhập nhân viên bán hàng(Chapter 13, SalesSalary) 20 1.Phân tích thống kê mô tả 20 2.Ước lượng khoảng trung bình 20 3.Ước lượng khoảng trung bình nhân viên bán hàng doanh nghiệp 21 4.Ước lượng khoảng trung bình nhân viên bán hàng thực địa 21 5.Kiểm định giả thuyết 22 6.Kiểm định giả thuyết 23 7.Kiểm định giả thuyết 25 Tình 5:Chi tiêu qua thẻ tín dụng người tiêu dùng(Chapter 15, Consumer) 27 1.Thống kê mô tả 27 2.Xây dựng phương trình hồi qui mẫu 27 3.Xây dựng phương trình hồi quy bội 34 4.Dự báo .36 5.Thông tin thêm 36 TÀI LIỆU THAM KHẢO .37 Tình 1: Công ty sô-cô-la Heavenly Chocolates (Chapter 3, Shopper) Bài làm Tóm tắt liệu đồ thị tham số thống kê mô tả Đối với thời gian truy cập website công ty Cumulative Bin Frequency % 4-10 17 34.00% 10-16 22 78.00% 16-22 90.00% 22-28 96.00% 28-34 100.00% More 100.00% Histogram 25 Frequency 1.1 120.00% 100.00% 80.00% 60.00% 40.00% 20.00% 0.00% 20 15 10 Frequency Cumulative % Descriptive statistics Time (min) Count 50 Mean 12.810 sample standard deviation 6.063 sample variance 36.764 minimum 4.3 maximum 32.9 Range 28.6 Sum 640.500 sum of squares 10,006.230 deviation sum of squares (SSX) 1,801.425 standard error of the mean 0.857 skewness 1.450 kurtosis 2.404 coefficient of variation (CV) 47.33% 1st quartile 8.650 Median 11.400 3rd quartile 14.900 interquartile range 6.250 Mode 11.400 low extremes low outliers high outliers high extremes Nhận xét: Thời gian truy cập website khách hàng chủ yếu 16 phút, chiếm tới 78% 1.2 Đối với số trang đọc Bin Frequency Cumulative % 2-4 25 50.00% 4-6 15 80.00% 6-8 94.00% 8-10 100.00% More 100.00% Frequency Histogram 30 150.00% 20 100.00% 10 50.00% 0.00% 2-4 4-6 6-8 Frequency Cumulative % 8-10 More Bin Descriptive statistics Pages Viewed count 50 mean 4.82 sample standard deviation 2.04 sample variance 4.15 minimum maximum 10 range sum 241.00 sum of squares 1,365.00 deviation sum of squares (SSX) 203.38 standard error of the mean 0.29 skewness 0.65 kurtosis 0.17 coefficient of variation (CV) 42.27% 1st quartile 3.25 median 4.50 3rd quartile 6.00 interquartile range 2.75 mode 4.00 low extremes low outliers high outliers high extremes Nhận xét: Số lượng trang mà khách hàng xem khiêm tốn, chủ yếu từ đến trang, chiếm 80% Đối với số tiền chi tiêu bình quân giao dịch Bin Frequency Cumulative % 17-46 14 27.45% 46-75 23 72.55% 75-104 86.27% 104-133 94.12% 133-162 100.00% More 100.00% Histogram Frequency 1.3 30 20 10 150.00% 100.00% 50.00% 0.00% Frequency Cumulative % Bin Descriptive statistics Amount Spent ($) count 50 mean 68.1282 sample standard deviation 32.3438 sample variance 1,046.1187 minimum 17.84 maximum 158.51 range 140.67 sum 3,406.4100 sum of squares 283,332.3967 deviation sum of squares (SSX) 51,259.8149 standard error of the mean 4.5741 skewness 1.0490 kurtosis 0.8765 coefficient of variation (CV) 47.47% 1st quartile 45.5600 median 62.1500 3rd quartile 82.7350 interquartile range 37.1750 mode #N/A low extremes low outliers high outliers high extremes Nhận xét: Khách hàng chi tiêu chủ yếu mức 75$, chiếm 72.55% tổng lượng tiền chi tiêu cho mua hàng online Tóm tắt tần số số tiền chi tiêu số tiền chi tiêu bình quân giao dịch theo ngày thứ tuần Thứ Số giao dịch Tổng số tiền($) Tần số(%) Số tiền bình quân($) Mon 813.38 25.88 90.38 Tue 414.86 13.20 59.27 Wed 341.82 10.87 56.97 Thu 294.03 9.35 58.81 Fri 11 682.24 21.71 62.02 Sat 378.74 12.05 54.11 Sun 218.15 6.94 43.63 Tổng 50 3143.22 100.00 Nhận xét: Qua bảng số liệu trên, ta thấy lượng khách mua hàng vào ngày thứ thứ lớn, kéo theo số tiền chi tiêu lớn Trong đó, ngày chủ nhật thứ 5, số lần giao dịch hơn, lượng tiền chi tiêu ngày khác Tóm tắt tần số số tiền chi tiêu số tiền chi tiêu bình quân giao dịch theo loại trình duyệt web sử dụng Số giao Loại trình duyệt dịch Tổng số tiền($) Tần số(%) Số tiền bình quân($) Internet Explorer 27 1656.81 48.64 61.36 Firefox 16 1228.21 36.05 76.76 Other 521.39 15.31 74.48 Tổng 50 3406.41 100.00 Nhận xét: Khách hàng chủ yếu sử dụng trình duyệt Internet Explorer để truy cập website, số tiền khách hàng chi tiêu cho mua hàng online trình duyệt web lớn trình duyệt lại Tuy nhiên số tiền chi bình quân cho giao dịch lại thấp Firefox trình duyệt web khác Sự liên hệ thời gian truy cập website số tiền chi tiêu Comparison of Groups 100,000.0 90,000.0 80,000.0 70,000.0 60,000.0 50,000.0 40,000.0 inside outside p-value bác bỏ H0  Với độ tin cậy 95% có đủ chứng thống kê để bác bỏ giả thuyết H0, có khác thu nhập nhân viên bán hàng doanh nghiệp (inside) nhân viên bán hàng thực địa (outside) Kiểm định giả thuyết n=40>30 => Trung bình mẫu xấp xỉ phân phối normal H0: µ1=µ2=µ3, Thu nhập số năm kinh nghiệm H1: Có khác thu nhập số năm kinh nghiệm One factor ANOVA Mean n Std Dev 59,819.6 40 6,005.06 low 68,618.1 40 13,621.38 medium 66,338.7 40 9,699.51 high 64,925.5 120 10,838.67 Total ANOVA 23 table Source SS df Treatment 1,668,100,099.40 Error 12,311,642,892.53 117 Total 13,979,742,991.93 119 MS F 834,050,049.700 7.93 p-value 0006 105,227,717.030 p-value=0.0006 < α=0.05 => bác bỏ H0=> Với độ tin cậy 95% có đủ chứng thống kê để bác bỏ giả thuyết H0, có khác thu nhập số năm kinh nghiệm Phân tích sâu ANOVA: Post hoc analysis p-values for pairwise ttests low high medium 59,819.6 66,338.7 68,618.1 low 59,819.6 high 66,338.7 0053 medium 68,618.1 0002 3224 Tukey simultaneous comparison t-values (d.f = 117) low high medium 59,819.6 66,338.7 68,618.1 low 59,819.6 high 66,338.7 2.84 medium 68,618.1 3.84 0.99 critical values for experimentwise error rate: 0.05 2.38 0.01 2.97 24 p-valuelow-high=0.0053 < α=0.05 => Có khác thu nhập người có kinh nghiệm thấp người có kinh nghiệm cao p-valuelow-medium=0.0002 Có khác thu nhập người có kinh nghiệm thấp người có kinh nghiệm trung bình Kiểm định giả thuyết H0 : - Thu nhập vị trí công tác - Thu nhập số năm kinh nghiệm - Không có ảnh hưởng tương tác vị trí công tác số năm kinh nghiệm H1 : - Có khác thu nhập vị trí công tác - Có khác thu nhập số năm kinh nghiệm - Có ảnh hưởng tương tác vị trí công tác số năm kinh nghiệm Two factor ANOVA Factor Means: Factor low medium high inside 55,031.4 55,607.8 57,422.5 56,020.5 outside 64,607.9 81,628.5 75,254.9 73,830.4 59,819.6 68,618.1 66,338.7 64,925.5 replications 20 per cell ANOVA table pSource SS df MS F value 5.32E- Factor 9,515,793,950.21 9,515,793,950.208 751.36 52 Factor 1,668,100,099.40 834,050,049.700 9.76E- 25 65.86 20 4.37EInteraction 1,352,066,184.47 676,033,092.233 Error 1,443,782,757.85 114 12,664,761.034 Total 13,979,742,991.93 119 53.38 17 p-value bác bỏ H0  Với độ tin cậy 95%, có đủ chứng thống kê để bác bỏ giả thuyết H0, vậy: - Có khác thu nhập vị trí công tác - Có khác thu nhập số năm kinh nghiệm - Có ảnh hưởng tương tác vị trí công tác số năm kinh nghiệm 26 Tình 5: Chi tiêu qua thẻ tín dụng người tiêu dùng (Chapter 15, Consumer) Bài làm 1.Thống kê mô tả Amount Income Household Charged ($1000s) Size ($) count 50 50 50 Số quan sát mean 43.48 3.42 3,964.06 Giá trị trung bình deviation 14.55 1.74 933.49 Độ lệch chuẩn sample variance 211.72 3.02 871,411.20 Phương sai mẫu minimum 21 1864 maximum 67 5678 range 46 3814 Khoảng biến thiên 1st quartile 30.25 2.00 3,130.50 Tứ phân vị thứ sample standard Trung vị (Tứ phân vị median 42.00 3.00 4,090.00 thứ 2) 3rd quartile 54.75 4.75 4,732.75 Tứ phân vị thứ interquartile range 24.50 2.75 1,602.25 Độ trải mode 54.00 2.00 3,890.00 Nhận xét: n=50>30 =>theo định lý giới hạn trung tâm, trung bình mẫu xấp xỉ phân phối normal Xây dựng phương trình hồi qui mẫu * Thu nhập làm biến độc lập Lập bảng tính 27 i x(i) y(i) ̅ xi-𝒙 ̅ yi - 𝒚 ̅)(yi-𝒚 ̅) ( xi-𝒙 ̅)^2 (xi-𝒙 ̅)^2 ( yi-𝒚 ̂ i-𝒚 ̅)^2 (𝒀 54 4,016 10.52 51.940 546.409 110.670 2,697.764 181348.223 30 3,159 -13.48 -805.060 10852.209 181.710 648,121.604 297755.749 32 5,100 -11.48 1,135.940 -13040.591 131.790 1,290,359.684 215955.384 50 4,742 6.52 777.940 42.510 605,190.644 5072.169 69659.045 31 1,864 -12.48 2,100.060 26208.749 155.750 4,410,252.004 255216.936 55 4,070 11.52 105.940 132.710 11,223.284 1220.429 217463.669 37 2,731 -6.48 1,233.060 7990.229 41.990 1,520,436.964 68806.536 40 3,348 -3.48 -616.060 2143.889 12.110 379,529.924 19844.357 66 4,764 22.52 799.940 18014.649 507.150 639,904.004 831032.792 10 51 4,110 7.52 145.940 1097.469 56.550 21,298.484 92665.448 11 25 4,208 -18.48 243.940 -4508.011 341.510 59,506.724 559608.725 12 48 4,219 4.52 254.940 1152.329 20.430 64,994.404 33478.021 271.590 2,211,347.444 445035.752 13 27 2,477 -16.48 1,487.060 24506.749 - 14 33 2,514 -10.48 1,450.060 15196.629 109.830 2,102,674.004 179971.093 15 65 4,214 21.52 249.940 463.110 62,470.004 16 63 4,965 19.52 1,000.940 19538.349 381.030 1,001,880.884 624368.629 17 42 4,412 -1.48 447.940 2.190 200,650.244 5378.709 -662.951 758867.477 3589.208 18 21 2,448 -22.48 1,516.060 34081.029 505.350 2,298,437.924 828081.800 19 44 2,995 0.52 -969.060 -503.911 0.270 939,077.284 443.102 20 37 4,171 -6.48 206.940 -1340.971 41.990 42,824.164 68806.536 21 62 5,678 18.52 1,713.940 31742.169 342.990 2,937,590.324 562035.096 22 21 3,623 -22.48 -341.060 505.350 116,321.924 23 55 5,301 11.52 1,336.940 15401.549 132.710 1,787,408.564 217463.669 7667.029 28 828081.800 24 42 3,020 -1.48 -944.060 1397.209 2.190 891,249.284 3589.208 25 41 4,828 -2.48 863.940 -2142.571 6.150 746,392.324 10078.152 26 54 5,573 10.52 1,608.940 16926.049 110.670 2,588,687.924 181348.223 27 30 2,583 -13.48 1,381.060 18616.689 181.710 1,907,326.724 297755.749 28 48 3,866 4.52 -98.060 -443.231 20.430 9,615.764 33478.021 29 34 3,586 -9.48 -378.060 3584.009 89.870 142,929.364 147264.063 30 67 5,037 23.52 1,072.940 25235.549 553.190 1,151,200.244 906475.368 31 50 3,605 6.52 -359.060 42.510 128,924.084 32 67 5,345 23.52 1,380.940 32479.709 553.190 1,906,995.284 906475.368 33 55 5,370 11.52 1,405.940 16196.429 132.710 1,976,667.284 217463.669 34 52 3,890 8.52 -74.060 -630.991 72.590 5,484.884 118949.112 35 62 4,705 18.52 740.940 13722.209 342.990 548,992.084 562035.096 36 64 4,157 20.52 192.940 3959.129 421.070 37,225.844 689979.422 37 22 3,579 -21.48 -385.060 8271.089 461.390 148,271.204 756047.640 38 29 3,890 -14.48 -74.060 1072.389 209.670 5,484.884 343571.823 39 39 2,972 -4.48 -992.060 4444.429 20.070 984,183.044 32887.823 40 35 3,121 -8.48 -843.060 7149.149 71.910 710,750.164 117834.293 41 39 4,183 -4.48 218.940 -980.851 20.070 47,934.724 32887.823 42 54 3,730 10.52 -234.060 -2462.311 110.670 54,784.084 181348.223 43 23 4,127 -20.48 162.940 -3337.011 419.430 26,549.444 687290.741 -2341.071 69659.045 44 27 2,921 -16.48 1,043.060 17189.629 271.590 1,087,974.164 445035.752 45 26 4,603 -17.48 638.940 -11168.671 305.550 408,244.324 500683.608 46 61 4,273 17.52 308.940 5412.629 306.950 95,443.924 502978.824 47 30 3,067 -13.48 -897.060 12092.369 181.710 804,716.644 297755.749 48 22 3,074 -21.48 -890.060 19118.489 461.390 792,206.804 756047.640 49 46 4,820 2.52 855.940 2156.969 6.350 732,633.284 10406.040 50 66 5,149 22.52 1,184.940 26684.849 507.150 1,404,082.804 831032.792 tổng 2174 198,203 0 419956.560 10374.480 29 42699148.820 16999938.312 TS(b1) MS(b1) SST SSR 𝑥̅ = (∑xi)/n = 2174/50 = 43.48 𝑦̅ = (∑yi)/n = 198,203/50 = 3964.06 Phương trình hồi qui mẫu: 𝑌̂ = b0 + b1*x b1= TS(b1)/MS(b1) = 419956.560/10374.480 = 40.480 b0 = 𝑦̅ - b1*𝑥̅ = 3964.06 - 40.480*43.48 = 2203.990 PTHQ mẫu: 𝑌̂ = 2203.990 + 40.480*x SSR = 16,999,938.312 SST = 42,699,148.820 SSE = SST-SSR= 25,699,210.508 R^2 = SSR/SST = 16,999,938.312/ 42,699,148.820 = 0.398 => Khoảng 39.8% số tiền chi tiêu thẻ tín dụng phụ thuộc vào thu nhập Regression Analysis r² 0.398 n 50 r 0.631 k Std Error 731.713 Dep Var y(i) SS df MS F ANOVA table Source Regression 16,999,744.7860 16,999,744.7860 31.75 Residual 25,699,404.0340 48 535,404.2507 Total 42,699,148.8200 49 30 p-value 9.01E-07 Regression output confidence interval std variables coefficients error Intercept 2,203.9996 329.0489 x(i) 40.4798 7.1839 t (df=48) p-value 95% lower 95% upper 6.698 2.14E-08 1,542.4024 2,865.5968 5.635 9.01E-07 26.0357 54.9239 PTHQ tổng thể: Y = β0 + β1*X giả thuyết: H0: β1=0 H1: β1≠0 tiêu kiểm định tstat = b1/S(b1) = 5.635 t(α/2) = t(0.025;48) = 2.0106 Ta thấy tstat >t(α/2) => β1≠0 * Quy mô hộ gia đình làm biến độc lập Lập bảng tính ̅ )(yi(xi- 𝒙 ̅) 𝒚 ̅)^2 ( yi-𝒚 ̅)^2 ( xi-𝒙 ̂ i-𝒚 ̅)^2 (𝒀 -0.42 51.940 -21.8148 0.176 2,697.7636 28809.6308 3,159 -1.42 -805.060 1143.1852 2.016 648,121.6036 329317.5950 5,100 0.58 1,135.940 658.8452 1,290,359.6836 54940.5472 4,742 1.58 777.940 1229.1452 2.496 605,190.6436 407710.3445 1,864 -1.42 -2,100.060 2982.0852 2.016 4,410,252.0036 329317.5950 4,070 -1.42 105.940 11,223.2836 329317.5950 2,731 -2.42 -1,233.060 2984.0052 5.856 1,520,436.9636 956464.4401 3,348 -1.42 -616.060 874.8052 2.016 379,529.9236 329317.5950 4,764 0.58 799.940 463.9652 0.336 639,904.0036 54940.5472 10 4,110 -0.42 145.940 -61.2948 0.176 21,298.4836 28809.6308 11 4,208 -0.42 243.940 -102.4548 0.176 59,506.7236 28809.6308 12 4,219 0.58 147.8652 0.336 64,994.4036 54940.5472 13 2,477 -2.42 -1,487.060 3598.6852 5.856 2,211,347.4436 956464.4401 14 2,514 -1.42 -1,450.060 2059.0852 2.016 2,102,674.0036 329317.5950 i x(i) y(i) ̅ xi-𝒙 4,016 2 ̅ yi - 𝒚 254.940 -150.4348 31 0.336 2.016 15 4,214 -0.42 249.940 -104.9748 0.176 62,470.0036 28809.6308 16 4,965 0.58 1,000.940 580.5452 0.336 1,001,880.8836 54940.5472 17 4,412 2.58 447.940 1155.6852 6.656 200,650.2436 1087119.0225 18 2,448 -1.42 -1,516.060 2152.8052 2.016 2,298,437.9236 329317.5950 19 2,995 -2.42 -969.060 2345.1252 5.856 939,077.2836 956464.4401 20 4,171 1.58 206.940 326.9652 42,824.1636 407710.3445 21 5,678 2.58 1,713.940 4421.9652 6.656 2,937,590.3236 1087119.0225 22 3,623 -0.42 -341.060 143.2452 116,321.9236 28809.6308 23 5,301 3.58 4786.2452 12.82 1,787,408.5636 2093166.5813 24 3,020 -1.42 -944.060 1340.5652 2.016 891,249.2836 329317.5950 25 4,828 3.58 863.940 3092.9052 12.82 746,392.3236 2093166.5813 26 5,573 2.58 1,608.940 4151.0652 6.656 2,588,687.9236 1087119.0225 27 2,583 -2.42 -1,381.060 3342.1652 5.856 1,907,326.7236 956464.4401 28 3,866 -1.42 -98.060 139.2452 2.016 9,615.7636 329317.5950 29 3,586 1.58 -378.060 -597.3348 2.496 142,929.3636 407710.3445 30 5,037 0.58 1,072.940 622.3052 0.336 1,151,200.2436 54940.5472 31 3,605 -1.42 -359.060 509.8652 2.016 128,924.0836 329317.5950 32 5,345 1.58 1,380.940 2181.8852 2.496 1,906,995.2836 407710.3445 33 5,370 2.58 1,405.940 3627.3252 6.656 1,976,667.2836 1087119.0225 34 3,890 -1.42 -74.060 105.1652 2.016 5,484.8836 329317.5950 35 4,705 -0.42 740.940 -311.1948 0.176 548,992.0836 28809.6308 36 4,157 -1.42 192.940 -273.9748 2.016 37,225.8436 329317.5950 37 3,579 -0.42 -385.060 161.7252 0.176 148,271.2036 28809.6308 38 3,890 0.58 -42.9548 0.336 5,484.8836 54940.5472 39 2,972 -1.42 -992.060 1408.7252 2.016 984,183.0436 329317.5950 40 3,121 -2.42 -843.060 2040.2052 5.856 710,750.1636 956464.4401 41 4,183 0.58 126.9852 0.336 47,934.7236 54940.5472 42 3,730 -0.42 -234.060 98.3052 0.176 54,784.0836 28809.6308 43 4,127 2.58 420.3852 6.656 26,549.4436 1087119.0225 44 2,921 -1.42 -1,043.060 1481.1452 2.016 1,087,974.1636 329317.5950 1,336.940 -74.060 218.940 162.940 32 2.496 0.176 45 4,603 3.58 46 4,273 47 48 2287.4052 12.82 408,244.3236 2093166.5813 -1.42 308.940 -438.6948 95,443.9236 329317.5950 3,067 -1.42 -897.060 1273.8252 2.016 804,716.6436 329317.5950 3,074 0.58 -890.060 -516.2348 0.336 792,206.8036 54940.5472 49 4,820 1.58 855.940 1352.3852 2.496 732,633.2836 407710.3445 50 5,149 0.58 1,184.940 687.2652 0.336 1,404,082.8036 54940.5472 59,884 148 42,699,149 24,200,675 TS(b1) MS(b1) SST SSR tổng 171 198,203 638.940 2.016 𝑥̅ = (∑xi)/n = 171/50 = 3.42 𝑦̅ = (∑yi)/n = 198,203/50 = 3964.06 Phương trìn hồi qui mẫu: 𝑌̂ = b0 + b1*x b1 = TS(b1)/MS(b1) = 59,884/148 = 404.128 b0 =𝑦̅ - b1*𝑥̅ = 3964.06 - 404.128*3.42 = 2581.942 Vậy PTHQ mẫu là: 𝑌̂ = 2581.942 + 404.128*x SSR = 24,200,675 SST = 42,699,149 SSE = SST-SSR = 18,498,474 R^2 = SSR/SST = 24,200,675/42,699,149 = 0.567 => khoảng 56.7% số tiền chi tiêu thẻ tín dụng phụ thuộc vào quy mô gia đình Regression Analysis r² 0.567 n 50 r 0.753 k Std Error 620.793 Dep Var y(i) df MS F 24,200,717.4814 62.80 ANOVA table Source Regression SS 33 p-value 2.86E-10 24,200,717.4814 Residual 18,498,431.3386 48 Total 42,699,148.8200 49 385,383.9862 Regression output confidence interval std variables coefficients error t (df=48) Intercept 2,581.9410 195.2626 x(i) 404.1284 50.9979 p-value 95% lower 95% upper 13.223 1.28E-17 2,189.3393 2,974.5427 7.924 2.86E-10 301.5903 506.6664 PTHQ tổng thể: Y=β0 + β1*X giả thuyết H0: β1=0 H1: β1≠0 tiêu kiểm định tstat = b1/S(b1) =7.924 t(α/2) = t(0.025;48) = 2.0106 ta thấy tstat >t(α/2) => β1≠0 Vậy ta thấy biến quy mô gia đình có khả dự báo chi tiêu qua thẻ tín dụng tốt biến thu nhập Xây dựng phương trình hồi quy bội SUMMARY OUTPUT Regression Statistics Multiple R 0.908603921 R Square 0.825561086 Adjusted R Square 0.818138154 Standard Error 398.0910071 Observations 50 34 ANOVA Significance df SS MS F F 1.50876ERegression 3.5E+07 17625377.84 111.217647 18 Residual 47 7448393 158476.4499 Total 49 4.3E+07 Standard Coefficients Error t Stat P-value Lower Upper 95% 95% 907.2745 1702.5350 25.1506 41.1154 289.5043 423.0875 3.287EIntercept 1304.9048 Income 197.6548 6.6019 (X1) ($1000s) 7.682E33.1330 Household 3.9679 8.3503 (X2) Size 08 11 3.123E- 356.2959 33.2009 10.7315 14 Phương trình hồi qui mẫu: 𝑌̂i = b0 + b1*X1i + b2*X2i Từ bảng ta có: b0=1,304.9048 b1=33.1330 b2=356.2959 Vậy PTHQ mẫu là: 𝑌̂i = 1,304.9048 + 33.1330*X1 +356.2959*X2 Hệ số xác định bội R2= 0.8256 => Kết cho biết 82.56% biến thiên tiền chi tiêu qua thẻ tín dụng giải thích mối liên hệ tuyến tính tiền chi tiêu qua thẻ tín dụng với thu nhập quy mô gia đình, tầm quan trọng không ngang Hệ số xác định hiệu chỉnh R2(adj)=0.8181 => Cho biết 81.81% biến thiên tiền chi tiêu qua thẻ tín dụng giải thích mô hình hồi qui bội mà ta xây dựng 35 Sai số chuẩn ước lượng Sy/x=398.0910 SSR=35,250,755.67 SSE=7,448,393.148 SST=42,699,148.82 Đặt giả thuyết: H0: β1=β2=0 H1: β1≠0 β2≠0 chọn α=0.05, n=50, k=2 => D1=k=2; D2=n-k-1=50-2-1=47 tra bảng F(D1,D2,α)=F(2;47;0.05) = 3.195 Ftt = 111.2176 >Fα => bác bỏ H0 Vậy mô hình hồi qui bội với biến độc lập thu nhập quy mô gia đình giải thích cách có ý nghĩa cho biến thiên tiền chi tiêu qua thẻ tín dụng Dự báo Với gia đình có người thu nhập năm 40 000$ số tiền chi tiêu qua thẻ tín dụng là: Y = 1,304.9048 + 33.1330*40,000 + 356.2959*3 = 1,327,693.793 ($) Thông tin thêm Trên thực tế tiền chi tiêu qua thẻ tín dụng không chịu ảnh hưởng yếu tố mà chịu ảnh hưởng nhiều yếu tố khác nữa, ví dụ như: tuổi, trình độ học vấn,số thành viên có thu nhập, tiết kiệm Nên đưa thêm vào mô hình biến tuổi, số thành viên có thu nhập Vì biến dễ dàng điều tra 36 TÀI LIỆU THAM KHẢO Hoàng Trọng, Chu Nguyễn Mộng Ngọc, Thốngkê ứng dụng kinh tế - xã hội, NXB Lao Động – Xã Hội, 2008 Nguyễn Cao Văn Trần Thái Minh, Giáo trình Lý thuyết xác suất thống kê toán, NXB, Thống kê, 2005 Trần Văn Thắng tác giả, Giáo trình Lý thuyết thống kê, NXB Thống Kê, 1998 37 [...]... bỏ H0  Với độ tin cậy 95%, có đủ bằng chứng thống kê để bác bỏ giả thuyết H0, như vậy: - Có sự khác nhau về thu nhập do vị trí công tác - Có sự khác nhau về thu nhập do số năm kinh nghiệm - Có sự ảnh hưởng tương tác giữa vị trí công tác và số năm kinh nghiệm 26 Tình huống 5: Chi tiêu qua thẻ tín dụng của người tiêu dùng (Chapter 15, Consumer) Bài làm 1 .Thống kê mô tả Amount Income Household Charged... thông tin về:  Tiêu chuẩn số dặm mà một chiếc xe bình thường lái được đến khi bị lỗi bộ truyền động mà công ty đặt ra  Lấy cỡ mẫu lớn hơn để có dữ liệu với độ sai lệch ít hơn 19 Tình huống 4: Thu nhập của nhân viên bán hàng (Chapter 13, SalesSalary) Bài làm 1 Phân tích thống kê mô tả Descriptive statistics Salary ($) count 120 Số quan sát mean 64,925.48 Giá trị trung bình sample standard deviation 10,838.67... 119 ANOVA table Source 22 p-value Comparison of Groups 100,000.0 90,000.0 80,000.0 70,000.0 60,000.0 50,000.0 40,000.0 inside outside p-value bác bỏ H0  Với độ tin cậy 95% có đủ bằng chứng thống kê để bác bỏ giả thuyết H0, như vậy có sự khác nhau giữa thu nhập của nhân viên bán hàng tại doanh nghiệp (inside) và nhân viên bán hàng tại thực địa (outside) 6 Kiểm định giả thuyết n=40>30 => Trung... 1,668,100,099.40 Error 12,311,642,892.53 117 Total 13,979,742,991.93 119 MS 2 F 834,050,049.700 7.93 p-value 0006 105,227,717.030 p-value=0.0006 < α=0.05 => bác bỏ H0=> Với độ tin cậy 95% có đủ bằng chứng thống kê để bác bỏ giả thuyết H0, như vậy có sự khác nhau về thu nhập do số năm kinh nghiệm Phân tích sâu ANOVA: Post hoc analysis p-values for pairwise ttests low high medium 59,819.6 66,338.7 68,618.1... thuộc khoảng ước lượng này nên ta có thể khẳng định bộ truyền động hoạt động bình thường 3) Thảo luận hàm ý Từ bảng thống kê ta thấy: 18  Hệ số skewness = 0.26>0 nên suy ra dữ liệu có phân phối lệch phải  Độ trải giữa R0 = 86 575 – 60 421 = 26 154 => mức độ phân tán của dữ liệu khá lớn  Trung vị nằm giữa 2 tứ phân vị cho thấy phân phối khá đều Vậy cho nên chưa có đủ căn cứ để tin rằng một số người... Kết quả này cho biết 82.56% biến thiên trong tiền chi tiêu qua thẻ tín dụng có thể được giải thích bởi mối liên hệ tuyến tính giữa tiền chi tiêu qua thẻ tín dụng với thu nhập và quy mô gia đình, nhưng tầm quan trọng không ngang nhau Hệ số xác định hiệu chỉnh R2(adj)=0.8181 => Cho biết 81.81% biến thiên trong tiền chi tiêu qua thẻ tín dụng có thể được giải thích bởi mô hình hồi qui bội mà ta đã xây dựng... tổn thất nhất Nên đặt mua số lượng là 18000sản phẩm Dự báo lợi nhuận là 182476($) Vì P(X>18000)=0,652 Lợi nhuận kì vọng là lớn nhất trong 4 trường hợp đặt mua hàng là 182476($) 16 Tình huống 3: Công ty nghiên cứu thị trường Metropolitan Research (Chapter 8, Auto) 1) Phân tích thông kê mô tả Column1 Column2 Descriptive statistics Miles Count 50 Mean 73,340.30 sample variance 619,946,014.05 sample standard... thuận chiều giữa thời gian truy cập website và số trang đã xem, khách hàng xem càng nhiều trang thì thời gian truy cập website càng nhiều 11 Tình huống 2: Công ty sản xuất đồ chơi trẻ em Specialty Toys Bài làm 1.Đồ thị phân phối Với doanh số kỳ vọng là : 𝜇𝑜 = 200000 sản phẩm Từ giả thiết ta có : 1 – α = 0.95 => α =0.05 =>Zα/2 = 1.96 Mặt khác, nhu cầu 10000 28000)=10324($) 4 Lợi nhuận dự kiến Gọi số lượng hàng cần đặt mua là S( sản phẩm ) Vì lượng hàng cần đặt phải đáp ứng 70% nhu cầu người mua và chỉ nên 30% hết hàng  Tương tự những phần tính xác suất hết hàng ta có: P( X>=S) = 0.3 P( 𝑋− 𝜇 𝑂 𝜎xbar >= 𝑆− 𝜇 𝑂 𝜎xbar ) =0.3  P ( Z>= Z’) =0.3 Với S >𝜇𝑜 = 20000 => Z’ >... mẫu: 𝑌̂ = 2203.990 + 40.480*x SSR = 16,999,938.312 SST = 42,699,148.820 SSE = SST-SSR= 25,699,210.508 R^2 = SSR/SST = 16,999,938.312/ 42,699,148.820 = 0.398 => Khoảng 39.8% số tiền chi tiêu bằng thẻ tín dụng phụ thuộc vào thu nhập Regression Analysis r² 0.398 n 50 r 0.631 k 1 Std Error 731.713 Dep Var y(i) SS df MS F ANOVA table Source Regression 16,999,744.7860 1 16,999,744.7860 31.75 Residual 25,699,404.0340

Ngày đăng: 15/05/2016, 17:04

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan