bài giảng một số thực hành xử lý dữ liệu thống kê bằng excel 2003

30 875 2
bài giảng một số thực hành xử lý dữ liệu thống kê bằng excel 2003

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

1 TRƯỜNG ĐẠI HỌC NHA TRANG KHOA KINH TẾ BỘ MÔN KINH TẾ HỌC BÀI GIẢNG MỘT SỐ THỰC HÀNH XỬ LÝ DỮ LIỆU THỐNG KÊ BẰNG EXCEL 2003 TÀI LIỆU LƯU HÀNH NỘI BỘ Người viết: Võ Hải Thuỷ 1.NHẬP DỮ LIỆU, SẮP XẾP VÀ TRÌNH BÀY DỮ LIỆU : 1.1. Nhập dữ liệu vào bảng tính Excel: 1.1.1-Cấu trúc của một bảng tính Excel: Khởi động Microsoft Excel, sẽ mở ra một cửa sổ, đó là tập bảng tính có tên mặc định là Book1 (viết tắt của WorkBook), trong đó có 3 bảng tính mặc định là Sheet 1, Sheet 2, Sheet 3 (viết tắt của WorkSheet) như hình 1. Một tập bảng tính có tối đa 255 bảng tính. Nếu muốn mở thêm các bảng tính, ngoài 3 bảng mặc định, bạn dùng lệnh: Insert > Worksheet. Mỗi bảng tính (worksheet) gồm có : *Cột (column) : có tối đa 256 cột, được đánh thứ tự từ A,B,…,Z,AA, AB,…,AZ, …, IA,IB,…,IV *Hàng (row) : có tối đa 65536 hàng, được đánh thứ tự từ 1,2,…,65536. *Ô (cell) : gồm 256X65536 ô, được đánh dấu dựa vào <địa chỉ cột của ô > <địa chỉ hàng của ô >. *Khối ô / Vùng (range): là tập hợp các ô gần nhau tạo thành hình chữ nhật. Địa chỉ khối ô được đánh dấu dựa vào <địa chỉ ô đầu tiên bên trái><địa chỉ ô cuối cùng bên phải>, ở giữa là dấu “: ” 1.1.2-Nhập dữ liệu vào bảng tính Excel: Ví dụ 1: Nhập dữ liệu điều tra về năng suất lao động và giới tính của mẫu 24 công nhân. Ví dụ 2: Nhập dữ liệu điều tra về bậc thợ, tuổi nghề (năm), lương bình quân tháng (nghìn đ) của mẫu 30 công nhân A B C 1 STT Năng suất Giới tính 2 1 210 nữ 3 2 185 nữ 4 3 210 nữ 5 4 200 nam 6 5 180 nữ 7 6 214 nữ 8 7 186 nữ 9 8 240 nam 10 9 218 nữ 11 10 220 nam 12 11 170 nữ 13 12 225 nam 14 13 170 nữ 15 14 250 nam 16 15 220 nam 17 16 280 nam 18 17 180 nam A B C D 1 STT Bậc thợ Tuổi nghề Lương tháng 2 1 2 5 2200 3 2 2 1 800 4 3 2 4 1400 5 4 2 3 1100 6 5 2 2 850 7 6 2 4 1800 8 7 2 3 1500 2 19 18 270 nam 20 19 185 nữ 21 20 215 nam 22 21 160 nữ 23 22 190 nam 24 23 180 nữ 25 24 216 nam 9 8 2 3 1100 10 9 2 6 2400 11 10 2 5 2300 12 11 2 1 900 13 12 2 1 940 14 13 2 3 1000 15 14 3 2 1100 16 15 3 8 3000 17 16 3 4 1600 18 17 3 6 3400 19 18 3 6 2200 20 19 3 1 980 21 20 3 4 2600 22 21 3 6 2200 23 22 3 8 3800 24 23 4 7 2500 25 24 4 9 2800 26 25 4 10 3000 27 26 4 11 4500 28 27 4 10 3600 29 28 4 11 4700 30 29 5 11 4200 31 30 5 12 5200 1.2.Chọn mẫu ngẫu nhiên đơn giản từ tổng thể chung: Thao tác: Lập danh sách tất cả đơn vị của tổng thể chung > Tools > Data Analysis > Sampling > OK > nhập địa chỉ Input Range > > Sampling Method > Random (ngẫu nhiên) > nhập cỡ mẫu vào Number of Sample > nhập địa chỉ ô đầu tiên Output Range > OK. Ví dụ: Cho dữ liệu về giới tính và điểm thi của tổng thể chung 30 sinh viên. Yêu cầu: Dùng Excel để chọn 1 mẫu ngẫu nhiên có cỡ mẫu là 10 từ tổng thể? 3 1.3. Lọc dữ liệu: 1.3.1-Lọc dữ liệu với 1 điều kiện Yêu cầu 1: Với dữ liệu ví dụ 1, hãy lọc danh sách công nhân có giới tính “nữ” ? Thao tác: Chọn khối dữ liệu > Data > Filter > Auto Filter > chọn mũi tên ▼tương ứng với điều kiện >danh sách dữ liệu được lọc sẽ hiện ra. 1.3.2-Lọc dữ liệu với 2 điều kiện : Yêu cầu 2: Hãy lọc danh sách công nhân thỏa mãn 2 điều kiện: giới tính “nữ” và “năng suất<190” ? Thao tác: Xây dựng vùng điều kiện (tại 1 ô bất kỳ trên bảng tính hiện hành), có dạng: Chọn khối dữ liệu > Data > Filter > Advanced Filter > Filter the list, in-place > nhập địa chỉ khối dữ liệu vào List range > nhập địa chỉ vùng điều kiện vào Criteria Range > OK . Yêu cầu 3: Hãy lọc danh sách công nhân thỏa mãn 2 điều kiện: giới tính “nam” và “năng suất “>=190 và <220” ? Thao tác: Xây dựng vùng điều kiện như sau: Các lệnh tiếp theo giống như trên. Chú ý: Nếu điều kiện “và” thì viết cùng dòng, “hoặc” thì viết xuống dòng. 1.4.Sắp xếp dữ liệu theo thứ tự: Yêu cầu: Sắp xếp dữ liệu của ví dụ 1 theo thứ tự tăng dần với ưu tiên 1 là “năng suất” và ưu tiên 2 là “giới tính” ? Thao tác: Chọn khối dữ liệu > Data > Sort > Sort by > chọn “ Năng suất” > Ascending > Then by > chọn “Giới tính” > Ascending > OK giới tính năng suất nữ <190 giới tính năng suất năng suất nam >=190 <220 4 1.5.Trình bày dữ liệu dưới dạng bảng thống kê và biểu đồ thống kê: 1.5.1-Dùng hàm để lập bảng tần số : Đối với dữ liệu định tính: Ta dùng hàm COUNTIF Yêu cầu: Từ dữ liệu của ví dụ 1 hãy lập bảng tính tần số và tần suất về giới tính công nhân ? A B C D E F 1 STT Năng suất Giới tính Giới tính Tần số Tần suất (%) 2 1 210 nữ Nam =COUNTIF($C$2:$C$25,“nam”) =E2/$E$4*100 3 2 185 nữ Nữ =COUNTIF($C$2:$C$25,“nữ”) =E3/$E$4*100 4 3 210 nữ Cộng =SUM(E2:E3) =SUM(F3:F4) 5 4 200 nam 6 5 180 nữ 7 6 214 nữ 8 7 186 nữ 9 8 240 nam 10 9 218 nữ 11 10 220 nam 12 11 170 nữ 13 12 225 nam 14 13 170 nữ 15 14 250 nam 16 15 220 nam 17 16 280 nam 18 17 180 nam 19 18 270 nam 20 19 185 nữ 21 20 215 nam 22 21 160 nữ 23 22 190 nam 24 23 180 nữ 25 24 216 nam Đối với dữ liệu định lượng : Ta dùng hàm FREQUENCY 5 Yêu cầu: Từ dữ liệu của ví dụ 1 hãy lập bảng tần số về năng suất lao động (phân theo 4 tổ: 160- 190, 190-220, 220-250, 250-280), trong bảng tính tần số và tần suất ? A B C D E F 1 STT Năng suất Giới tính Năng suất Tần số Tần suất (%) 2 1 210 nữ 160-190 =FREQUENCY(B2:B25,{189,219,249,280}) =E2/$E$4*100 3 2 185 nữ 190-220 =E3/$E$4*100 4 3 210 nữ 220-250 =E4/$E$4*100 5 4 200 nam 250-280 =E5/$E$4*100 6 5 180 nữ Cộng =SUM(E2:E5) =SUM(F2:F5) 7 6 214 nữ 8 7 186 nữ 9 8 240 nam Chú ý: Ta thao tác để nhập công thức hàm như sau: -Chọn các ô dùng để biểu thị tần số, địa chỉ của khối ô là E2:E5 -Gõ vào công thức =FREQUENCY(B2:B25,{189,219,249,280}) -Ấn tổ hợp phím: CTRL+SHIFT+ENTER. Khi đó tần số sẽ xuất hiện trong từng ô. 10 9 218 nữ 11 10 220 nam 12 11 170 nữ 13 12 225 nam 14 13 170 nữ 15 14 250 nam 16 15 220 nam 17 16 280 nam 18 17 180 nam 19 18 270 nam 20 19 185 nữ 21 20 215 nam 22 21 160 nữ 23 22 190 nam 24 23 180 nữ 25 24 216 nam 1.5.2.Dùng chức năng HISTOGRAM để lập bảng tần số và vẽ biểu đồ phân phối: Thao tác: Bước 1: Cài đặt chức năng Data Analysis của Excel: Tools > Add-Ins > Chọn Analysis Toolpak và Analysis Toolpak VBA > OK Bước 2: Lập vùng Bin để ghi giới hạn dưới của mỗi tổ. Nếu lượng biến rời rạc thì ghi giới hạn dưới; nếu lượng biến liên tục thì ghi số nhỏ hơn giới hạn dưới 1 đơn vị Bước 3: Tools > Data Analysis > Histogram > OK > Kê khai vào hộp thoại : Vào Input Range để nhập địa chỉ vùng dữ liệu (Chỉ chọn phần số> Bin Range để nhập địa chỉ > Output Range để nhập địa chỉ 1 ô bất kỳ > Cumulative percentage (tần suất tích luỹ) > chọn Chart Output (vẽ biểu đồ) > OK Ví dụ: Yêu cầu: Từ dữ liệu của ví dụ 1 hãy lập bảng tần số về năng suất lao động của công nhân ? Phân tổ công nhân theo năng suất lao động thành 4 tổ: 160-190, 190-220, 220-250, 250-280. 6 ▼ Hiệu chỉnh biểu đồ phân phối : -Làm cho các khoảng cách tổ sát nhau: Đặt dấu nhắc lên trên 1 cột bất kỳ > Format Data Series > Option > nhập giá trị 0 vào Gap Width > OK -Thay tiếng Anh bằng tiếng Việt : Nhấp trái chuột vào tên cần hiệu chỉnh > dấu nhắc > xoá tiếng Anh, gõ tiếng Việt 1.5.3-Dùng chức năng PIVOT TABLE để lập bảng tần số và vẽ biểu đồ phân phối : 1.5.3.1. Lập bảng tần số giản đơn: Yêu cầu : Từ dữ liệu của ví dụ 1,lập bảng phân tổ công nhân theo giới tính ? Thao tác: Chọn khối dữ liệu > Data > Pivot Table and Pivot Chart Report > Step 1 > Next > Step 2 > Next > Step 3 > Existing Worksheet > chọn 1 ô bất kỳ để đặt bảng > Layout > nhấp “giới tính” đưa vào ô Row > chọn tên hàm Count cho vào ô Data > OK > Step 3 > Finish. 7 1.5.3.2. Lập bảng tần số kết hợp 2 tiêu thức: Yêu cầu : Từ dữ liệu của ví dụ 1 hãy lập bảng tần số kết hợp 2 tiêu thức: năng suất và giới tính, trong đó giới tính đặt ở cột, năng suất đặt ở hàng ? Trong đó, năng suất lao động được phân thành 4 tổ: 160-190, 190-220, 220-250, 250-280. Thao tác: Bước 1:Nhập dữ liệu vào bảng tính, trong đó từng mức năng suất sẽ được đưa vào tổ tương ứng là : 160-190, 190-220, 220-250, 250-280 Cách khác : Chọn ô đầu tiên của cột năng suất, giả sử địa chỉ là ô B2, nhập cú pháp hàm như sau: =IF(B2<190,“160-190”,IF(B2<220,“190- 220”,IF(B2<250,“220-250”,“250-280”))). Sau đó copy cú pháp này cho tất cả các ô còn lại. Bước 2: Chọn khối dữ liệu > Data > Pivot Table and Pivot Chart Report > Step 1 > Next > Step 2 > Next > Step 3 > Existing Worksheet > chọn 1 ô bất kỳ để đặt bảng > Layout > nhấp “năng suất” đưa vào ô Row > nhấp “giới tính” đưa vào ô Column > chọn tên hàm Count cho vào ô Data > OK > Step 3 > Finish. Bước 3: Nếu muốn vẽ đồ thị thì nhấp vào biểu tượng đồ thị trên Pivot Chart Bước 4: Nếu muốn thiết kế lại bảng thì vào Data > Pivot Table and Pivot Chart Report > Step 3 > Layout để lập lại bảng theo yêu cầu mới. A B C 1 STT Năng suất Giới tính 2 1 190-220 nữ 3 2 160-190 nữ 4 3 190-220 nữ … … … … 25 24 190-220 nam 8 1.5.3.3. Lập bảng tần số kết hợp 3 tiêu thức: Yêu cầu : Từ dữ liệu của ví dụ 2, lập bảng tần số kết hợp 3 tiêu thức: bậc thợ, tuổi nghề, lương tháng, trong đó lương tháng và bậc thợ đặt ở hàng, tuổi nghề đặt ở cột ? Trong đó, lương tháng (nghìn đ) được phân thành 4 tổ: dưới 1000, 1000-3000, 3000-5000, 5000 trở lên; tuổi nghề (năm) được phân thành 4 tổ: 1 đến 3, 4 đến 6, 7 đến 9, 10 đến 12. Thao tác: Trình tự giống như 3.3.2, chỉ khác phần thiết kế bảng Layout. 9 1.5.4-Dùng chức năng CHART WIZARD để vẽ biểu đồ thống kê: Các dạng biểu đồ trong Excel được chia thành 2 nhóm: * Standard Type (dạng chuẩn): bao gồm: Column (dạng cột), Bar (dạng thanh), Line(dạng đường), Pie (dạng tròn, dạng bánh), Scatter (dạng phân tán), Area (dạng vùng, dạng diện tích), Doughnut (dạng vành khăn), Radar (dạng mạng nhện), Surface (dạng bề mặt), Bubble (dạng bong bóng), Stock (dạng cổ phần), Cylinder (dạng hình trụ), Cone (dạng hình nón), Pyramid (dạng hình tháp). * Custom Type (dạng hiệu ứng đặc biệt): bao gồm: Area Blocks (dạng các khối vùng), B&W Area (dạng vùng đen và trắng), B&W Column (dạng cột đen và trắng), B&W Line – Timescale (dạng đường đen và trắng – nhân tỷ lệ), B&W Pie – (dạng bánh đen và trắng), Blue Pie (dạng bánh màu xanh), Colored Lines (dạng các đường có màu), Colume-Area (dạng cột – vùng), Columns with Depth (các cột có độ sâu), Cones (dạng chóp nón), Floating Bars (dạng các thanh trôi nổi), Line – Column (dạng đường – cột), Line – Column on 2 Axes (dạng đường – cột trên 2 trục), Lines on 2 Axes (dạng đường trên 2 trục), Logarithmic (dạng trục logarit), Outdoor Bars ( dạng các thanh được tô bên ngoài), Pie Explosion (dạng hình bánh cắt phần), Smooth Lines (dạng các đường trơn), Stack of Colors (dạng xếp chồng màu), Tubes (dạng ống) Thao tác chung: Chọn vùng dữ liệu muốn vẽ biểu đồ > Chart Wizard > Chart Type > Step 1 > Chọn dạng đồ thị > Next > Step 2 > Chọn cách trình bày đồ thị > Next > Step 3 > Thực hiện các thao tác để hoàn chỉnh đồ thị. 10 Một số dạng biểu đồ thường dùng để trình bày dữ liệu thống kê: 1.5.4.1-Dạng biểu đồ hình cột: [...]... tích dữ liệu ví dụ 2 bằng các tham số trên mẫu ? 15 2.2.Tính các tham số phản ánh đặc trưng của mẫu bằng chức năng Function: Chỉ áp dụng đối với trường hợp dữ liệu không phân tổ *Thao tác : Nhập dữ liệu vào bảng tính theo 1 cột dọc > Data > Sort để sắp xếp dữ liệu theo thứ tự tăng dần > nhập công thức hàm thích hợp để tính từng tham số Ví dụ: Phân tích dữ liệu về lương tháng ở ví dụ 2 bằng các tham số. .. đến doanh số bán Nhưng các địa bàn phường khác nhau thì không có tác động gì đến doanh số bán TÀI LIỆU THAM KHẢO 1 -Thống kê ứng dụng trong kinh doanh bằng Excel – Nguyễn Minh Tuấn – ĐH Quốc Gia TP HCM – Trường ĐH Quốc Tế - NXB Thống kê 2007 2-Ứng dụng Microsoft Excel trong kinh tế - Trần Thanh Phong – Chương trình Giảng dạy kinh tế Fulbright 3-Phân tích dữ liệu khoa học bằng chương trình MS -Excel – Đặng... hợp hình cột và đường gấp khúc: 14 2-PHÂN TÍCH DỮ LIỆU THỐNG KÊ : 2.1.Tính các tham số phản ánh đặc trưng của mẫu bằng chức năng Descriptive Statistics : Chỉ áp dụng đối với trường hợp dữ liệu không phân tổ *Thao tác : Nhập dữ liệu vào bảng > Tools > Data Analysis > Descriptive Statistics > OK Kê khai trong hộp thoại: Input Range : nhập địa chỉ khối dữ liệu > Output Range : nhập địa chỉ 1 ô bất kỳ để... trình MS -Excel – Đặng văn Giáp – NXB Giáo Dục 1997 4 -Thống kê ứng dụng trong kinh tế xã hội- Hoàng Trọng, Chu Nguyễn Mộng Ngọc – NXB Thống kê 2007 5-Thiết lập bảng tính với Microsoft Excel XP – Ông văn Thông – NXB Thống kê 2004 6-Làm việc với biểu đồ và đồ thị trong Excel 2003 – Lữ Đức Hào NXB Thanh Niên 2004 7-Xác suất thống kê và các tính toán trên Excel – Trần văn Minh – NXB Giao thông vận tải 2001... trên Excel có sai lệch so với cách 16 25 26 27 28 29 30 31 24 25 26 27 28 29 30 tính thủ công Nếu tính thủ công thì trong ví dụ này, Q1=1100, Q3=3100 3400 3600 3800 4200 4500 4700 5200 2.3.Tính các tham số phản ánh đặc trưng của mẫu bằng công thức : Có thể áp dụng đối với trường hợp dữ liệu không phân tổ và dữ liệu có phân tổ: Ví dụ: Phân tích dữ liệu lương tháng (nghìn đ/người) của mẫu 50 công nhân bằng. .. trong 1 ô: Nhập dữ liệu vào bảng tính theo k cột và h hàng (ghi cả tiêu đề của các cột và hàng) > Vào Tools > Data Analysis > ANOVA: Two Factor With Replication > OK > Kê khai trong hộp thoại : ghi địa chỉ khối dữ liệu (cả tiêu đề) vào Input Range - vào Rows per sample để ghi số quan sát trong 1 ô vào chỗ trống - Alpha : 0.05 (mặc định) - ghi địa chỉ một ô bất kỳ vào Output Range - OK Ví dụ: Một khảo sát... Statistics (tất cả tham số thống kê) > 0K Đọc bảng kết quả: Mean (số trung bình), Standard Error (sai số chuẩn – độ lệch chuẩn của trung bình mẫu), Median (số trung vị), Mode (số yếu vị), Standard Deviation (độ lệch tiêu chuẩn), Sample Variance (phương sai mẫu hiệu chỉnh), Range (khoảng biến thiên), Minimum (lượng biến nhỏ nhất), Maximum (lượng biến lớn nhất), Sum (tổng các lượng biến), Count (số đơn vị của... thể nói là thời gian hoàn thành 1 sản phẩm trung bình 1 công nhân ở 2 đội sản xuất là như nhau 25 Ví dụ: Công ty thương mại XY tiến hành một thử nghiệm về thời gian giao hàng của 2 công ty vận tải A và B trước khi đi đến quyết định chọn một trong số 2 công ty này Hai công ty vận tải phải thực hiện 8 chuyến chở hàng đến 8 khách hàng như nhau theo yêu cầu của công ty XY Dữ liệu thu thập được về thời... dùng, bộ phận nghiên cứu thị trường tiến hành thu thập dữ liệu về doanh số bán trong 1 tuần (triệu đ) của mỗi loại bao bì trên các mẫu ngẫu nhiên từ các cửa hàng Kết quả thu được như sau : -Loại bao bì A: doanh số bán của 8 cửa hàng là : 18, 16, 29, 26, 29, 14, 12, 23 -Loại bao bì B: doanh số bán của 5 cửa hàng là : 24, 25, 21, 31, 22 -Loại bao bì C: doanh số bán của 7 cửa hàng là : 19,24,24,28,15,29,32... nhân ở 2 đội sản xuất thì bằng nhau 6 PHÂN TÍCH PHƯƠNG SAI 6.1 Phân tích phương sai 1 yếu tố: Thao tác:Nhập dữ liệu vào bảng tính theo k cột (ghi cả tiêu đề của mỗi cột) > Tools > Data Analysis > ANOVA: Single Factor > OK > Kê khai trong hộp thoại : ghi địa chỉ khối dữ liệu (cả tiêu đề) vào Input Range - Group By : chọn column - chọn Labels - Alpha : 0.05 (mặc định) – ghi địa chỉ một ô bất kỳ vào Output . BÀI GIẢNG MỘT SỐ THỰC HÀNH XỬ LÝ DỮ LIỆU THỐNG KÊ BẰNG EXCEL 2003 TÀI LIỆU LƯU HÀNH NỘI BỘ Người viết: Võ Hải Thuỷ 1.NHẬP DỮ LIỆU, SẮP XẾP VÀ TRÌNH BÀY DỮ LIỆU : 1.1. Nhập dữ. 1.5.Trình bày dữ liệu dưới dạng bảng thống kê và biểu đồ thống kê: 1.5.1-Dùng hàm để lập bảng tần số : Đối với dữ liệu định tính: Ta dùng hàm COUNTIF Yêu cầu: Từ dữ liệu của ví dụ 1 hãy. TÍCH DỮ LIỆU THỐNG KÊ : 2.1.Tính các tham số phản ánh đặc trưng của mẫu bằng chức năng Descriptive Statistics : Chỉ áp dụng đối với trường hợp dữ liệu không phân tổ. *Thao tác : Nhập dữ liệu

Ngày đăng: 10/02/2015, 09:56

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan