Thuyết trình chủ đề phân tích dữ liệu

77 311 0
Thuyết trình chủ đề phân tích dữ liệu

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

PHÂN TÍCH DỮ LIỆU Nhóm N1MIB1K27 – Trần nhật tân – bùi thị minh tâm – tôn nữ khánh tâm – võ trung hậu – lê thùy dung – nguyễn thị hoàng huệ – trần thi bích hạnh N1MIB1K27 Phần I Khảo sát liệu BIỂU ĐỒ TẦN SỐ (HISTOGRAMS) BIỂU ĐỒ HỘP VÀ RÂU (BOXPLOT) BIỂU ĐỒ TÁN XẠ (SCATTER PLOT ) N1MIB1K27 BIỂU ĐỒ TẦN SỐ (HISTOGRAMS) – Khái niệm  Biểu đồ tần số (Histograms): dạng đồ thị biểu thị dạng phân phối tần suất tập liệu liên tục Nó cho phép kiểm tra dạng phân phối, độ nhọn tập liệu  Chiều cao mỗi hình chữ nhật biểu đồ biểu diễn tần số lớp tương ứng N1MIB1K27 BIỂU ĐỒ TẦN SỐ (HISTOGRAMS) – Cách vẽ với SPSS BƯỚC 1: CHỌN GRAPH > LEGACY DIALOGS > HISTOGRAM N1MIB1K27 BIỂU ĐỒ TẦN SỐ (HISTOGRAMS) – Cách vẽ với SPSS BƯỚC 2: CHỌN BIẾN MUỐN VẼ BIỂU ĐỒ (VÍ DỤ BIẾN WEIGHT TRONG FILE CAR.SAV) N1MIB1K27 BIỂU ĐỒ TẦN SỐ (HISTOGRAMS) – Cách vẽ với SPSS BƯỚC : VẼ THEO NHÓM BIẾN Nếu muốn vẽ theo nhóm chọn biến phân biệt nhóm đưa vào mục Panel by - Chọn Rows muốn biểu đồ xuất dòng - Chọn Column muốn biểu đồ xuất cột N1MIB1K27 BIỂU ĐỒ TẦN SỐ (HISTOGRAMS) – Cách vẽ với SPSS BƯỚC 4: Nếu muốn hiển thị đường phân phối chuẩn chọn Display normal curve N1MIB1K27 BIỂU ĐỒ TẦN SỐ (HISTOGRAMS) – Cách vẽ với SPSS BƯỚC : Chọn OK N1MIB1K27 BIỂU ĐỒ TẦN SỐ (HISTOGRAMS) – Cách nhận định N1MIB1K27 BIỂU ĐỒ HỘP VÀ RÂU (BOXPLOT) – Khái niệm • Biểu đồ hộp râu: áp dụng cho liệu định lượng • Biểu đồ hộp râu gồm hộp hai râu • Đoạn thẳng hộp cho biết giá trị trung vị tập liệu, hai cạnh (song song với nó) lại cho biết giá trị tứ phân vị thứ thứ ba • Hai râu nối tới giá trị lớn nhỏ • Biểu đồ phản ánh tính chất nghiêng sự phân tán tập liệu N1MIB1K27 10 PHÂN PHỐI CHUẨN – Cách nhận biết Cách 1: HISTOGRAMS – Các bước thực N1MIB1K27 63 PHÂN PHỐI CHUẨN – Cách nhận biết Cách 1: HISTOGRAMS – Kết Trong phân phối này, trị số trung bình trung vị gần độ xiên dao, độ nhọn dao động từ -1 đến +1, được coi có phân phối chuẩn Thật vậy, xem biểu đồ phân phối với đường cong chuẩn có dạng hình chuông, có trị trung bình, trung vị 15.50 số liệu phân phối đều bên  Giá trị trung bình (mean)= 15.50  Trung vị (median)=15.50  độ xiên (skewness)=0,211  độ nhọn (Kurtosis)=0.389 N1MIB1K27 64 PHÂN PHỐI CHUẨN – Cách nhận biết Cách 2: Kiểm định Kolmogorov-Smirnov – Các bước thực N1MIB1K27 65 PHÂN PHỐI CHUẨN – Cách nhận biết Cách 2: Kiểm định Kolmogorov-Smirnov – Kết Vì cỡ mẫu nhỏ nhỏ, nên dùng kiểm định ShapiroWilk với Sig.=0,078 (lớn 0,05) Chứng tỏ phân phối phân phối chuẩn N1MIB1K27 66 PHÂN PHỐI CHUẨN – Cách nhận biết Cách 3: Biểu đồ Q-Q Plot– Kết Xem biểu đồ Normal Q-Q Plot, trị số quan sát trị số mong đợi đều nằm gần đường chéo N1MIB1K27 67 TUYẾN TÍNH– Khái niệm  Giả định tuyến tính (Linearity) để xác định mối quan hệ biến độc lập biến phụ thuộc tuyến tính hay không Giả định tuyến tính yêu cầu phân tích tương quan hồi quy tuyến tính Nghiên cứu tốt mô hình hồi quy phải có mối quan hệ tuyến tính biến tự biến phụ thuộc  Quá trình định kiểm tra tuyến tính  Nếu giá trị sig Độ lệch từ Linearity > 0,05; sau mối quan hệ biến độc lập với biến phụ thuộc tuyến tính  Nếu giá trị sig Độ lệch từ Linearity 0,05, có thể kết luận có mối quan hệ tuyến tính biến tốc độ với khối lượng N1MIB1K27 70 PHƯƠNG SAI ĐỒNG NHẤT– Khái niệm Điều có nghĩa độ biến thiên giống mỗi cấp biến cần giải thích Một số nguyên nhân dẫn đến phương sai thay đổi (Heteroskedasticity):      Do tích lũy kinh nghiệm mà sai số theo thời gian ngày giảm Do bản chất tượng kinh tế Công cụ về thu thập xử lý số liệu cải thiện dẫn đến sai số đo lường tính toán giảm Mô hình hồi quy không Hiện tượng phương thay đổi thường gặp xử lý số liệu chéo Hậu quả:  Ước lượng bình phương nhỏ (OLS) tuyến tính không hiệu quả phương sai không nhỏ  Ước lượng phương sai ước lượng (OLS) bị lệch  Khoảng tinh cậy kiểm định dựa phân phối t F không đáng tin N1MIB1K27 71 PHƯƠNG SAI ĐỒNG NHẤT– Cách kiểm tra Nhấn tiếp hộp thoại Plots chọn SRESID vào Y N1MIB1K27 72 ZRESID vào X Chọn Continue PHƯƠNG SAI ĐỒNG NHẤT– Kết Kết quả nhìn thấy có sự đồng số tiêu hao lượng (mgp), với dung tích động (engine) N1MIB1K27 73 TỰ TƯƠNG QUAN – Khái niệm Là tượng có diễn tương quan giá trị thành phần biến Hiện tượng này thường xảy số liệu chuổi thời gian và số liệu chéo Hệ dẫn đến nhiễu cũng diễn tượng tự tương quan   Nguyên nhân Nguyên nhân bên ngoài    Hiện tượng quán tính số liệu doanh số kỳ này cao làm cho doanh số kỳ tiếp theo cao Khủng hoảng kinh tế làm cho GDP thấp, kỳ tiếp theo cũng thấp Hiện tượng tương tác, mạng nhện biến thu nhập người khu vực dễ có xu hướng thu nhập giống Giá mặt hàng giảm xuống làm cho loại giá mặt hàng khác biến động theo.   Độ trễ thời gian: biến động quan sát thứ I tác động vào kỳ thứ i+k Ví dụ, tác động đầu tư đến phát triển kinh tế xã hội.  Nguyên nhân bên trong  Xử lí liệu, làm trơn số liệu, phép nội suy số liệu và thiết lập mô hình bị sai.  Hậu quả  N1MIB1K27 Việc vi phạm giả thiết tương quan nhiễu (ui) làm cho ước lượng phương sai, kiểm định không xác 74 TỰ TƯƠNG QUAN – Cách kiểm tra Nhấn vào nút Statistics Đánh dấu nháy vào ô Chuẩn đoán đa cộng tuyến (Collinearrity dianogstics) Nhấn continue, tiếp tục OK N1MIB1K27 75 TỰ TƯƠNG QUAN – Kết Quy tắc hệ số phóng đại phương sai (Variance inflation factor) VIF vượt 10 dấu hiệu lỗi tương quan (đa cộng tuyến) Ta thấy VIF (engine) 10.692 >10 nên xảy lỗi tương quan cần phải chạy lại để loại bỏ biến N1MIB1K27 76 THANK YOU N1MIB1K27 77 ... biên N1MIB1K27 21 Phần II Dữ liệu trống (Missing data) Tác động liệu trống Quy trình Xác định Dữ liệu Thiếu Áp dụng biện pháp khắc phục N1MIB1K27 22 ẢNH HƯỞNG CỦA Dữ liệu trống (Missing Data... thể biết (Known) 1.2.2 Dữ liệu trống (Missing data) Không thể biết (Unknown) N1MIB1K27 27 1.2 liệu trống bỏ qua (Non-ignorable MD) 1.2.1 Dữ liệu trống biết (Known MD) Dữ liệu trống (MD) giúp... vi/kích thước liệu trống (missing data) • Bước 3: Kiểm định tính ngẫu nhiên liệu trống (missing data pattern) N1MIB1K27 24 Bước 1: Xác định loại Dữ liệu trống (Missing Data ) 1.1 Dữ liệu trống

Ngày đăng: 01/11/2017, 14:33

Mục lục

    PHÂN TÍCH DỮ LIỆU

    ẢNH HƯỞNG CỦA Dữ liệu trống (Missing Data )

    Quy trình XÁC ĐỊNH VÀ KHẮC PHỤC MD

    Bước 1: Xác định loại Dữ liệu trống (Missing Data )

    1.1 missing data có thể bỏ qua

    1.2 dữ liệu trống (missing data) không thể bỏ qua

    1.2 dữ liệu trống không thể bỏ qua (Non-ignorable MD)

    1.2 dữ liệu trống không thể bỏ qua (Non-ignorable MD)

    Xóa những quan sát hoặc biến có giá trị trống

    Bước 3: Kiểm định tính ngẫu nhiên của missing data pattern

Tài liệu cùng người dùng

Tài liệu liên quan