chương 5 các phép biến đổi và thao tác trên tập dữ liệu

13 753 1
chương 5  các phép biến đổi và thao tác trên tập dữ liệu

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

Phân tích dữ liệu bằng SPSS CHƯƠNG 5: CÁC PHÉP BIẾN ĐỔI VÀ THAO TÁC TRÊN TẬP DỮ LIỆU 1. Mã hóa l i (Recode)ạ Recode là cơng c dùng mã hóa l i các giá tr trong m t bi n thành các giá tr mã hóaụ để ạ ị ộ ế ị m i phù h p v i òi h i c a q trình phân tích d li u. Ví d i v i câu h iớ ợ ớ đ ỏ ủ ữ ệ ụ đố ớ ỏ ngu n g c nh n bi t qu ng cáo c a s n ph m X, ng i tr l i có th tr l iồ ố ậ ế ả ủ ả ẩ ườ ả ờ ể ả ờ c th trên báo Sài Gòn, Tu i Tr , T p chí S c Kh e và i s ng, Trên ài HTV7,ụ ể ổ ẻ ạ ứ ỏ Đờ ố đ Trên ài VTV3, … Có th ban u các ngu n qu ng cáo c mã hóa m t cách riêngđ ể đầ ồ ả đượ ộ bi t. Tuy nhiên do nhu c u x lý sau này, ng i nghiên c u mu n nhóm các giá trệ ầ ữ ườ ứ ố ị c mã hóa riêng bi t này thành ba lo i ngu n qu ng cáo chính là Báo, T p Chí vàđượ ệ ạ ồ ả ạ Tivi. Cơng c Recode cho phép ta nh l i các giá tr riêng bi t v ngu n qu ngụ đị ạ ị ệ ề ồ ả cáo ban u thành ba ngu n qu ng cáo chung là Báo, Tivi và t p chí.đầ ồ ả ạ SPSS cung c p cho ta hai lo i Recode là Recode trên cùng m t bi n (Recode intoấ ạ ộ ế same variables) và recode vào bi n khác (Recode into different variable).ế 1.1. Mã hóa lại trên cùng một biến (Recode into same variables) Recode trên cùng một biến là mã hóa lại những giá trị trong một biến hiện hữu thành những giá trị mới và các giá trị mới này sẽ nằm ngay trong biến hiện hữu và thay thế các giá trị củ trên biến đó. Khi sử dụng cơng cụ này ta sẽ mất đi các giá trị đã khai báo ban đầu trong biến mà ta thực hiện lệnh Recode. Chú ý các giá trị vừa được tạo ra chưa có nhãn, do đó sau khi thực hiện lệnh ta phải tiến hành khai báo nhãn cho giá trị (đã đề cập trong phần khai báo biến). Phương pháp này được thực hiện qua các bước sau: - Ch n ọ transform/recode t thanh menu chính. ây ta l a ch n ừ Ở đ ự ọ Recode into same variable ti n hành nh l i giá tr c a bi n trên cùng m t bi n.để ế đị ạ ị ủ ế ộ ế Ta có h p tho i nh hình 5-1:ộ ạ ư Biên soạn: Đào Hoài Nam 19 Phân tích dữ liệu bằng SPSS Hình 5-1 - Chuy n các bi n c n mã hóa l i sang h p tho i variables, nh n thanh Oldể ế ầ ạ ộ ạ ấ and New Values chuy n các giá tr c c n thay i thành các giá tr m i.để ể ị ủ ầ đổ ị ớ Ta có h p tho i Old and New values nh hình 5-2:ộ ạ ư Hình 5-2 - Old value dùng khai báo giá tr c c n chuy n i. Giá tr c này có th làđể ị ủ ầ ể đổ ị ủ ể m t giá tr n lộ ị đơ ẻ(Value), m t giá tr khuy t m c nh hay giá tr khuy tộ ị ế ặ đị ị ế khai báo (System-missing or User-missing), m t dãy các giá tr ộ ị (Range), ho cặ tồn b các giá tr nào ó trong bi n (ộ ị đ ế All other values). New value dùng để khai báo giá tr m i s thay th cho giá tr c t ng ng. Nh n thanh ị ớ ẽ ế ị ủ ươ ứ ấ Add l u s chuy n i này. Các giá tr chuy n i có th s a ch a ho c lo iđể ư ự ể đổ ị ể đổ ể ử ử ặ ạ b b ng cách di chuy n v t t i n bi u th c th hi n s chuy n iỏ ằ ể ệ ố đế ể ứ ể ệ ự ể đổ trong h p tho i ộ ạ Old->New và nh n thanh ấ Change cho s thay i ho cự đổ ặ Remove lo i b . để ạ ỏ - N u vi c nh l i giá tr c a các giá tr c a bi n có m t s i u ki n kèmế ệ đị ạ ị ủ ị ủ ế ộ ố đ ề ệ theo, ta có th dùng cơng c ể ụ if nh ra các i u ki n cho l nh recode.để đị đ ề ệ ệ H p tho i ộ ạ If Cases nh hình 5-3:ư Biên soạn: Đào Hoài Nam 20 Phân tích dữ liệu bằng SPSS Hình 5-3 - Trong h p tho i ộ ạ If Cases, m c nh là khơng có i u ki n nào c , phép nhặ đị đ ề ệ ả đị l i giá tr c a bi n c th c hi n cho t t c các quan sát, ây hi n th làạ ị ủ ế đượ ự ệ ấ ả ở đ ể ị Include all cases. Ch n l nh ọ ệ include if case satisfies condition xácđể nh các i u ki n trong vi c nh l i giá tr c a bi n. Chuy n tên bi n c nđị đ ề ệ ệ đị ạ ị ủ ế ể ế ầ nh l i các giá tr vào h p tho i bên ph i. Lúc này phép nh l i giá tr c a bi nđị ạ ị ộ ạ ả đị ạ ị ủ ế nói trên ch c th c hi n i v i các quan sát nào th a mãn c bi u th cỉ đượ ự ệ đố ớ ỏ đượ ể ứ i u ki n c th hi n trong h p tho i i u ki n này. Ví d ch th cđ ề ệ đượ ể ệ ộ ạ đ ề ệ ụ ỉ ự hi n l nh recode i v i nh ng tr ng h p quan sát khu v c (bi nệ ệ đố ớ ữ ườ ợ ở ự ế kvuc) TP.HCM (có giá tr mã hóa là 2) ta khai báo bi u th c i u ki n nh sauị ể ứ đ ề ệ ư kvuc = 2. 1.2. Mã hóa l i vào m t bi n khác (Recode into different variables)ạ ộ ế Trong trường hợp định lại các giá trị hiện tại của một biến thành các giá trị mới trong một biến mới ta sẽ lựa chọn transform/recode/into different variable và ta có hộp thoại như hình 5-4: Hình 5-4 S d ng ph ng pháp recode vào m t bi n m i máy tính s t ng t o ra m tử ụ ươ ộ ế ớ ẽ ự độ ạ ộ bi n m i trên c s d li u ch a các giá tr m i v a c t o ra, ng th iế ớ ơ ở ữ ệ để ứ ị ớ ừ đượ ạ đồ ờ ta c ng v n l u gi c bi n c v i các giá tr mã hóa c trên c s d li u. Chú ýũ ẫ ư ữ đượ ế ủ ớ ị ủ ơ ở ữ ệ các giá tr v a c t o ra ch a có nhãn, do ó sau khi th c hi n l nh ta ph i ti nị ừ đượ ạ ư đ ự ệ ệ ả ế hành khai báo nhãn cho giá tr ( ã c p trong ph n khai báo bi n). Vi c mã hóa l iị đ đề ậ ầ ế ệ ạ các giá tr vào trong m t bi n m i c th c hi n qua các b c sau:ị ộ ế ớ đượ ự ệ ướ - Chuy n tên bi n c n nh l i giá tr vào trong h p tho i ể ế ầ đị ạ ị ộ ạ variables. Khai báo tên bi n m i và nhãn bi n m i s ch a các giá tr v a c mã hóa l i trongế ớ ế ớ ẽ ứ ị ừ đượ ạ h p tho i ộ ạ Output variable. Nh n thanh ấ change xác nh n s khái báo này.để ậ ự Biên soạn: Đào Hoài Nam 21 Phân tích dữ liệu bằng SPSS - Các cơng c ụ If và Old and New Values c ng có ý ngh a và thao tác t ng tũ ĩ ươ ự nh tr ng h p nh l i giá tr cho cùng m t bi n, ã c c p ư ườ ợ đị ạ ị ộ ế đ đượ đề ậ ở ph n trên.ầ Cơng c này có a i m là ta v a t o ra c m t bi n m i v i các giá tr c mãụ ư đ ể ừ ạ đượ ộ ế ớ ớ ị đượ hóa theo cách m i nh ng ng th i v n gi a c bi n g c v i các giá tr mã hóaớ ư đồ ờ ẫ ữ đượ ế ố ớ ị ban u. Trong khi v i ph ng pháp mã hóa l i d li u trên cùng m t bi n, các giá trđầ ớ ươ ạ ữ ệ ộ ế ị mã hóa m i s ch ng lên các giá tr c và ta ã m t i các giá tr mã hóa ban u trênớ ẽ ồ ị ủ đ ấ đ ị đầ bi n ó.ế đ 2. Cơng cụ tự động mã hóa lại (Automatic Recode) Là ph ng pháp mã hóa t ng các giá tr d ng chu i sang d ng s vào trong m tươ ự độ ị ạ ổ ạ ố ộ bi n m i. Bi n m i này s ch a các con s ngun liên t c, m i con s ngunế ớ ế ớ ẽ ứ ố ụ ỗ ố trong bi n m i s i di n cho các giá tr d ng chu i gi ng nhau . ế ớ ẽ đạ ệ ị ạ ổ ố Ví d khi ban u ta nh p d li u a bàn nghiên c u (qu n) nh Bình Th nh,ụ đầ ậ ữ ệ đị ứ ậ ư ạ Qu n 1, Qu n 2, Tân Bình, … d ng chu i. Ta có th recode các giá tr này thành cácậ ậ ở ạ ổ ể ị giá tr s nh 1, 2, 3 m t các t ng b ng cơng c Automatic Recode. Và m iị ố ư ộ ự độ ằ ụ ỗ con s ngun này s i di n cho t ng a bàn nghiên c u, nh Qu n 1 cố ẽ đạ ệ ừ đị ứ ư ậ đượ chuy n thành 1, qu n 2 là 2, …, Qu n Tân Bình là 19. i v i cách Recode này các giáể ậ ậ Đố ớ tr ngun th y (qu n 1, qu n 2, …) s c s d ng nh là nhãn c a giá tr ãị ủ ậ ậ ẽ đượ ữ ụ ư ủ ị đ c recode trong bi n m i c t o ra t l nh Automatic Recode. Các giá trđượ ế ớ đượ ạ ừ ệ ị d ng chu i c mã hóa theo th t alphabe.ạ ổ đượ ứ ự 3. Lựa chọn các quan sát (Select Cases) Cơng cụ Select Cases đưa ra một vài phương pháp cho phép ta lựa chọn ra những nhóm nhỏ các trường hợp quan sát dựa trên tiêu chuẩn hay điều kiện cụ thể. Ta cũng có thể dùng phương pháp này để lựa chọn một mẫu ngẫu nhiên các trường hợp quan sát từ tổng thể dữ liệu. Để thực hiện lệnh lựa chọn các quan sát này ta chọn Data/select cases từ menu ta sẽ có hộp thoại như hình 5-5: Trong hộp thoại Select Cases các biến được liệt kê ở bên trái hộp thoại, Bên phải hộp thoại liệt kê các dạng lựa chọn. Lựa chọn All Cases là trạng thái lựa chọn mặc định và ở trạng thái này có ý nghĩa là tồn bộ các trường hợp quan sát đang được lựa chọn. Chú ý sau khi thực hiện việc chọn lựa các trường hợp. Các thao tác thống kê trong SPSS lúc này chỉ thực hiện trên các trường hợp được lựa chọn. Do đó sau khi thực hiện việc phân tích trên các trường hợp được lựa chọn, ta cần trả dữ liệu lại trạng thái ban đầu (kh6ng có lựa chọn các trường hợp) bằng cách chọn All Cases trong phần Select của hộp thoại Select Cases. Trong ph n ầ Unselected Cases cho bi t tr ng thái c a các tr ng h p khơng cế ạ ủ ườ ợ đượ l a ch n. ự ọ Filtered ch ra các tr ng h p khơng c ch n v n c gi l iỉ ườ ợ đượ ọ ẫ đượ ữ ạ trong t p tin nh ng s b lo i tr ra m i phân tích th ng kê. Select Cases t o raậ ư ẽ ị ạ ừ ọ ố ạ Biên soạn: Đào Hoài Nam 22 Phân tích dữ liệu bằng SPSS m t bi n l c ộ ế ọ (FILTER_$), v i các tr ng h p c ch n có giá tr 1 và các tr ngớ ườ ợ đượ ọ ị ườ h p khơng c ch n có giá tr 0. ợ đượ ọ ị Deleted cho phép lo i b tồn b các tr ng h pạ ỏ ộ ườ ợ khơng c ch n ra kh i d li u.đượ ọ ỏ ữ ệ Để nhận biết được các trường hợp nào được chọn hoặc khơng được chọn ta có thể nhìn vào các giá trị trong biến FILTER_$, các trường hợp được chọn có giá trị 1 và những trường hợp khơng được chọn có giá trị 0. Hoặc ta có thể nhìn vào màn hình Data để phân biệt các trường hợp. Với các trường hợp khơng được lựa chọn sẽ có một gạch chéo trong thanh số thứ tự hàng bên trái màn hình (Xem hình 20). Có thể dùng cơng cụ Sort Cases để xắp xếp theo thứ tự các trường hợp được chọn hay khơng được chọn (Sort cases theo biến FILTER_$). Hình 5-5 ti n hành ch n l a các tr ng h p ta có th dùng các cách sau:Để ế ọ ự ườ ợ ể - Lựa chọn cơng cụ If conditions are satisfied (xem hình 5-6) cho phép ta lựa chọn các trường hợp dựa trên các biểu thức điều kiện. Một biểu thức điều kiện cho ta các giá trị đúng hoặc sai của các trường hợp. Nếu kết quả của biều thức điều kiện là đúng, trường hợp đó được lựa chọn. Nếu kết quả này là sai hoặc thiếu thì các trường hợp đó khơng được chọn. Ví dụ đối với biến giới tính (GTinh)có hai giá trị là Nam: 1 và Nữ: 2. Ta tiến hành chọn các trường hợp là Nam bằng cách chọn biến giới tính trong hộp bên trái và chuyển sang hộp bên phải. Hiễn thị biểu thức điều kiện như sau Gtinh=1. Lúc đó các trường hợp nào thỏa mãn điều kiện Gtinh=1 sẽ được lựa chọn. Các biểu thức điều kiện có thể bao gồm tên biến, các hằng số, các tốn tử, các con số, các hàm số, … Biên soạn: Đào Hoài Nam 23 Phân tích dữ liệu bằng SPSS - Cơng cụ random sample of cases (hình 5-7) cho phép chúng ta lựa chọn một mẫu ngẫu nhiên dựa trên một tỷ lệ phần trăm hoặc một số chính xác các trường hợp sẽ lựa chọn. - Cơng cụ Base range (hình 5-8) cho phép lựa chọn các trưòng hợp theo số thứ tự hàng hiễn thị bên trái màn hình dữ liệu của SPSS Hình 5-6 Hình 5-7 Hình 5-8 4. Tách tập dữ liệu (Split File) Cơng cụ Split File cho phép tách dữ liệu trong tập dữ liệu đang quan sát thành những nhóm nhỏ riêng biệt và sau khi thực hiện lệnh Split file này các phân tích xữ lý thống kê sẽ cho ta các kết quả thống kê đã được thực hiện riêng biệt theo từng nhóm nhỏ dữ liệu này. Biên soạn: Đào Hoài Nam 24 Phân tích dữ liệu bằng SPSS Để thực hiện lệnh này ta chọn Data/Split File từ menu ta có hộp thoại như hình 5-9: Hình 5-9 Việc phân tách này dựa trên việc phân dữ liệu thành những nhóm tương đương với các giá trị trong biến được lựa chọn để tiến hành phân nhóm. Được sử dụng cho việc phân tích dựa trên những giá trị của một hay nhiều biến đã được phân nhóm. Nếu ta lựa chọn việc phân tách dựa trên nhiều biến, dữ liệu sẽ được nhóm theo thứ tự biến được khai báo trong hộp thoại Groups Based On list. - Chọn Compare groups: Các dữ liệu phân tích sẽ được tách theo các giá trị của biến được lựa chọn để tách dữ liệu (hiễn thị trong hộp Groups Based On list), và việc tách này mang tính chất so sánh do đó khi tiến hành phân tích dữ liệu các phân tích dựa trên sự phân tách này những vẫn được thể hiện trên cùng một bảng. - Chọn Organize output by groups: Các dữ liệu phân tích sẽ được tách theo các giá trị của biến được lựa chọn để tách dữ liệu (hiễn thị trong hộp Groups Based On list), và việc tách này mang tính chất tổ chức lại dữ liệu thành những nhóm nhỏ do đó khi tiến hành phân tích dữ liệu các phân tích dựa trên sự phân tách và được thể hiện một các riêng biệt giữa các nhóm phân tách Chú ý sau ki tiến hành phân tích trên sự phân tách, để trở lại trạng thái bình thường của dữ liệu đòi hỏi phải bỏ đi lệnh tách dữ liệu vừa đưa ra bằng cách chọn phần Analyze all cases, do not create groups trong hộp thoại Slipt Files 5. Cơng cụ tính tốn giữa các biến (Compute) Biên soạn: Đào Hoài Nam 25 Phân tích dữ liệu bằng SPSS Cơng c compute c dùng tính tốn gi a các giá tr trong các bi n và k t quụ đượ để ữ ị ế ế ả s c l u gi trong m t bi n m i ho c là m t bi n khác s n có ho c bi nẽ đượ ư ữ ộ ế ớ ặ ộ ế ẳ ặ ế ch a ng giá tr ang tính tốn. ứ đự ị đ Để thực hiện cơng cụ này ta truy xuất cơng cụ compute variable từ transform trên thanh menu ta có hộp thoại như hình 5-10: Hình 5-10 - Target variable ch a ng tên bi n s nh n giá tr c tính. Ta có th kháiứ đự ế ẽ ậ ị đượ ể báo ki u và gán nhãn cho các giá tr c a bi n b ng cách nh n vào thanhể ị ủ ế ằ ấ Type&lable. Ơ Numeric Expression ch a ng các bi u th c s c dùngứ đự ể ứ ố đượ tính giá tr cho bi n ích (bi n ch a ng giá tr m i), bi u th c này cóđể ị ế đ ế ứ đự ị ớ ể ứ th dùng tên các bi n s n có, các h ng, các tốn t và các hàm s . Chúng ta co thể ế ẵ ằ ử ố ể so n các bi u th c tính tốn vào th ng ơ ạ ể ứ ẵ Numeric Expression, và có th sể ữ d ng các cơng c c hi n th trong h p tho i nh các phi m ụ ụ đượ ể ị ộ ạ ư ế (+), (-), Function,… - Cơng c ụ if dùng nh ra nh ng i u ki n c n thi t kèm theo trong tínhđể đị ữ đ ề ệ ầ ế tốn n u có, c s d ng gi ng nh gi ng nh cơng c ế đượ ử ụ ố ứ ố ư ụ if trong h pộ tho i ạ recode, ã c c p ph n trên.đ đượ đề ậ ở ầ 6. Cơng c m (Count)ụ đế Biên soạn: Đào Hoài Nam 26 Phân tích dữ liệu bằng SPSS Cơng cụ này được dùng để tạo ra một biến mới chứa kết quả số lần xuất hiện (số đếm) của một giá trị hay nhiều giá trị được chỉ định ra trong danh sách các biến được chọn trong ơ variables trong mỗi trường hợp. Từ menus ta chọn Transform/count để có được hộp thoại như hình 5-11 Hình 5-11 M t bi n m i s c t o ra khi ta th c hi n th t c Count g i là bi n íchộ ế ớ ẽ đượ ạ ự ệ ủ ụ ọ ế đ (Taget variable) s ch a ng giá tr c ng d n m i khi g p c giá tr c nẽ ứ đự ị ộ ồ ỗ ặ đượ ị ầ m trong m t ho c nhi u bi n ã c khai báo tr c trong h p tho i đế ộ ặ ề ế đ đượ ướ ộ ạ Numeric variables. Giá tr c n m s c nh rõ trong ph n ị ầ đế ẽ đượ đị ầ Define values (hình 5-12). Giá tr khaiị báo m có th là nh ng giá tr c th nàu ó để đế ể ữ ị ụ ể đ (Value), ho c nh ng giá tr r ngặ ữ ị ỗ (System missing) ho c là m t dãy các giá tr ặ ộ ị (range). Sau khi khai báo giá tr c nị ầ m ta dùng thanh đế Add xác nh n giá tr c n m vào trong h p tho i để ậ ị ầ đế ộ ạ Values to count. S d ng ử ụ Change ho c ặ Remove thay th ho c lo i b giá tr c n mđể ế ặ ạ ỏ ị ầ đế (giá tr ã c ánh d u b ng v t en).ị đ đượ đ ấ ằ ế đ Hình 5-12 Biên soạn: Đào Hoài Nam 27 Phân tích dữ liệu bằng SPSS Cơng c If dùng xác nh các i u ki n n u có khi th c hi n l nh Count, (gi ngụ để đị đ ề ệ ế ự ệ ệ ố nh cơng c if trong ph n recode ã c c p trên)ư ụ ầ đ đưọ đề ậ ở 7. Hợp nhất các tập dữ liệu (Merge files) SPSS cho phép ta h p các d li u quan sát t trong m t t p d li u bên ngồi vào t pợ ữ ệ ừ ộ ậ ữ ệ ậ d li u ang s d ng. Ho c h p các bi n m i trong t p d li u bên ngồi vào t pữ ệ đ ử ụ ặ ợ ế ớ ậ ữ ệ ậ d li u ang ho t ng. C hai u t o ra m t t p d li u m i có th ch aữ ệ đ ạ độ ả đề ạ ộ ậ ữ ệ ớ ể ứ t t c các quan sát c h p l i ho c t t c các bi n c h p tùy theo ta ch nấ ả đượ ợ ạ ặ ấ ả ế đưọ ợ ọ Add Cases hay Add Variables 7.1. Thêm vào các quan sát (Add Cases) Cơng c Add Cases cho phép ta h p d li u trong t p d li u ang ho t ngụ ợ ữ ệ ậ ữ ệ đ ạ độ v i d li u trong m t t p d li u bên ngồi, v i i u ki n t p d li u ó ph iớ ữ ệ ộ ậ ữ ệ ớ đ ề ệ ậ ữ ệ đ ả ch a các bi n gi ng nh bi n trong t p d li u ang ho t ng. Sau khi thao tác,ứ ế ố ư ế ậ ữ ệ đ ạ độ m t t p d li u m i (ch a c khai báo tên, và ta ph i ti n hành l u và khai báo tênộ ậ ữ ệ ớ ư đượ ả ế ư m i) s c t o ra ch a các d li u trong c hai t p d li u v a c h p l iớ ẽ đượ ạ ứ ữ ệ ả ậ ữ ệ ừ đượ ợ ạ v i nhau. Trong tr ng h p hai t p d li u h p v i nhau nh ng có các bi n khácớ ườ ợ ậ ữ ệ ợ ớ ư ế nhau (khác nhau v tên bi n ho c lo i bi n) thì sau khi h p t p d li u m i s tề ế ặ ạ ế ợ ậ ữ ệ ớ ẽ ự ng lo i b các bi n khác nhau này, ta có th s b m t d li u ch a trong cácđộ ạ ỏ ế ể ẽ ị ấ ữ ệ ứ bi n b lo i b này.ế ị ạ ỏ Cơng cụ này rất thích hợp cho việc hợp nhất dữ liệu nghiên cứu ở các khu vực khác nhau, ví dụ như một cuộc khảo sát được tiến hành ở ba khu vực Hà Nội, Đà Nẵng, và TP.HCM, dữ liệu thu thập về sẽ được nhập, chỉnh sửa cho ba khu vực riêng biệt. Tuy nhiên sau đó ta có thể tiến hành hợp dữ liệu ở ba khu vực này vào một tập dữ liệu thống nhất để tiến hành phân tích và xữ lý. Chú ý phải thống nhất về các tên biến, loại biến và số lượng biến trong cả ba khu vực trước khi nhập 3 file này lại với nhau. Chọn Data/Merge Files/Adds Cases (Xem hình 5-13) Hình 5-13 Biên soạn: Đào Hoài Nam 28 [...]... hình 5- 15: Hình 5- 15 - Excluded Variables liệt kê các biến sẽ bị loại trừ ra khỏi biến mới hợp thành Những biến này là những biến có tên biến giống nhau Biến trong tập tin đang hoạt động được ký hiệu là (*), và những biến trong tập tin bên ngồi là (+) Nếu muốn các biến giống tên nhau này có trong tập dữ liệu mới ta phải tiến hành rename nó lại và chuyển nó sang hộp thoại chứa các biến sẽ có trong tập. .. hai tập dữ liệu ban đầu Tồn b ộ các biến trong hai tập tin ban đầu thỏa mãn các điều ki ện gi ống nhau v ề tên và loại dữ liệu (số hoặc chuổi) sẽ được liệt kê vào hộp thoại này Chúng ta cũng có thể loại bỏ những biến mà chúng ta khơng muốn có trong tập dữ liệu hợp nhất Bằng cách đánh dấu các biến đó (trong ơ variables in new data working file) và chuyển sang ơ Unpaired Variables 1.2 Thêm vào các biến. .. ại ra và khơng có trong tập dữ liệu mới được tạo ra từ việc h ợp nh ất hai t ập dữ liệu ban đầu Các biến này được ký hiệu khác nhau với ký hi ệu (*) đại diện cho các biến trong tập dữ liệu đang hoạt động và (+) đại diện cho các biến trong tập dữ liệu được truy xuất từ bên ngồi Những bi ến được li ệt kê trong hộp thoại Unpaired Variables là những biến có những đặc điểm như sau: - Hai biến có tên biến. .. Nam 30 Phân tích dữ liệu bằng SPSS Từ tập dữ liệu đang thao tác ta mở cơng cụ Data/Merge Files/Adds Variables từ menu, SPSS sẽ truy suất hộp thoại Add Variables: Read File để ta lựa chọn tập dữ liệu sẽ được hợp với tập dữ liệu đang hoạt động Nhấn Open để xác nhận việc lựa chọn này (giống như trường hợp Adds Cases - Xem hình 5- 13) Sau khi lựa chọn được tập dữ liệu sẽ hợp biến với tập dữ liệu đang hoạt... dùng một hay nhiều biến khóa để bảo đảm các trường hợp khớp với nhau (thường sử dụng biến ID chứa số bảng câu hỏi) Điều phải bảo đảm trước khi tiến hành hợp nhất biến giữa hai tập dữ liệu này là ta phải xắp xếp dữ liệu trong hai biến khóa của hai tập dữ liệu theo thứ tự từ nhỏ đến lớn - Các biến có tên giống nhau trong tập tin đang hoạt động vào tập tin bên ngồi sẽ bị loại trừ khỏi tập tin mới được tạo... Variables Biến khóa dựa vào đó các quan sát giống nhau được xác định Chú ý biến khóa này phải có cùng tên ở các hai tập tin cần hợp nhất Các trường hợp khơng thỏa mãn với biến khóa thì vẫn bao hàm trong tập dữ liệu mới nhưng sẽ khơng được hợp với các trường hợp trong tập tin khác Những trường hợp này chỉ chứa đựng giá trị riêng biệt của tập dữ liệu mà nó bao hàm từ trước (trước khi tiến hành hợp nhất) và các. ..Phân tích dữ liệu bằng SPSS Hộp thoại Read File cho phép ta lựa chọn tập dữ liệu sẽ được hợp với tập d ữ liệu đang hoạt động (working file) Nhấn Open để xác nhận việc lựa chọn này Sau khi lựa chọn xong tập dữ sẽ được kết hợp, ta sẽ có m ột h ộp tho ại m ới như hình 5- 14: Hình 5- 14  Unpaired Variables: liệt kê các biến khơng giống nhau giữa hai tập d ữ li ệu đang được tiến hành hợp nhất lại, các biến khơng... Variables) và nhấn thanh Pair, lúc đó dữ liệu trong hai biến này sẽ được hợp nhất và được chứa đựng trong biến lấy tên biến giống như tên biến trong tập tin đang hoạt động Ho ặc ta có th ể dùng cơng cụ Rename để khai báo lại tên biến hoặc kiểu biến cho giống nhau Biên soạn: Đào Hoài Nam 29 Phân tích dữ liệu bằng SPSS  Hộp thoại Variables in New Working Data File liệt kê các biến sẽ có trong tập tin mới... Variables cho phép hợp nhất dữ liệu trong tập tin đang ho ạt động với một tập tin bên ngồi với điều kiện tập tin bên ngồi này ph ải ch ứa đựng cùng các quan sát với tập tin đang sử dụng, nhưng khác nhau về biến (khai báo tên bi ến khác với tập tin đang được sử dụng), q trình này sẽ tạo ra m ột tập d ữ li ệu m ới chứa cùng các quan sát nhưng tập hợp tất cả các biến khác nhau trong hai t ập d ữ liệu ban đầu... được khai báo khác nhau - Những biến có dạng dữ liệu khác nhau - Cả hai biến biến cùng là dạng chuổi nhưng lai khơng b ằng nhau v ề số ký tự trong chuổi Cac biến này như đã nói sẽ bị loại bỏ ra khỏi tập dữ liệu vừa h ợp nh ất, điều này đồng nghĩa ta bị mất dữ liệu sau khi hợp nhất, do đó cần phải khắc phục sai sót này để bảo đảm tính đầy đủ của dữ liệu sau khi hợp nhất Các biến này sẽ được hợp lại với . Phân tích dữ liệu bằng SPSS CHƯƠNG 5: CÁC PHÉP BIẾN ĐỔI VÀ THAO TÁC TRÊN TẬP DỮ LIỆU 1. Mã hóa l i (Recode)ạ Recode là cơng c dùng mã hóa l i các giá tr trong m t bi n thành các giá tr mã. hình dữ liệu của SPSS Hình 5- 6 Hình 5- 7 Hình 5- 8 4. Tách tập dữ liệu (Split File) Cơng cụ Split File cho phép tách dữ liệu trong tập dữ liệu đang quan sát thành những nhóm nhỏ riêng biệt và sau. tích dữ liệu các phân tích dựa trên sự phân tách này những vẫn được thể hiện trên cùng một bảng. - Chọn Organize output by groups: Các dữ liệu phân tích sẽ được tách theo các giá trị của biến

Ngày đăng: 05/07/2014, 20:40

Từ khóa liên quan

Mục lục

  • 1. Mã hóa lại (Recode)

  • Recode là công cụ dùng để mã hóa lại các giá trị trong một biến thành các giá trị mã hóa mới phù hợp với đòi hỏi của quá trình phân tích dữ liệu. Ví dụ đối với câu hỏi nguồn gốc nhận biết quảng cáo của sản phẩm X, người trả lời có thể trả lời cụ thể trên báo Sài Gòn, Tuổi Trẻ, Tạp chí Sức Khỏe và Đời sống, Trên đài HTV7, Trên đài VTV3, … Có thể ban đầu các nguồn quảng cáo được mã hóa một cách riêng biệt. Tuy nhiên do nhu cầu xữ lý sau này, người nghiên cứu muốn nhóm các giá trị được mã hóa riêng biệt này thành ba loại nguồn quảng cáo chính là Báo, Tạp Chí và Tivi. Công cụ Recode cho phép ta định lại các giá trị riêng biệt về nguồn quảng cáo ban đầu thành ba nguồn quảng cáo chung là Báo, Tivi và tạp chí.

  • SPSS cung cấp cho ta hai loại Recode là Recode trên cùng một biến (Recode into same variables) và recode vào biến khác (Recode into different variable).

    • Hình 5-1

    • 1.2. Mã hóa lại vào một biến khác (Recode into different variables)

      • Hình 5-6

      • Hình 5-9

        • Hình 5-10

Tài liệu cùng người dùng

  • Đang cập nhật ...

Tài liệu liên quan