Thông tin tài liệu
18 Qun lý s liu - bin liên tc (bin nh lng) I. Qun lý s liu cho bin liên tc 1.1 Tìm hiu s liu 2i và lu tp tin s liu ivf.sav t trang web elearning ca khóa hc vào máy tính ca bn. Nhp chut vào b s liu ivf va ti v máy m tp tin. Nu trên ca s SPSS Data Editor không phi ch “Data view” nhp vào tab Data View góc di trái ca ca vào ch này. 6 liu này bao gm nhng bin s v nhng a tr sinh mt ca nhng bà m c th thai trong ng nghim (in-vitro fertilisation). Nghiên cu này ã c báo cáo trong tp chí BMJ (1990;300:1229-1233). Tp tin này bao gm 641 a tr. B liu này gm có nhng bin s nào? ng dn : Có nhiu cách xác nh này có bao nhiêu bin s. Nu chúng ta trong DataView, có th tìm thy tên bin hàng trên cùng ca li s liu tuy nhiên vi cách ó chúng ta không có chi bit v các bin s. Mun bin v chi tit ca bin s chúng ta có hai cách (a) s dng menu: Utilities/Variables bit có bao nhiêu bin s, nhng bin só là gì và có nhng tính cht gì hoc (b) nhp vào tab “Variable View”. Nu ang ch “Variable View” có th chuyn qua ch “Data View” bng cách nhp vào tab “Data View”. Tr li: Sau khi thc hin nhng thao tác trên bn có kt qu: S liu này gm 6 bin s có chi tit nh sau: Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m 19 Stt Tên bin Nhãn bin Gii thích 1 Id identity number of mother and baby Mã si tng 2 Matage maternal age in years Tui ca m (nm tui) 3 Ht hypertension 1=yes, 2=no Cao huyt áp thai kì 1= có 2 = không 4 Gestwks Gestational age in weeks Tui thai (tính theo tun) 5 Sex sex of baby 1=male, 2=female Gii tính ca tr 1=trai 2=gái 6 Bweight birth weight in gms Trng lng sinh tính theo grams u ý: Id là mã si tng, do ó không phân tích v sau 6p tin này có bao nhiêu bn ghi? ng dn: bit tp tin có bao nhiêu bn ghi, có th lp bng phân phi tn sut ca t bin s bt kì (thí d nh bin sex) bng cách nhp vào Analyze/Descriptive Statistics/Frequencies Và bn có kt qu : Statistics Sex of infant 641 0 Valid Missing N Tr li: tp tin này có 641 bn ghi và không có quan sát nào bin gii tính b thiu thông tin c. 6 Các giá tr ca bin id, ht, sex, matage, bweight, matagegp và gestcat có 2 s l thp phân không cn thit nên chúng ta hãy loi b các con s thp phân này. ng dn: to nhãn cho các bin s, chuyn sang ch “Variable View” bng cách nhp vào tab Variable View góc trái di màn hình. Nhp con tr vào ô ca hàng id và ct Decimal ta thy hin lên mt nút có mi tên lên xung hin lên góc phi. Nhp vào nút mi tên xung sao cho giá tr ca ô này (ô Decimal) bng 0. Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m 20 2Thc hin tng t vi các bin ht, sex, matage, bweight, matagegp và gestcat. (Ch tr bin gestwks là cn phi làm s ch s thp phân). 6 Hãy to nhãn cho các bin s ht, sex, matagegp và gestcat ng dn: to nhãn cho các bin s, chuyn sang ch “Variable View” bng cách nhp vào tab Variable View góc trái di màn hình. Nhp con tr vào ô ca hàng ht và ct value ta thy hin lên mt nút lnh vi 3 du chm hin lên góc phi. (Nu chúng ta nhp vào phía bên phi ca ô này thì ca s Value labels s hin lên). Nhp vào nút lnh này hin ra ca s Value labels. Gán giá tr 1 là “cao huyet ap”. Nhn nút Add và tip tc gán giá tr 2 là “khong cao huyet ap”. Nhp nút lnh Add ln a. Nhp vào nút lnh OK hoàn tt. Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m 21 ng t i vi bin sex ta gán giá tr 1=”nam” 2=”nu”; bin matagegrp ta gán 1=”<30” 2=”30-34” ; 3=”35-39” ; 4=”40+” và gestcat 1 = “sinh non” 2 = “sinh du thang” Sau ó nhp vào tab “Data View” xem các giá trã mã hoá. Nu các giá trã mã hoá cha xut hin, hãy chn menu View/Variable Value làm hin th các giá trã mã hoá. 6 Lu li tp tin. ng dn: lu li tp tin chúng ta có th s dng mt trong 3 cách sau: a) Nhp vào hình chic a mm trên Data Editor Toolbar b) Nhn Ctrl-S c) S dng menu File – Save. Nu chúng ta không mun làm thay i giá tr ca s liu ngun hãy lu tp tin vi tên khác bng cách s dng menu File/Save As. 1.2 Làm sch s liu cho bin liên tc Trong làm sch s liu, chúng ta kim tra các li có th gp sau ây: - Các giá tr bt thng - Kim tra vic nhp liu - Kim tra tính ng nht 1Kim tra giá tr bt thng kim tra giá tr bt thng ca các bin snh lng, chúng ta s dng: - Các thông s thng kê tóm tt: giá tr nh nht, giá tr ln nht - Biu : a giác tn s (histogram) 1.2.1 Các s thng kê tóm tt xem giá tr nh nht, ln nht, trung bình… chúng ta dùng lnh Frequencies (Analysis /Descriptives Statistics/Frequencies) và có màn hình lnh nh sau: Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m 22 u ý: bn nên tt tùy chn Display frequency tables kt qu ca chúng ta không có bng phân b tn s ca tng giá tr- vì nó quá dài và không có ích trong trng p này. Hãy chn bin mà bn mun tính và chuyn sang ca s Variable(s). Trong trng hp này chúng ta chn bin bweight i kích vào du chuyn sang. Sau ó bn hãy kích vào tùy chn Options và bn có ca s nh sau hin lên: t qu ca lnh nh sau: Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m 23 Descriptive Statistics 641 630.00 4650.00 3129.5055 641 Birthweight Valid N (listwise) N Minimum Maximum Mean a vào con s nh nht, ln nht, chúng ta xem xét có giá tr bt thng nào hay không, ví d nu cân nng khi sinh bng 0 hoc >6000 gram chng hn. Trong trng hp này, không có s bt thng nào c. 1.2.2 Biu Chúng ta dùng a giác tn s kim tra liu bin “trng lng s sinh” có giá tr bt thng nào không. va giác tn s ca bin trng lng s sinh, chúng ta hãy s dng menu Graphs – Histogram. Chn bin s bweight vào hp Variable. Nhp nút lnh OK hoàn tt. Biu a giác tn s ca trng lng s sinh c th hin trong ca s Output và có ng nh sau. Nu bn mun th hin ng cong phân b chun thì các bn hãy kích vào tùy chn Display normal curve trong ca s lnh trên. Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m 24 Khi ó, chúng ta s xem trên biu có s liu nào ln bt thng hoc nh bt thng hay không (xem vòng tròn ). 6Hãy kim tra bin tui ca m nhng ph n trong nghiên cu này. ng dn: c 1: Dùng các s thng kê tóm tt. mô t giá tr ln nht, nh nht, trung bình, và lch chun, tr li các bc nh mô phn trên. Chn Miximum (nh nht) và Maximum (ln nht), Mean (trung bình) và Standard variable ( lch chun), chúng ta có kt qu nh sau: Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m 25 Descriptive Statistics 641 23.00 43.00 33.9719 3.87046 641 Maternal age Valid N (listwise) N Minimum Maximum Mean Std. Deviation ng này cng cho thy không có giá tr bt thng nào. c 2: Hãy kim tra a giác tn s ca tui khi sinh ca nhng bà m trong nghiên cu theo các bc trên bn s có nhng kt qu sau a giác tn s vi ng cong phân b chun. Biu này cho thy không có giá tr nh hoc ln bt thng nào. 6u có giá tr bt thng, chúng ta phi làm gì: Khi phát hin có giá tr bt thng, chúng ta phi: - So sánh vi b s liu gc, nu úng nh b s liu gc và s liu là chính xác, gi nguyên. Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m 26 - u so vi b s liu gc và thy không úng vi giá tr trong b s liu gc, sa theo giá tr trong b s liu gc. - u không có b s liu gc và s lng giá tr bt thng không quá nhiu (<5% s liu), không phân tích các s liu này. - u không có b s liu gc và s lng giá tr bt thng nhiu (<5% b s liu), có th s dng phân tích các s liu này. 1Kim tra vic nhp liu Kim tra vic nhp liu c thc hin khi nhp liu vi mc ích là m bo vic nhp liu y và chính xác. Thông thng: - Nhp b s liu hai ln bi hai ngi khác nhau, sau ó so sánh hai b s liu. Cách này khó thc hin i vi các b s liu ln do tn ngun lc và thi gian - Nhp toàn b s liu 1 ln, sau ó ly khong 10 – 15% b s liu nhp riêng và so sánh hai nhóm. 1Kim tra tính ng nht Ví d kim tra nm sinh chc rng không có i tng nào có s tui âm. 1.3 To bin s mi o bin s mi khi: - Câu hi nghiên cu không có bin sn có trong b s liu, ví d câu hi nghiên u “có bao nhiêu tr sinh tháng và thiu tháng?”, trong b s liu, chúng ta ch có bin tui thai tính theo tun (bin nh lng) mà không có bin tháng hay thiu tháng, do ó chúng ta phi to ra bin s này. 6 Hãy to ra các bin s mi theo yêu cu sau: Bin cn phi phân nhóm Tên bin Phân nhóm Tui ca m phân nhóm matagegrp (1=<30; 2=30-34;3=35-39;4=40+) Tui thai phân nhóm gestcat (1= <37 tun; 2=37+tun) Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m 27 ng dn: S dng Menu Transform/Recode/Into difference variables mã hoá bin matage thành bin matagegrp Sau khi xut hin ca s Recode into difference variables, chúng ta chn bin matage vào hp Numeric variable và gõ tên matagegrp vào Output variable. Nhn nút lnh Change. Sau ó nhp vào nút lnh Old and New Values hin ra ca s: Recode into difference variable: Old and New Values. mã hoá bin matage có giá tr t ti thiu lên n 29 thành bin matagegrp có giá tr là 1, chúng ta nhp vào nút chn Range Lowest to và gõ vào hp s Range Lowest to giá tr 29 và hp Value (trong khung New Value) giá tr 1 nh trong hình sau. Sau ó chúng ta nhp vào nút lnh Add và tip tc chn nút chn Range __ through __ i giá tr 1 là 30 và giá tr sau là 34. Hp value khung New Value sc nhn giá tr 2. Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m [...]... giá tr 4 Nh n nút l nh Add Khi ó chúng ta ã có khung New Value s c các y u c u mã hoá n m trong h p Old->New Nh p nút l nh Continue OK tr v c a s Recode into Different Variable Nh p nút l nh hoàn t t 28 d o o c m C m w o d o w w w w w C lic k to bu y N O W ! PD O W ! PD c u-tr a c k c H F-XC A N GE H F-XC A N GE c u-tr a c k N y bu to k lic u ý: Ph i ki m tra bi n g c tr Ph i ki m tra bi n tu i tr...H F-XC A N GE H F-XC A N GE c u-tr a c k N y bu to k lic Nh n nút l nh Add Th c hi n t ng t mã hoá matage t 3 5-3 9 là 3: ti p t c nh p vào ch n nút ch n Range through v i giá tr 1 là 35 và giá tr sau là 39 H p value khung New Value s c nh n giá tr 3 Nh n nút l nh Add mã hoá bi n matage có giá tr t 40 tr lên thành giá tr 4 Ch n nút ch n Range _ through highest, và gõ giá tr 40 vào ô n y H p value... phân sau d u ph y) nh 30, 31, 32 tu i (không ph i là 30.7 tu i… ), thì t o bi n m i nh trên u là tu i l (30,7 tu i; 34,5 tu i… ) thì khi t o bi n m i nh . thì các bn h y kích vào t y chn Display normal curve trong ca s lnh trên. Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m 24 Khi. chính xác, gi nguyên. Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m 26 - u so vi b. trng p n y. H y chn bin mà bn mun tính và chuyn sang ca s Variable(s). Trong trng hp n y chúng ta chn bin bweight i kích vào du chuyn sang. Sau ó bn h y kích vào t y chn
Ngày đăng: 02/08/2015, 08:49
Xem thêm: QUẢN LÝ SỐ LIỆU - BIẾN LIÊN TỤC (BIẾN ĐỊNH LƯỢNG), ĐẠI HỌC Y TẾ CÔNG CỘNG, QUẢN LÝ SỐ LIỆU - BIẾN LIÊN TỤC (BIẾN ĐỊNH LƯỢNG), ĐẠI HỌC Y TẾ CÔNG CỘNG