QUẢN LÝ SỐ LIỆU - BIẾN LIÊN TỤC (BIẾN ĐỊNH LƯỢNG), ĐẠI HỌC Y TẾ CÔNG CỘNG

12 248 0
QUẢN LÝ SỐ LIỆU - BIẾN LIÊN TỤC (BIẾN ĐỊNH LƯỢNG), ĐẠI HỌC Y TẾ CÔNG CỘNG

Đang tải... (xem toàn văn)

Tài liệu hạn chế xem trước, để xem đầy đủ mời bạn chọn Tải xuống

Thông tin tài liệu

18 Qun lý s liu - bin liên tc (bin nh lng) I. Qun lý s liu cho bin liên tc 1.1 Tìm hiu s liu 2i và lu tp tin s liu ivf.sav t trang web elearning ca khóa hc vào máy tính ca bn. Nhp chut vào b s liu ivf va ti v máy  m tp tin. Nu trên ca s SPSS Data Editor không phi  ch “Data view” nhp vào tab Data View  góc di trái ca ca  vào ch này. 6 liu này bao gm nhng bin s v nhng a tr sinh mt ca nhng bà m c th thai trong ng nghim (in-vitro fertilisation). Nghiên cu này ã c báo cáo trong tp chí BMJ (1990;300:1229-1233). Tp tin này bao gm 641 a tr. B  liu này gm có nhng bin s nào? ng dn : Có nhiu cách  xác nh này có bao nhiêu bin s. Nu chúng ta  trong DataView, có th tìm thy tên bin  hàng trên cùng ca li s liu tuy nhiên vi cách ó chúng ta không có chi bit v các bin s. Mun bin v chi tit ca bin s chúng ta có hai cách (a) s dng menu: Utilities/Variables bit có bao nhiêu bin s, nhng bin só là gì và có nhng tính cht gì hoc (b) nhp vào tab “Variable View”. Nu ang  ch “Variable View” có th chuyn qua ch “Data View” bng cách nhp vào tab “Data View”. Tr li: Sau khi thc hin nhng thao tác trên bn có kt qu: S liu này gm 6 bin s có chi tit nh sau: Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m 19 Stt Tên bin Nhãn bin Gii thích 1 Id identity number of mother and baby Mã si tng 2 Matage maternal age in years Tui ca m (nm tui) 3 Ht hypertension 1=yes, 2=no Cao huyt áp thai kì 1= có 2 = không 4 Gestwks Gestational age in weeks Tui thai (tính theo tun) 5 Sex sex of baby 1=male, 2=female Gii tính ca tr 1=trai 2=gái 6 Bweight birth weight in gms Trng lng sinh tính theo grams u ý: Id là mã si tng, do ó không phân tích v sau 6p tin này có bao nhiêu bn ghi? ng dn:  bit tp tin có bao nhiêu bn ghi, có th lp bng phân phi tn sut ca t bin s bt kì (thí d nh bin sex) bng cách nhp vào Analyze/Descriptive Statistics/Frequencies Và bn có kt qu : Statistics Sex of infant 641 0 Valid Missing N Tr li: tp tin này có 641 bn ghi và không có quan sát nào  bin gii tính b thiu thông tin c. 6 Các giá tr ca bin id, ht, sex, matage, bweight, matagegp và gestcat có 2 s l thp phân không cn thit nên chúng ta hãy loi b các con s thp phân này. ng dn:   to nhãn cho các bin s, chuyn sang ch  “Variable View” bng cách nhp vào tab Variable View  góc trái di màn hình. Nhp con tr vào ô ca hàng id và ct Decimal ta thy hin lên mt nút có mi tên lên xung hin lên  góc phi. Nhp vào nút mi tên xung sao cho giá tr ca ô này (ô Decimal) bng 0. Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m 20 2Thc hin tng t vi các bin ht, sex, matage, bweight, matagegp và gestcat. (Ch tr bin gestwks là cn phi làm s ch s thp phân). 6 Hãy to nhãn cho các bin s ht, sex, matagegp và gestcat ng dn:   to nhãn cho các bin s, chuyn sang ch  “Variable View” bng cách nhp vào tab Variable View  góc trái di màn hình. Nhp con tr vào ô ca hàng ht và ct value ta thy hin lên mt nút lnh vi 3 du chm hin lên  góc phi. (Nu chúng ta nhp vào phía bên phi ca ô này thì ca s Value labels s hin lên). Nhp vào nút lnh này  hin ra ca s Value labels. Gán giá tr 1 là “cao huyet ap”. Nhn nút Add và tip tc gán giá tr 2 là “khong cao huyet ap”. Nhp nút lnh Add ln a. Nhp vào nút lnh OK hoàn tt. Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m 21 ng t i vi bin sex ta gán giá tr 1=”nam” 2=”nu”; bin matagegrp ta gán 1=”<30” 2=”30-34” ; 3=”35-39” ; 4=”40+” và gestcat 1 = “sinh non” 2 = “sinh du thang” Sau ó nhp vào tab “Data View”  xem các giá trã mã hoá. Nu các giá trã mã hoá cha xut hin, hãy chn menu View/Variable Value làm hin th các giá trã mã hoá. 6 Lu li tp tin. ng dn: lu li tp tin chúng ta có th s dng mt trong 3 cách sau: a) Nhp vào hình chic a mm trên Data Editor Toolbar b) Nhn Ctrl-S c) S dng menu File – Save. Nu chúng ta không mun làm thay i giá tr ca s liu ngun hãy lu tp tin vi tên khác bng cách s dng menu File/Save As. 1.2 Làm sch s liu cho bin liên tc Trong làm sch s liu, chúng ta kim tra các li có th gp sau ây: - Các giá tr bt thng - Kim tra vic nhp liu - Kim tra tính ng nht 1Kim tra giá tr bt thng  kim tra giá tr bt thng ca các bin snh lng, chúng ta s dng: - Các thông s thng kê tóm tt: giá tr nh nht, giá tr ln nht - Biu : a giác tn s (histogram) 1.2.1 Các s thng kê tóm tt  xem giá tr nh nht, ln nht, trung bình… chúng ta dùng lnh Frequencies (Analysis /Descriptives Statistics/Frequencies) và có màn hình lnh nh sau: Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m 22 u ý: bn nên tt tùy chn Display frequency tables  kt qu ca chúng ta không có bng phân b tn s ca tng giá tr- vì nó quá dài và không có ích trong trng p này. Hãy chn bin mà bn mun tính và chuyn sang ca s Variable(s). Trong trng hp này chúng ta chn bin bweight i kích vào du  chuyn sang. Sau ó bn hãy kích vào tùy chn Options và bn có ca s nh sau hin lên: t qu ca lnh nh sau: Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m 23 Descriptive Statistics 641 630.00 4650.00 3129.5055 641 Birthweight Valid N (listwise) N Minimum Maximum Mean a vào con s nh nht, ln nht, chúng ta xem xét có giá tr bt thng nào hay không, ví d nu cân nng khi sinh bng 0 hoc >6000 gram chng hn. Trong trng hp này, không có s bt thng nào c. 1.2.2 Biu  Chúng ta dùng a giác tn s kim tra liu bin “trng lng s sinh” có giá tr bt thng nào không.  va giác tn s ca bin trng lng s sinh, chúng ta hãy s dng menu Graphs – Histogram. Chn bin s bweight vào hp Variable. Nhp nút lnh OK  hoàn tt. Biu a giác tn s ca trng lng s sinh c th hin trong ca s Output và có ng nh sau. Nu bn mun th hin ng cong phân b chun thì các bn hãy kích vào tùy chn Display normal curve trong ca s lnh trên. Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m 24 Khi ó, chúng ta s xem trên biu  có s liu nào ln bt thng hoc nh bt thng hay không (xem  vòng tròn ). 6Hãy kim tra bin tui ca m nhng ph n trong nghiên cu này. ng dn: c 1: Dùng các s thng kê tóm tt.  mô t giá tr ln nht, nh nht, trung bình, và  lch chun, tr li các bc nh mô  phn trên. Chn Miximum (nh nht) và Maximum (ln nht), Mean (trung bình) và Standard variable ( lch chun), chúng ta có kt qu nh sau: Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m 25 Descriptive Statistics 641 23.00 43.00 33.9719 3.87046 641 Maternal age Valid N (listwise) N Minimum Maximum Mean Std. Deviation ng này cng cho thy không có giá tr bt thng nào. c 2: Hãy kim tra a giác tn s ca tui khi sinh ca nhng bà m trong nghiên cu theo các bc  trên bn s có nhng kt qu sau a giác tn s vi ng cong phân b chun. Biu  này cho thy không có giá tr nh hoc ln bt thng nào. 6u có giá tr bt thng, chúng ta phi làm gì: Khi phát hin có giá tr bt thng, chúng ta phi: - So sánh vi b s liu gc, nu úng nh b s liu gc và s liu là chính xác, gi nguyên. Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m 26 - u so vi b s liu gc và thy không úng vi giá tr trong b s liu gc, sa theo giá tr trong b s liu gc. - u không có b s liu gc và s lng giá tr bt thng không quá nhiu (<5%  s liu), không phân tích các s liu này. - u không có b s liu gc và s lng giá tr bt thng nhiu (<5% b s liu), có th s dng phân tích các s liu này. 1Kim tra vic nhp liu Kim tra vic nhp liu c thc hin khi nhp liu vi mc ích là m bo vic nhp liu y  và chính xác. Thông thng: - Nhp b s liu hai ln bi hai ngi khác nhau, sau ó so sánh hai b s liu. Cách này khó thc hin i vi các b s liu ln do tn ngun lc và thi gian - Nhp toàn b s liu 1 ln, sau ó ly khong 10 – 15% b s liu nhp riêng và so sánh hai nhóm. 1Kim tra tính ng nht Ví d kim tra nm sinh  chc rng không có i tng nào có s tui âm. 1.3 To bin s mi o bin s mi khi: - Câu hi nghiên cu không có bin sn có trong b s liu, ví d câu hi nghiên u “có bao nhiêu tr sinh  tháng và thiu tháng?”, trong b s liu, chúng ta ch có bin tui thai tính theo tun (bin nh lng) mà không có bin  tháng hay thiu tháng, do ó chúng ta phi to ra bin s này. 6 Hãy to ra các bin s mi theo yêu cu sau: Bin cn phi phân nhóm Tên bin Phân nhóm Tui ca m phân nhóm matagegrp (1=<30; 2=30-34;3=35-39;4=40+) Tui thai phân nhóm gestcat (1= <37 tun; 2=37+tun) Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m 27 ng dn: S dng Menu Transform/Recode/Into difference variables mã hoá bin matage thành bin matagegrp Sau khi xut hin ca s Recode into difference variables, chúng ta chn bin matage vào hp Numeric variable và gõ tên matagegrp vào Output variable. Nhn nút lnh Change. Sau ó nhp vào nút lnh Old and New Values hin ra ca s: Recode into difference variable: Old and New Values. mã hoá bin matage có giá tr t ti thiu lên n 29 thành bin matagegrp có giá tr là 1, chúng ta nhp vào nút chn Range Lowest to và gõ vào hp s Range Lowest to giá tr 29 và hp Value (trong khung New Value) giá tr 1 nh trong hình sau. Sau ó chúng ta nhp vào nút lnh Add và tip tc chn nút chn Range __ through __ i giá tr 1 là 30 và giá tr sau là 34. Hp value khung New Value sc nhn giá tr 2. Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m [...]... giá tr 4 Nh n nút l nh Add Khi ó chúng ta ã có khung New Value s c các y u c u mã hoá n m trong h p Old->New Nh p nút l nh Continue OK tr v c a s Recode into Different Variable Nh p nút l nh hoàn t t 28 d o o c m C m w o d o w w w w w C lic k to bu y N O W ! PD O W ! PD c u-tr a c k c H F-XC A N GE H F-XC A N GE c u-tr a c k N y bu to k lic u ý: Ph i ki m tra bi n g c tr Ph i ki m tra bi n tu i tr...H F-XC A N GE H F-XC A N GE c u-tr a c k N y bu to k lic Nh n nút l nh Add Th c hi n t ng t mã hoá matage t 3 5-3 9 là 3: ti p t c nh p vào ch n nút ch n Range through v i giá tr 1 là 35 và giá tr sau là 39 H p value khung New Value s c nh n giá tr 3 Nh n nút l nh Add mã hoá bi n matage có giá tr t 40 tr lên thành giá tr 4 Ch n nút ch n Range _ through highest, và gõ giá tr 40 vào ô n y H p value... phân sau d u ph y) nh 30, 31, 32 tu i (không ph i là 30.7 tu i… ), thì t o bi n m i nh trên u là tu i l (30,7 tu i; 34,5 tu i… ) thì khi t o bi n m i nh . thì các bn h y kích vào t y chn Display normal curve trong ca s lnh trên. Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m 24 Khi. chính xác, gi nguyên. Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m Click to buy NOW! P D F - X C H A N G E w w w . d o c u - t r a c k . c o m 26 - u so vi b. trng p n y. H y chn bin mà bn mun tính và chuyn sang ca s Variable(s). Trong trng hp n y chúng ta chn bin bweight i kích vào du  chuyn sang. Sau ó bn h y kích vào t y chn

Ngày đăng: 02/08/2015, 08:49

Từ khóa liên quan

Tài liệu cùng người dùng

Tài liệu liên quan