Top Banner
SPSS TH T LÀ Đ N GI N Ơ Hoàng Sĩ Thính Department of Finance Faculty of Accounting and Business Management Vietnam National University of Agriculture Mobile: +84942293689 Email: [email protected] Facebook: [email protected]
73

Spss lesson #1 #4.1 (Vietnamese)

Jul 03, 2015

Download

Data & Analytics

Hoang Si Thinh

SPSS code book, preparing data file, entering data, screening and cleaning data, descriptives statistics
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Spss lesson #1 #4.1 (Vietnamese)

SPSS TH T LÀ Đ N GI NẬ Ơ Ả

Hoàng Sĩ Thính

Department of Finance

Faculty of Accounting and Business Management

Vietnam National University of Agriculture

Mobile: +84942293689

Email: [email protected]

Facebook: [email protected]

Page 2: Spss lesson #1 #4.1 (Vietnamese)

N I DUNGỘ

• Ph n 1: B t tay v i SPSSầ ắ ớ1. Thi t k m t nghiên c uế ế ộ ứ2. Chu n b mã bi n (codebook)ẩ ị ế3. Giao di n SPSSệ

• Ph n 2: Chu n b file d li uầ ẩ ị ữ ệ4. T o file s li u và nh p d li uạ ố ệ ậ ữ ệ5. Ki m tra và “ể làm s chạ ” d li uữ ệ

• Ph n 3: Nh ng phân tích s li u căn b nầ ữ ố ệ ả6. Phân tích th ng kê mô tố ả7. Phân tích s li u b ng đ thố ệ ằ ồ ị8. Qu n lý, bi n đ i d li uả ế ổ ữ ệ9. Ki m tra đ tin c y c a thang đoể ộ ậ ủ10. L a ch n và s d ng các k thu t thông kêự ọ ử ụ ỹ ậ

Page 3: Spss lesson #1 #4.1 (Vietnamese)

N I DUNGỘ

• Ph n 4: Công c th ng kê phân tích m i quan h gi a các bi nầ ụ ố ố ệ ữ ế11. T ng quanươ12. T ng quan t ng ph nươ ừ ầ13. H i quy đa bi nồ ế14. H i quy logisticsồ15. Phân tích nhân t (Factor analysis)ố

• Ph n 5: K thu t so sánh các nhómầ ỹ ậ16. K thu t phân tích phi tham sỹ ậ ố17. Ki m đ nh sai khác s trung bình c a các nhóm (T-test)ể ị ố ủ18. Ki m đ nh khác bi t gi a hai ho c nhi u nhóm (F-test; ho c one-way ể ị ệ ữ ặ ề ặ

analysis of variance – ho c One-way ANOVA)ặ19. Ki m đ nh Two-way analysis of varianceể ị20. Ki m đ nh Mixed between-within subjects aualysis of variance (s chi ti t ể ị ẽ ế

sau)21. Multivariate analysis of variance22. Analysis of covariance

Page 4: Spss lesson #1 #4.1 (Vietnamese)

1. Thi t k m t nghiên c uế ế ộ ứ• Thi t k nghiên c u theo ki u nào (th c nghi m, đi u tra, quan sát) ế ế ứ ể ự ệ ề

nh m tr l i câu h i nghiên c uằ ả ờ ỏ ứ• N u là nghiên c u th c nghi m: chú ý s khác bi t gi a các nhóm: các ế ứ ự ệ ự ệ ữ

nhóm khác nhau cùng đi u ki n, ho c cùng m t nhóm nh ng khác đi u ề ệ ặ ộ ư ềki nệ

• Trong nghiên c u th c nghi m, chú ý c n có đ bi n đ c l p đ k t lu n ứ ự ệ ầ ủ ế ộ ậ ể ế ậđ a ra đ c th a đáng.ư ượ ỏ

• C g ng bao g m trong k ho ch nhi u h n nh ng gì nghiên c u c n ố ắ ồ ế ạ ề ơ ữ ứ ầ(n i dung, đ i t ng): tránh r i roộ ố ượ ủ

• Trong nghiên c u th c nghi m, các n i dung, ph m vi đ i t ng c n th a ứ ự ệ ộ ạ ố ượ ầ ỏđáng (đ ), các nhóm nên đ c đ t trong các đi u ki n t ng đ ng.ủ ượ ặ ề ệ ươ ồ

• Ch n bi n ph thu c phù h p (“ọ ế ụ ộ ợ có ý nghĩa lý lu nậ ”)• Tránh s d ng các bi n không rõ ràng. Hãy tham v n chuyên gia v v n ử ụ ế ấ ề ấ

đ nàyề• Nh ph i đi u tra th (n u có phi u đi u tra)ớ ả ề ử ế ế ề• N u nghiên c u th c nghi m, hãy ch c ch n m i đi u ki n đ c chu n ế ứ ự ệ ắ ắ ọ ề ệ ượ ẩ

b k càngị ỹ

Page 5: Spss lesson #1 #4.1 (Vietnamese)

Các chú ý khi l a ch n thang đo (scales) và đ n v đo (measures) ự ọ ơ ị

– Đáng tin c y (reliability): t c là không b nh h ng b i các sai s ng u ậ ứ ị ả ưở ở ố ẫnhiên. • Các l n th (đi u tra l p l i) khác nhau cho cùng đ i t ng ph i ầ ử ề ặ ạ ố ượ ả

không khác nhau (tin c y theo th i gian, ho c test-retest reliability, ậ ờ ặho c temporal stability);ặ

• Và ch c ch n theo n i dung c n đo đ c (internal consistency): ví d ắ ắ ộ ầ ạ ụk t qu tr l i “ế ả ả ờ b n có thích s d ng xe đ p không?ạ ử ụ ạ ” và “b n có ạghét xe đ p không?ạ ”

– Tính chính xác (validity): thang đo có đo đúng n i dung mà ng i nghiên ộ ườc u c n không? Bao g m: ứ ầ ồ• chính xác v n i dung (content validity, ho c chính xác v m t lôgic ề ộ ặ ề ặ

– logical validity); • tính h p lý (chính xác) trong m c đ thang đo c a các bi n khác ợ ứ ộ ủ ế

nhau (criterion validity), ví d : IQ cao h n thì th ng đi m s cao ụ ơ ườ ể ốh n; ơ

• tính chính xác v nguyên lý (construct validity)ề

Page 6: Spss lesson #1 #4.1 (Vietnamese)

Các d ng đo l ng c a thang đo (measurement scale, ạ ườ ủho c ki u s li u – types of data)ặ ể ố ệ

• Có 4 ki u s li u (ki u đo l ng c a m t thang đo): ể ố ệ ể ườ ủ ộnominal (ki u đ nh danh), ordinal (ki u m c đ theo th ể ị ể ứ ộ ứt ), interval (d ng s ) , và ratio (d ng s hoàn h o)ự ạ ố ạ ố ả

• D ng thang đo đ nh danh (nominal scale): là d ng thang đo ạ ị ạ“th pấ ” nh t.ấ– ch là con s (hay nhãn) gán cho m t l a ch n nào đó. Ch ng ỉ ố ộ ự ọ ẳ

qua ch đ phân lo i (categorize) câu tr l i, không có ý nghĩa ỉ ể ạ ả ờv th t hay c u trúcề ứ ự ấ

– Ví d : Yes, No; 1 = Brown, 2 = Black, 3 = Blond, 4 = Gray, 5 = ụOther.

– X lý trong th ng kê: th ng kê phi tham s (non-parametric ử ố ố ốgroup), th ng g p nh t là mode (xu t hi n nhi u nh t), ườ ặ ấ ấ ệ ề ấCrosstabulation with chis-quare. Ngoài ra s li u d ng nominal ố ệ ạcũng đ c dùng trong các mô hình ph c t p. ượ ứ ạ

Page 7: Spss lesson #1 #4.1 (Vietnamese)

Các d ng đo l ng c a thang đo (measurement scale, ạ ườ ủho c ki u s li u – types of data)ặ ể ố ệ

• D ng s li u th t (ordinal): Ph bi n cho d ng câu h i yêu c u ạ ố ệ ứ ự ổ ế ạ ỏ ầs p x p th h ng (ranking) ho c cho đi mắ ế ứ ạ ặ ể– Ví d :ụ

– D ng s li u th t cho bi t m c đ (l n, bé), tuy nhiên không ạ ố ệ ứ ự ế ứ ộ ớcho bi t chính xác kho ng cách th c gi a các giá tr (ví d ế ả ự ữ ị ụkho ng cách t r t không h nh phúc đ n không h nh phúc)ả ừ ấ ạ ế ạ

– K thu t th ng kê có th s d ng: th ng kê phi tham s (non-ỹ ậ ố ể ử ụ ố ốparamatric statistics):• Median and Mode; t ng quan th t (rank order correlation); phân ươ ứ ự

tích ph ng sai phi tham s (non-paramatric analysis of variance)ươ ố• M t s k thu t mô hình cũng có th áp d ng v i s li u theo t tộ ố ỹ ậ ể ụ ớ ố ệ ứ ự

Page 8: Spss lesson #1 #4.1 (Vietnamese)

Các d ng đo l ng c a thang đo ạ ườ ủ(measurement scale, ho c ki u s li u – types of data) (ti p)ặ ể ố ệ ế

• Thang đo theo kho ng (interval scale – ki u s li u theo kho ng): ả ể ố ệ ảgi a các giá tr c a thang đo có m t kho ng cách (khác bi t) đ c ữ ị ủ ộ ả ệ ượnh n th c m t cách rõ r t. Khác v i s li u d ng th t (ch bi t ậ ứ ộ ệ ớ ố ệ ạ ứ ự ỉ ếkhác bi t v th t , ch không bi t kho ng cách gi a các th t ệ ề ứ ự ứ ế ả ữ ứ ựm t cách chính xác)ộ– Ví d : Câu h i yêu c u ng i tr l i đánh giá m c đ hài lòng d a ụ ỏ ầ ườ ả ờ ứ ộ ự

trên thang đo có 7 m c (t không hài lòng = 7 đ n r t hài lòng = 7).ứ ừ ế ấ– K thu t th ng kê áp d ng: ỹ ậ ố ụ

• Th ng kê tham s (parametric statistics): s trung bình (mean) và đ l ch ố ố ố ộ ệchu n (standard deviation); t ng quan r (correlation r); h i quy ẩ ươ ồ(regression);phân tích ph ng sai; phân tích nhân t (factor analysis)ươ ố

• Và t t c các k thu t th ng kê đa bi n và mô hình hóa chuyên sâuấ ả ỹ ậ ố ế

Page 9: Spss lesson #1 #4.1 (Vietnamese)

Các d ng đo l ng c a thang đo ạ ườ ủ(measurement scale, ho c ki u s li u – types of data) (ti p)ặ ể ố ệ ế

• Thang đo d ng s (t s - ratio – ki u s li u ạ ố ỷ ố ể ố ệs , ho c t s ): Là d ng s li u “ố ặ ỷ ố ạ ố ệ cao c p ấnh tấ ” trong th ng kê.ố– S khác bi t gi a s li u d ng kho ng (interval) ự ệ ữ ố ệ ạ ả

và d ng s (ratio): d ng interval không có m t s ạ ố ạ ộ ố0 tuy t th c s (ch ng h n nhi t đ ), trong khi ệ ự ự ẳ ạ ệ ộd ng ratio có s 0 th c s (ví d đo đ dài)ạ ố ự ự ụ ộ

– K thu t th ng kê: t ng t s li u d ng intervalỹ ậ ố ươ ự ố ệ ạ

Page 10: Spss lesson #1 #4.1 (Vietnamese)

Các chú ý khi phát tri n b ng câu h i (phi u đi u tra)ể ả ỏ ế ề

• Mình d đ nh s s d ng thông tin thu th p đ c nh th nào?ự ị ẽ ử ụ ậ ượ ư ế

• K thu t th ng kê nào s đ c s d ng đ x lý s li u (thông tin) s thu ỹ ậ ố ẽ ượ ử ụ ể ử ố ệ ẽth p?ậ

• Các lo i câu h i trong phi u đi u tra: câu h i đóng và câu h i mạ ỏ ế ề ỏ ỏ ở– Câu h i đóng: ng i tr l i đ c đ ngh l a ch n m t (ho c các) trong ỏ ườ ả ờ ượ ề ị ự ọ ộ ặ

nh ng l a ch n đ c ch đ nh s n. Ví d : “ữ ự ọ ượ ỉ ị ẵ ụ gi i tính c a b n là gì?ớ ủ ạ ” – nam/

n / trung tính, ho c ữ ặ “b n có đang là sinh viên ph i không?ạ ả ” – ph i/ không ảph i, …ả

– Câu h i m : ng i tr l i đ c t do đ a ra quan đi m c a mình (có th ỏ ở ườ ả ờ ượ ự ư ể ủ ểkhông gi ng v i nh ng l a ch n đã đ c li t kê s n trong câu h i), ví d : ố ớ ữ ự ọ ượ ệ ẵ ỏ ụ“nguyên nhân chính nào d n đ n áp l c trong cu c s ng c a b n th i đi m ẫ ế ự ộ ố ủ ạ ở ờ ểhi n t i?ệ ạ ”

Page 11: Spss lesson #1 #4.1 (Vietnamese)

• Thi t k d ng th c cho câu tr l i (response format) nh th nào?ế ế ạ ứ ả ờ ư ế– Thông tin thu th p s đ c x lý b ng k thu t th ng kê nào? Ví d : ậ ẽ ượ ử ằ ỹ ậ ố ụ

n u phân tích t ng quan (correlation) thì thông tin thu th p ph i là ế ươ ậ ảd ng s liên t c ạ ố ụ

– C g ng tránh h i r ng “ố ắ ỏ ằ b n có đ ng ý?ạ ồ ” hay “không đ ng ý?ồ ” mà hãy dùng thang đo Likert cho l a ch n t ự ọ ừ “r t không đ ng ýấ ồ ” (l y giá ấtr 1) đ n ị ế “r t đ ng ýấ ồ ” (l y giá tr 10).ấ ị

– Khi s d ng b t kỳ d ng th c g i ý tr l i nào, b n c n ph i gi i thích ử ụ ấ ạ ứ ợ ả ờ ạ ầ ả ảcho nó m t cách rõ ràng. Ví d : b n mu n ng i tr l i tích vào m t ô ộ ụ ạ ố ườ ả ờ ộvuông, hay khoanh tròn m t s , hay đánh m t d u trên m t hàng nào ộ ố ộ ấ ộđó.

– Không bao gi đ c nghĩ r ng “ờ ượ ằ ng i tr l i s hi u taườ ả ờ ẽ ể ”. N u có th , ế ểkèm theo h ng d n, hãy đ a ra ví d v m t câu tr l i cho câu h i ướ ẫ ư ụ ề ộ ả ờ ỏc a mình.ủ

– Lo i b t t c nh ng n i dung, t ng có th gây ra nh m l n, khó ạ ỏ ấ ả ữ ộ ừ ữ ể ầ ẫhi u. D li u đ c càng nhi u càng t t các câu tr l i có th c a ể ự ệ ượ ề ố ả ờ ể ủng i đ c h i.ườ ượ ỏ

Các chú ý khi phát tri n b ng câu h i (phi u đi u tra) (ti p)ể ả ỏ ế ề ế

Page 12: Spss lesson #1 #4.1 (Vietnamese)

Các chú ý khi phát tri n b ng câu h i (phi u đi u tra) (ti p)ể ả ỏ ế ề ế

• S d ng t ng trong thi t k câu h i đi u tra th ử ụ ừ ữ ế ế ỏ ề ếnào? Chú ý tránh:– Câu h i dài và ph c t p;ỏ ứ ạ– Ph đ nh c a ph đ nh (hãy dùng kh ng đ nh thay cho nó);ủ ị ủ ủ ị ẳ ị– Ôm đ m nhi u n i dung.ồ ề ộ– T lóng ho c vi t t từ ặ ế ắ– Ti ng ho c ng nghĩa đ a ph ngế ặ ữ ị ươ– T đa nghĩaừ– Câu h i g i ý câu tr l iỏ ợ ả ờ– Nh ng câu h i ch ý gây nh h ng đ n tâm lý ng i tr ữ ỏ ủ ả ưở ế ườ ả

l iờ

Page 13: Spss lesson #1 #4.1 (Vietnamese)

2. Mã hóa d li u (Codebook)ữ ệ• Bao g m 2 vi c chính:ồ ệ

– Đ nh nghĩa và g n nhãn cho m i bi n. Ví d : tu i có th đ c ị ắ ỗ ế ụ ổ ể ượgán mã là “age”

– G n s cho m i câu tr l i. Ví d : “ắ ố ỗ ả ờ ụ có” nh n s 1, ậ ố “không” nh n ậs 2ố

• Tên bi n: m i m t câu h i trong phi u đi u tra c n có m t ế ỗ ộ ỏ ế ề ầ ộtên bi n riêng bi t. Lu t đ t tên bi n nh sau:ế ệ ậ ặ ế ư– Tên bi n nên duy nh t (không gi ng v i bi n khác)ế ấ ố ớ ế– Nên b t đ u b ng m t ch cáiắ ầ ằ ộ ữ– Không bao g m các d u ch m (.), d u cách, ho c các bi u ồ ấ ấ ấ ặ ể

t ngượ– Không đ c phép bao g m các t l nh c a SPSS (all, ne, eq, to, ượ ồ ừ ệ ủ

le, it, by, or, gt, and, not, ge, with)– Không đ c phép v t quá 64 ký t (t t nh t là d i 8 ký t )ượ ượ ự ố ấ ướ ự

Page 14: Spss lesson #1 #4.1 (Vietnamese)

2. Mã hóa d li u (Codebook) (ti p)ữ ệ ế

• Mã hóa câu tr l i:ả ờ– M i câu tr l i c n đ c mã hóa cho m t s (n u nó ỗ ả ờ ầ ượ ộ ố ế

ch a ph i là d ng s ) tr c khi đ c nh p vào SPSS. ư ả ạ ố ướ ượ ậVí d : 1=“ụ nam”, 2=“nữ”.

– Trong các câu h i đóng có li t kê các ý tr l i, nên đ t ỏ ệ ả ờ ặs theo đúng th t li t kê (sau này d nh p li u).ố ứ ự ệ ễ ậ ệ

• Đ i v i câu h i m :ố ớ ỏ ở– Li t kê các tr l i th ng l p l i trong các câu tr l iệ ả ờ ườ ặ ạ ả ờ– M i câu tr l i th ng g p đó s đ c mã hóa cho ỗ ả ờ ườ ặ ẽ ượ

m t s .ộ ố– V i các câu tr l i khác, gán cho nó m t mã hoàn ớ ả ờ ộ

toàn khác (ví d mã 99)ụ

Page 15: Spss lesson #1 #4.1 (Vietnamese)

Ví d v mã hóa d li uụ ề ữ ệTên bi n trong phi u ế ế

đi u traềTên bi n s ế ửd ng trong ụ

SPSS

Ghi chú v mã hóaề

Identification Number ID Number assigned to each survey

Sex Sex 1 = Male2 = Female

Age Age Age in years

Marital Status Marital 1 = single2 = steady relationship3 = married for the first time4 = remarried5 = separated/divorced6 = widowed

Optimism scale items 1 to 6

Opt1 to Opt6 Enter number circled from 1 (strongly disagree) to 5 (strongly agree)

Page 16: Spss lesson #1 #4.1 (Vietnamese)

Ví d v mã hóa d li u (ti p)ụ ề ữ ệ ếĐ i v i câu h i mố ớ ỏ ở

• Câu h i: “ỏ Đâu là nguyên nhân chính gây ra áp l c trong cu c s ng c a b n hi n nay?ự ộ ố ủ ạ ệ ”

• Các câu tr l i có th s r t nhi u (tùy theo ả ờ ể ẽ ấ ềc m nh n c a t ng ng i đ c h i)ả ậ ủ ừ ườ ượ ỏ

• B n hãy nhóm các câu tr l i l i theo tính ạ ả ờ ạch t, n i dung, r i g n mãấ ộ ồ ắ

• Ví d : 1 = do công vi c; 2 = do v (ch ng, ho c ụ ệ ợ ồ ặb ),…, và 99 = nguyên nhân khácồ

Page 17: Spss lesson #1 #4.1 (Vietnamese)

3. Giao di n c a SPSSệ ủ

• Kh i đ ng SPSS: có m t s cách sau:ở ộ ộ ố– Đ a ch chu t đ n bi u t ng SPSS trên màn hình, kích đúp ư ỏ ộ ế ể ượ

vào nó;– Vào Start/Program/SPSS– Có th m b ng cách kích đúp vào m t file SPSS nào đóể ở ằ ộ

• Sau khi kh i đ ng, b n t t c a s màu xám “what would you like to ở ộ ạ ắ ử ổdo?” đi và b t đ u làm vi c v i SPSSắ ầ ệ ớ

• M m t file đã có s n: vào File/Open/Data; chú ý t t c các file ở ộ ẵ ấ ảSPSS đ u có đuôi .savề

• Ghi l i file đang làm vi c: ch n File/Save; ho c ch n bi u t ng ạ ệ ọ ặ ọ ể ượSave (n u có)ế

• M nhi u file m t lúc: ch c n vào File/Open/file c n mở ề ộ ỉ ầ ầ ở• T o file m i: Ch n File/Newạ ớ ọ

Page 18: Spss lesson #1 #4.1 (Vietnamese)

3. Giao di n c a SPSS (ti p)ệ ủ ế• Các thành ph n chính trong giao di n: Data ầ ệ

Editor; Viewer; Pivot Table Editor; và Syntax Editor– Data Editor luôn xu t hi n khi b n analyze d li uấ ệ ạ ữ ệ– Viewer luôn xu t hi n khi b n xem k t qu c a vi c ấ ệ ạ ế ả ủ ệ

phân tích (analyzing). Khi b n đang th c hi n ạ ự ệanalyzing thì Viewer s không xu t hi n.ẽ ấ ệ

• Chú ý: m i phiên b n SPSS khác nhau, các giao ỗ ảdi n có th khác nhau, nh ng b n đ u có th ệ ể ư ạ ề ểtìm th y chúng trong ph n Window trên thanh ấ ầth c đ n (menu bar) ự ơ

Page 19: Spss lesson #1 #4.1 (Vietnamese)

3. Giao di n c a SPSS (ti p)ệ ủ ế

• Giao di n ệ Data Editor: t đây b n nhìn th y ừ ạ ấn i dung file d li u c a b nộ ữ ệ ủ ạ

• B n có th làm gì trên c a s Data Editor?ạ ể ử ổ– M /đóng m t file m i/cũở ộ ớ– Ch nh s a d li u/ ghi l i fileỉ ử ữ ệ ạ– Làm m t s phân tích trên file d li uộ ố ữ ệ

• Ví d : m file survey3ED.savụ ở

Page 20: Spss lesson #1 #4.1 (Vietnamese)
Page 21: Spss lesson #1 #4.1 (Vietnamese)

3. Giao di n c a SPSS (ti p)ệ ủ ế• Giao di n Viewer: T đ ng đ c m ra khi ta ệ ự ộ ượ ở

b t đ u làm b t kỳ phân tích nàoắ ầ ấ– Mô t k t qu c a các phân tíchả ế ả ủ– Các k t qu c a s này có th đ c sao chép ra ế ả ở ử ổ ể ượ

Word– Bao g m 2 ph n: bên trái li t kê t t c nh ng n i ồ ầ ệ ấ ả ữ ộ

dung mà b n đã th c hi n phân tích. Bên ph i là ạ ự ệ ảcác k t qu chi ti t cho các phân tích (mô t bên ế ả ế ảtrái)

– Ví d :ụ

Page 22: Spss lesson #1 #4.1 (Vietnamese)
Page 23: Spss lesson #1 #4.1 (Vietnamese)

3. Giao di n c a SPSS (ti p)ệ ủ ế

• Ghi l i k t qu : trên giao di n k t qu , ch n ạ ế ả ệ ế ả ọSave

• In k t qu : ch n ph n bên trái, sang bên ph i ế ả ọ ầ ảch n ph n c n in (bôi đen – s d ng phím ọ ầ ầ ử ụcontrol và chu t trái)ộ

• Các giao di n khác: Nghiên c u sau khi đã ệ ứth c hànhự

Page 24: Spss lesson #1 #4.1 (Vietnamese)

Ph n 2. Chu n b file d li uầ ẩ ị ữ ệ(T o file d li u và nh p li u)ạ ữ ệ ậ ệ

Page 25: Spss lesson #1 #4.1 (Vietnamese)

Ph n 2. Chu n b file d li uầ ẩ ị ữ ệ(4. T o file d li u và nh p li u)ạ ữ ệ ậ ệ

• (Chú ý: ta có th thay đ i l a ch n bi u hi n c a ể ổ ự ọ ể ệ ủSPSS tr c khi t o file d li u)ướ ạ ữ ệ

• Đ nh d ng bi n: tr c khi nh p li u, b n c n ị ạ ế ướ ậ ệ ạ ầđ nh nghĩa bi n. Vi c này đ c s d ng k t h p ị ế ệ ượ ử ụ ế ợgi a Codebook và giao di n Data Editorữ ệ

• Các b c ti n hành đ nh d ng bi n:ướ ế ị ạ ế– M codebook ra (trang 3, file Word;n u không ph i ở ế ả

t o codebook tr c)ạ ướ– T o m t file m i trên SPSS, vào giao di n Data Editor, ạ ộ ớ ệ

vào giao di n Variable Viewệ

Page 26: Spss lesson #1 #4.1 (Vietnamese)
Page 27: Spss lesson #1 #4.1 (Vietnamese)

Đ nh nghĩa bi nị ế (Các khai báo)

• Name: S d ng tên nh trong codebookử ụ ư• Type (d ng bi n): d ng m c đ nh là s (numeric), n u mu n thay ạ ế ạ ặ ị ố ế ố

đ i d ng (ví d dùng d ng ch ) thì nh n chu t ph i, ho c đ a ổ ạ ụ ạ ữ ấ ộ ả ặ ưchu t vào ô ng v i bi n và d ng bi n và ch n ki u khác (ví d v i ộ ứ ớ ế ạ ế ọ ể ụ ớch thì dùng string.ữ

• Width (đ r ng): th ng là 8 ký tộ ộ ườ ự• Decimal (s th p phân): ch nh s ch s th p phân sau d u ph yố ậ ỉ ố ữ ố ậ ấ ẩ• Label (gi i thích tên bi n): ph n này cho phép b n gi i thích tên ả ế ầ ạ ả

bi n dài h n 8 ký t . Ví d bi n “TMAST” có th đ c gi i thích là ế ơ ự ụ ế ể ượ ả“Total Mastery”

• Value (giá tr bi n): ph n này cho phép đ nh nghĩa giá tr cho bi n ị ế ầ ị ị ếđã đ c mã hóaượ

Page 28: Spss lesson #1 #4.1 (Vietnamese)

Đ nh nghĩa bi nị ế (Các khai báo)

• Ví d v đ nh nghĩa bi n:ụ ề ị ếB n đang mu n đ nh nghĩa bi n cho thông tin v gi i tính ạ ố ị ế ề ớ(câu h i 1 trong phi u đi u tra); ng i tr l i s đ a ra các ỏ ế ề ườ ả ờ ẽ ưl a ch n ho c là male (nam), ho c là female (nự ọ ặ ặ )ữ– B c 1: hãy t o codebook (ho c m codebook có s n ra): b n s ướ ạ ặ ở ẵ ạ ẽ

th y tên bi n cho gi i tính là sex, mô t cho bi n là: 1 = male, 2 = ấ ế ớ ả ếfemale

– B c 2: hãy khai báo nh ng thông tin trên vào c a s Data Editor, ướ ữ ử ổph n Variable wiewầ

Page 29: Spss lesson #1 #4.1 (Vietnamese)

• Align (d ng l ): m c đ nh là l bên ph iạ ề ặ ị ề ả• Measure (ki u s li u): M c đ nh s là scale, ể ố ệ ặ ị ẽ

t c là ki u s li u liên t c đo l ng d i d ng ứ ể ố ệ ụ ườ ướ ạinterval ho c ratio. N u s li u là d ng phân ặ ế ố ệ ạlo i (categorical data) thì ch n Nominal, n u ạ ọ ếs li u là th t (ho c ranking) thì ch n ố ệ ứ ự ặ ọOrdinal.

Đ nh nghĩa bi nị ế (Các khai báo)

Page 30: Spss lesson #1 #4.1 (Vietnamese)

Đ nh nghĩa bi n (ti p)ị ế ếVí d 1ụ

• M m t file SPSS m i raở ộ ớ• M file phi u đi u tra và codebook survey (file ở ế ề

Word)ra• Ti n hành các thao tác đ nh nghĩa bi n cho t ng bi nế ị ế ừ ế

Page 31: Spss lesson #1 #4.1 (Vietnamese)

Nh p li u trong SPSSậ ệ• Sau khi đã đ nh nghĩa bi n xong, b n có th s n sàng cho vi c nh p li u ị ế ạ ể ẵ ệ ậ ệ

(nh p s li u) vào SPSS. ậ ố ệ Hãy chu n b s n t p phi u đi u tra và codebook ẩ ị ẵ ậ ế ềđ t tr c m t.ặ ướ ặ

• Các b c nh p li u nh sau:ướ ậ ệ ư1. Ch n c a s Data View (ho c sheet Data View) trên cùng c a s Data ọ ử ổ ặ ử ổ

Editor. Hãy nhìn xem k t qu b n đã làm ế ả ạ ở Ví d 1 ụ trong ph n đ nh nghĩa ầ ịbi nế

2. D a chu t vào ô đ u tiên trong file d li u. Th nghĩ xem b n s nh p ư ộ ầ ữ ệ ử ạ ẽ ậthông tin gì vào ô này??? (t t nhiên là s 1 cho ID đ u tiên r i).ấ ố ầ ồ

3. Chuy n chu t sang ô bên ph i đ đi n thông tin cho bi n th hai c a ID ể ộ ả ể ề ế ứ ủth nh t (case th nh t ho c phi u đi u tra th nh t)ứ ấ ứ ấ ặ ế ề ứ ấ

4. Ti p t c chuy n chu t sang các ô bên ph i và đi n thông tin, hãy ch c ch n ế ụ ể ộ ả ề ắ ắlà thông tin đ c đi n đúng. Đ n đây b n đã nh p xong s li u cho phi u ượ ề ế ạ ậ ố ệ ếđi u tra đ u tiên.ề ầ

5. n nút home trên bàn phím đ chu t ch y v ô ban đ u, chuy n nó xu ng Ấ ể ộ ạ ề ầ ể ốdòng th hai, l p l i các công vi c nh đ i v i phi u đi u tra th nh t ứ ặ ạ ệ ư ố ớ ế ề ứ ấ(case 1) cho phi u đi u tra th 2 (case 2)ế ề ứ

6. N u mu n s a l i giá tr c a m t bi n nào đó, b n ch c n n chu t vào nó ế ố ử ạ ị ủ ộ ế ạ ỉ ầ ấ ộ(vào ô c a bi n ng v i case đó) và đi n l i giá tr đúng.ủ ế ứ ớ ề ạ ị

• Chú ý: Hãy th ng xuyên ghi file d li u trong lúc nh p li u, vì SPSS ườ ữ ệ ậ ệkhông t đ ng ghi file cho b n. Đ ng r i ro nhé!!!ự ộ ạ ừ ủ

Page 32: Spss lesson #1 #4.1 (Vietnamese)

Đây là nh ng gì b n s th y sau khi b n hoàn thành ữ ạ ẽ ấ ạnh p li uậ ệ

Page 33: Spss lesson #1 #4.1 (Vietnamese)

Đi u ch nh (thay đ i) file d li uề ỉ ổ ữ ệ

• Các thao tác b n th ng làm đ thay đ i file d li u: thêm (add), xóa (delete), ạ ườ ể ổ ữ ệho c chuy n bi n (move variables); thêm ho c xóa case – t c là toàn b thông tin ặ ể ế ặ ứ ộcho m t phi u đi u tra)ộ ế ề

• Đ th c hi n các thao tác này, đ u tiên m c a s Data Editor/Data Viewể ự ệ ầ ở ử ổ• Delete a case (xóa toàn b thông tin c a m t phi u đi u tra: Chuy n chu t đ n ô ộ ủ ộ ế ề ể ộ ế

đ u tiên c a case c n xóa, nh n nút delete trên bàn phím; ho c ch n edit/clearầ ủ ầ ấ ặ ọ• Insert a case (chèn thêm m t phi u đi u tra): chuy n chu t vào ô đ u tiên c a ộ ế ề ể ộ ầ ủ

case ngay phía d i case mình c n chèn, vào Data/Insert Caseướ ầ• Delete a variable (xóa m t bi n – t c là xoát m t thông tin c a phi u đi u tra): ộ ế ứ ộ ủ ế ề

ch n c t c n xóa, n nút delete trên bàn phímọ ộ ầ ấ• Move an existing variable (Chuy n m t bi n đi ch khác): chuy n sang c a s ể ộ ế ỗ ể ử ổ

Variable View, ch n bi n, gi chu t và chuy n đ n n i mu n chuy nọ ế ữ ộ ể ế ơ ố ể

Page 34: Spss lesson #1 #4.1 (Vietnamese)

Nh p li u t Excelậ ệ ừ

• M t s chú ý quan tr ng:ộ ố ọ

– B n c n có nh ng hi u bi t căn b n v Excelạ ầ ữ ể ế ả ề

– Excel ch có 256 c t (t i đa cho 256 bi n), phi u đi u tra ỉ ộ ố ế ế ề

c a b n có nhi u h n, b n ph i s d ng nhi u sheet, m i ủ ạ ề ơ ạ ả ử ụ ề ỗ

sheet b t đ u b ng bi n ID, sau đó b n nh p riêng r ắ ầ ằ ế ạ ậ ẽ

t ng sheet Excel vào SPSS r i m i ti n hành vi c g p d ừ ồ ớ ế ệ ộ ữ

li u (merge files) trong SPSS (ệ vi c này s đ c chi ti t sauệ ẽ ượ ế )

Page 35: Spss lesson #1 #4.1 (Vietnamese)

Nh p li u t Excelậ ệ ừCác b c ti n hànhướ ế

• B c 1: Set up the variable name (đ t bi n, đ nh nghĩa bi n)ướ ặ ế ị ế1. Tên bi n luôn đ c đ t dòng th nh t c a Excel sheet.ế ượ ặ ở ứ ấ ủ2. Lu t đ t tên bi n: nh trong SPSS (ậ ặ ế ư đã trình bày ph n đ nh nghĩa bi nở ầ ị ế )

• B c 2: Entering data (nh p li u trong Excel)ướ ậ ệ1. Nh p li u cho case đ u tiên (phi u đ u tiên): nh nh p chính xác thông tin ậ ệ ầ ế ầ ớ ậ

cho t ng bi nừ ế2. L p l i quá trình trên cho các bi n còn l i ( các dòng phía d i). ặ ạ ế ạ ở ướ Tuy t đ i ệ ố

không đ c s d ng b t kỳ công th c tính, ho c hàm khi nh p li u trong ượ ử ụ ấ ứ ặ ậ ệExcel. Chú ý ghi fle th ng xuyênườ

3. Ghi file v i đ nh d ng Excel c n th nớ ị ạ ẩ ậ

Page 36: Spss lesson #1 #4.1 (Vietnamese)

Nh p li u t Excelậ ệ ừCác b c ti n hành (ti p)ướ ế ế

• B c 3: Chuy n d li u (đã nh p trong Excel) sang SPSSướ ể ữ ệ ậ1. Đóng file Excel l iạ2. Kh i đ ng SPSS, vào c a s Data Editor, vào File/Open/Data/Files of ở ộ ử ổ

Types ch n Excel, ch n file b n c n m (file v a hoàn thi n b c ọ ọ ạ ầ ở ừ ệ ở ướ1 và 2)

3. Ch n Open/Open Excel Data Source, ch n ọ ọ Read Variable name from the first row of data, ch n Okọ

• B c 4: Ghi l i file d i d ng SPSSướ ạ ướ ạ1. Ch n File/Save As, chú ý trong Save As Type đ c ch n là SPSS ọ ượ ọ

(t c .sav), sau đó ch n Saveứ ọ2. Hi n gi trong c a s Data View, Variable View, b n c n ph i đ nh ệ ờ ử ổ ạ ầ ả ị

nghĩa l i nhãn bi n (Variable Labels - ý nghĩa c a bi n), giá tr bi n ạ ế ủ ế ị ế(Variable Values), và cách đo l ng (Measure) (ườ Gi ng nh ph n đ nh ố ư ầ ịnghĩa bi n trong SPSS đã trình bàyế )

Page 37: Spss lesson #1 #4.1 (Vietnamese)

Tr n file trong SPSS (Merge files)ộ

• Đôi khi b n ph i tr n file: ạ ả ộ– Ví d ụ m i ng i nh p (cho m t s l ng phi u nào đó) trên m t máy ỗ ườ ậ ộ ố ượ ế ộ

tính khác nhau (do đó b n ph i tr n các file thành m t file cu i cùng); ạ ả ộ ộ ố– Ho cặ m i ng i nh p m t ph n c a m i phi u trên các máy tính ỗ ườ ậ ộ ầ ủ ỗ ế

khách nhau ho c sheet khác nhau trong Excel.ặ

• Do đó, có hai d ng tr n file ch y u: ạ ộ ủ ế– Adding cases (t c là thêm các cases vào – b sung d li u t các ứ ổ ữ ệ ừ

phi u đi u tra khác); ế ề– Và (ho c) ặ adding variables (t c là không b sung phi u đi u tra, mà ứ ổ ế ề

ch tr n đ b sung bi n – ví d : m i ng i nh p m t ph n thông tin ỉ ộ ể ổ ế ụ ỗ ườ ậ ộ ầc a phi u đi u tra)ủ ế ề

Page 38: Spss lesson #1 #4.1 (Vietnamese)

Tr n file trong SPSS (Merge files) – ộ D ng Adding cases ạ(T c là thêm thông tin t các phi u đi u tra khác)ứ ừ ế ề

• Chú ý: các cases (các phi u đi u tra) ph i gi ng h t nhau v n i dung ế ề ả ố ệ ề ộ(same variables)

• N u s ID c a các file đ nh tr n là nh nhau (ID = 1,2,3…) thì c n đ i s ế ố ủ ị ộ ư ầ ổ ốID c a m t file tr c khi th c hi n tr n. Cách làm nh sau:ủ ộ ướ ự ệ ộ ư– M m t file c n tr n raở ộ ầ ộ

– Ch n Transform/Compute Variable, ghi ID vào h p Target Variable và “ID ọ ộ+ x” vào h p Numeric Expression. ộ Đ bi t ố ế x là gì???

• Sau khi s ID đã đ c đ i, b n hãy nh nó s là m t codebook m i cho ố ượ ổ ạ ớ ẽ ộ ớb n v i nh ng tr ng h p (cases – ho c phi u đi u tra này). ạ ớ ữ ườ ợ ặ ế ề Đ n đây, ếb n đã s n sàng đ tr n file r iạ ẵ ể ộ ồ .

Page 39: Spss lesson #1 #4.1 (Vietnamese)

Tr n file trong SPSS (Merge files) – ộ D ng Adding cases ạCác b c th c hi nướ ự ệ

1. M file th nh t mà b n mu n tr nở ứ ấ ạ ố ộ

2. Ch n Data/Merge files/ Add Casesọ

3. Ch n An external SPSS data file, ch n file c n ọ ọ ầtr n trong h p An open data set.ộ ộ

4. C n Continue/Ok. Ghi file v i tên m i b ng ọ ớ ớ ằcách vào File/Save As

Page 40: Spss lesson #1 #4.1 (Vietnamese)

Tr n file – D ng ộ ạ Adding variables

• Thao tác này phù h p khi b sung thông tin cho m i case (phi u đi u tra). M i ợ ổ ỗ ế ề ỗcase c n đ c b t đ u b i bi n ID và m t s bi n khác (nh nhau c hai file ầ ượ ắ ầ ở ế ộ ố ế ư ở ảmu n tr n vào nhau)ố ộ

• Các b c th c hi n:ướ ự ệ– B c 1: S p x p m i file theo th t tăng d n c a ID các cases b ng cách ướ ắ ế ỗ ứ ự ầ ủ ằ

Data/Sort Cases/ID

– B c 2: Data/Merge files/ Add Variables, ch n An external SPSS data file, ướ ọch n file c n tr n (N u file c n tr n đang m thì nó s xu t hi n trong h p ọ ầ ộ ế ầ ộ ở ẽ ấ ệ ộAn open dataset)

– B c 3: Trong h p Excluded variables, b n s th y bi n ID đ c li t kê. ướ ộ ạ ẽ ấ ế ượ ệ Ởđây, n u có b t kỳ bi n nào khác đ c li t kê, hãy n vào Rename .ế ấ ế ượ ệ ấ

– B c 4: n vào bi n ID, n vào h p Matche cases on key variables, n vào ướ Ấ ế ấ ộ ấmũi tên đ chuy n ID vào h p Key Variable (có nghĩa là t t c các thông tin s ể ể ộ ấ ả ẽđ c tr n d a trên c s cùng ID – cùng phi u đi u tra). Nh n Continue/OKượ ộ ự ơ ở ế ề ấ

– B c 5: Ghi l i file sau khi tr n v i tên khác: File/Save Asướ ạ ộ ớ

Page 41: Spss lesson #1 #4.1 (Vietnamese)

M t s ti n ích c a SPSS khi chu n b file d li uộ ố ệ ủ ẩ ị ữ ệ

• S p x p file d li u: ắ ế ữ ệ b n có th yêu c u SPSS s p x p file d li u ạ ể ầ ắ ế ữ ệtheo giá tr c a m t bi n nào đó (ví d sex, age,…). Các b c th c ị ủ ộ ế ụ ướ ựhi n nh sau:ệ ư– Data/Sort Cases/Ch n bi n c n s p x p/ Ch n Ascending ho c ọ ế ầ ắ ế ọ ặ

Descending / Ch n Okọ– N u b n mu n file d li u quay l i tr ng thái s p x p theo ID, ế ạ ố ữ ệ ạ ạ ắ ế

ch vi c làm nh trên, nh ng bi n c n s p x p l n này là ID.ỉ ệ ư ư ế ầ ắ ế ầ– Ví d : hãy m file Survey ra và làm cho vài bi nụ ở ế

• Chia tách file d li u: ữ ệ ch ng h n b n mu n so sánh gi a các nhóm ẳ ạ ạ ố ữkhác nhau. Các làm:– Data/Split File/ Compare groups/ ch n bi n mu n so sánh/ Okọ ế ố– Mu n tr l i tr ng thái ban đ u vào Data/Sort Cases/ID/ ố ở ạ ạ ầ

Ascending ho c Descendingặ

Page 42: Spss lesson #1 #4.1 (Vietnamese)

M t s ti n ích c a SPSS khi chu n b file d li u ộ ố ệ ủ ẩ ị ữ ệ(ti p)ế

• Ch n m t s cases ọ ộ ố đ nghiên c u trong c file d li u (ví d b n ch phân ể ứ ả ữ ệ ụ ạ ỉtích cho nam gi i):ớ1. Data/Select Cases/ Ch n If condition is satisfiedọ2. Ch n IFọ3. Ch n bi n đúng v i nhóm b n đang mu n h ng t i (ví d bi n sex)ọ ế ớ ạ ố ướ ớ ụ ế4. Nh n vào mũi tên đ đ a bi n vào h p, nh n vào d u =ấ ể ư ế ộ ấ ấ5. Đi n giá tr c a nhóm trong bi n mà b n đang c n ch n (c n ki m tra ề ị ủ ế ạ ầ ọ ầ ể ở

codebook). Ví d n u b n ch n 1 cho sex có nghĩa là b n ch n nhóm ụ ế ạ ọ ạ ọnam gi iớ

6. Nh n Continue/OKấSau khi ch n xong, b n có th th c hi n m t s phân tích riêng cho nhóm ọ ạ ể ự ệ ộ ố

mà b n đã ch n, ví d phân tích t ng quan (correlation). Sau khi phân ạ ọ ụ ươtích xong, b n c n đ a file d li u v tr ng thái ban đ u:ạ ầ ư ữ ệ ề ạ ầVào Data/Select Cases/ All cases/ Ok

Page 43: Spss lesson #1 #4.1 (Vietnamese)

Ti n ích ệ USING SETS trong SPSS

• Nó là gì? Nó là m t t p h p các thông tin s d ng cho m t m c ộ ậ ợ ử ụ ộ ụđích phân tích nào đó trong SPSS

• T i sao đôi khi l i dùng nó?: ạ ạ vì có th phân tích c a b n s không ể ủ ạ ẽ

c n đ n t t c các thông tin trong file d li u. Ví d , phân tích c a ầ ế ấ ả ữ ệ ụ ủ

b n ch c n dùng đ n các bi n ID, Sex, và m t vài bi n khác. Hãy ạ ỉ ầ ế ế ộ ế

m file Survey3ED ra và th c hành theo các b c mô t ph n sauở ự ướ ả ở ầ

Page 44: Spss lesson #1 #4.1 (Vietnamese)

1. Ch n Utilities/ Define variable setsọ

2. Ch n các bi n mu n phân tích đ a vào m c ọ ế ố ư ụVariables in sets, bao g m các bi n ID, bi n ồ ế ếsex đ n bi n “smoke number”, t t c các ế ế ấ ảbi n Total (b t đ u t bi n “Total ế ắ ầ ừ ếOptimism”)

3. Trong h p Set Name, hãy đ t tên cho set c a ộ ặ ủb n (ví d hãy đ t là Totals)ạ ụ ặ

4. Ch n Add set/Closeọ

Ti n ích ệ USING SETS trong SPSSCác b c thi t l p ướ ế ậ SETS

Page 45: Spss lesson #1 #4.1 (Vietnamese)

• Utilities/ Use variable sets• Ch n set b n v a t o (Totals)/ b l a ch n ọ ạ ừ ạ ỏ ự ọ

Allvariables/ ch n Newvariables/ Okọ• Sau b c trên, ch có các bi n đ c ch n ướ ỉ ế ượ ọ

xu t hi n trên màn hìnhấ ệ• N u b n không mu n dùng SETS v a t o n , ế ạ ố ừ ạ ữ

hãy:– Utilities/ Use Variable sets/ Allvariables/ Ok

Ti n ích ệ USING SETS trong SPSSKh i đ ng SETS tr c khi s d ng nóở ộ ướ ử ụ

Page 46: Spss lesson #1 #4.1 (Vietnamese)

Ti n ích ệ Data file comments

• Trong ph n Utilities, b n đ c phép comment ầ ạ ượtrên file d li u. Cách làm nh sau:ữ ệ ư– Utilities/Data file Comments– Hãy nh p vào đó nh ng n i dung b n mu n ậ ữ ộ ạ ố

comment, n u b n mu n ghi l i chúng trong file ế ạ ố ạk t qu , hãy nh n vào Display comments in ế ả ấoutput

Page 47: Spss lesson #1 #4.1 (Vietnamese)

Ti n ích ệ Data file information

• Các information trong codebook có th đ c ể ượhi n th trên file c a b n b ng vi c s d ng ể ị ủ ạ ằ ệ ử ụti n ích này. Đ làm đ c đi u đó:ệ ể ượ ề– File/ Display Data file information– Ch n Working file. Nó s activate ph n View ọ ẽ ầ

(output). đó ta s nh n đ c thông tin v file Ở ẽ ậ ượ ềd li u.ữ ệ

Page 48: Spss lesson #1 #4.1 (Vietnamese)

Ti n ích Values Labels Dispalyệ

• Thông th ng b n ch nhìn th y d li u d ng ườ ạ ỉ ấ ữ ệ ạs cho các bi n (ví d 1 cho male, 2 cho n ). ố ế ụ ữNh ng n u mu n nhìn th y thông tin là male, ư ế ố ấho c female cho các cases. Đ th y, hãy:ặ ể ấ– View/ Values Labels

• Đ t t ti n ích này, l p l i thao tác trênể ắ ệ ặ ạ

Page 49: Spss lesson #1 #4.1 (Vietnamese)

5. Ki m tra và làm s ch d li uể ạ ữ ệ

• Tr c khi ti n hành phân tích d li u, vi c t i ướ ế ữ ệ ệ ốquan tr ng là b n ph i ki m tra xem chúng có l i ọ ạ ả ể ỗgì không.

• Ví d v l i d li u: thay vì nh p s 3, b n có th ụ ề ỗ ữ ệ ậ ố ạ ểđã nh p s 35. L i này có th nh h ng nghiêm ậ ố ỗ ể ả ưởtr ng đ n k t qu phân tích t ng quanọ ế ế ả ươ

• Ví d khác là các “outlier”, t c là các giá tr v t ụ ứ ị ượxa (d i ho c trên) so v i nh ng giá tr còn l i ướ ặ ớ ữ ị ạc a c t ng th m uủ ả ổ ể ẫ

• Ví d khác n a: 1 = male; 2 = female đ i v i bi n ụ ữ ố ớ ếsex, v y l i s là giá tr bi n sex khác v i 1, và 2ậ ỗ ẽ ị ế ớ

Page 50: Spss lesson #1 #4.1 (Vietnamese)

Các b c ti n hành ki m tra d li u bao g m:ướ ế ể ữ ệ ồ

• Tr c khi th c hi n: b n hãy m file c n check ra, vào ướ ự ệ ạ ở ầ

Edit/Options/Variables values in lables shown as/ values and

lables (cái này s có ích khi xem k t qu check d li uẽ ế ả ữ ệ )

• B c 1: Ki m tra l i d li u. Vi c đ u tiên là ki m tra giá tr ướ ể ỗ ữ ệ ệ ầ ể ị

c a t ng bi n trong phi u đi u tra c a b n xem li u giá tr ủ ừ ế ế ề ủ ạ ệ ị

c a m t case nào đó có quá cao hay quá th p hay khôngủ ộ ấ

• B c 2 là xác đ nh chính xác đ a ch c a nh ng l i d li u y ướ ị ị ỉ ủ ữ ỗ ữ ệ ấ

và th c hi n s a l i (ho c xóa)ự ệ ử ỗ ặ

Page 51: Spss lesson #1 #4.1 (Vietnamese)

Ki m tra d li u- B c 1: Th c hi n phân tích đ phát hi n ể ữ ệ ướ ự ệ ể ệl iỗ

V i bi n đ nh danh (nominal – categorical variables)ớ ế ị

• M file error3ED.sav ra và làm theo các b c sau:ở ướ

1. Vào Analyze/Descriptive Statistics/Frequencies

2. Ch n bi n b n mu n ki m tra (nh là bi n đ nh danh ho c ọ ế ạ ố ể ớ ế ị ặcategorical, vd: sex, marital, educaton,…)

3. n vào mũi tên đ đ a các bi n c n ch n vào m c bi n c n Ấ ể ư ế ầ ọ ụ ế ầcheck (t c h p Variable)ứ ộ

4. Nh n nút Statistics/Dispersion/Minimum and Maximumấ

5. Continue/Ok ho c ch n Paste đ ghi l i nh ng gì đã làm trong ặ ọ ể ạ ữSyntax Editor (cái này không c n thi t l m!!!ầ ế ắ )

B n s th y k t qu nh slide sau bao g m 2 ph n: m t b ng t ng ạ ẽ ấ ế ả ư ở ồ ầ ộ ả ổh p và các b ng chi ti t cho t ng bi nợ ả ế ừ ế

Page 52: Spss lesson #1 #4.1 (Vietnamese)

Vì b n đã ch n ạ ọEdit/Options/Va

riables values in

lables shown as/

values and

lables tr c khi ướth c hi n phân ự ệtích nên b n m i ạ ớth y c giá tr và ấ ả ịmã c a nó nh ủ ưth này: t c 1 là ế ứSingle, 2 là …

Page 53: Spss lesson #1 #4.1 (Vietnamese)

Ki m tra l i nh th nào khi đã có k t qu phân tích???ể ỗ ư ế ế ả

• Hãy nhìn vào giá tr Minimum và Maximum. ị– Hãy nghĩ v ý nghĩa c a chúng v i t ng bi n (do they make sense?)ề ủ ớ ừ ế– Các giá tr Minimum, Maximum y có n m trong vùng giá tr đã ị ấ ằ ị

đ c quy đ nh cho m i bi n không? N u không, đó là l iượ ị ỗ ế ế ỗ– Ví d : ụ v i phân tích trên, b n hãy đ ý các phân tích cho bi n Sex, ớ ạ ể ế

b n có phát hi n đi u gì b t th ng không? (ạ ệ ề ấ ườ hãy chú ý đ n ếcodebook)

– Ví d (ti p): hãy đ ý c các phân tích cho bi n ụ ế ể ả ế marital và bi n ếeduc.

• Ki m tra c thông tin v s Valid và s Missing.ể ả ề ố ố• Chú ý: m t vài slide n a ta s ch ra chính xác case nào có l i (n u ở ộ ữ ẽ ỉ ỗ ế

có)

Page 54: Spss lesson #1 #4.1 (Vietnamese)

• Analyze/ Descriptive statistics/ Descriptive• Nh n vào bi n c n đ c phân tích và đ a vào h p Variablesấ ế ầ ượ ư ộ• Nh n vào h p Options/ đánh d u vào nh ng tùy ch n: vd Standard ấ ộ ấ ữ ọ

deviation, minimum, maximum• Continue/ Ok• Ví d : ụ s d ng file erro3ED.sav và ki m tra cho bi n age. K t qu ki m ử ụ ể ế ế ả ể

tra nh sau:ư

Ki m tra d li u- B c 1: Th c hi n phân tích đ phát hi n ể ữ ệ ướ ự ệ ể ệl iỗ

V i bi n liên t c (interval and ratio variables)ớ ế ụ

• Trong k t qu trên:ế ả– Hãy ki m tra giá tr Minimum và Maximum (ể ị chú ý đ n đ i t ng ch n m u đi u traế ố ượ ọ ẫ ề )– Ki m tra giá tr trung bình (mean). Does it make sense? Nó có phù h p v i nh ng tìm tòi ể ị ợ ớ ữ

tr c đây c a b n? Li u nó có b l ch v m t phía nào không?...ướ ủ ạ ệ ị ệ ề ộ

Page 55: Spss lesson #1 #4.1 (Vietnamese)

Ki m tra d li u: ể ữ ệ B c 2 - Phát hi n và s a l trong file d ướ ệ ử ỗ ữli uệ

• Chú ý tr c khi th c hi n: đ ng c scan file d li u đ phát hi n l i, đi u đó r t m t th i ướ ự ệ ừ ố ữ ệ ể ệ ỗ ề ấ ấ ờgian và g n nh không mang l i k t qu .ầ ư ạ ế ả

• Ví d : quay l i k t qu phân tíchụ ạ ế ả• Trong SPSS có m t s cách giúp b n ch ra chính xác (và nhanh chóng) case nào (phi u đi u ộ ố ạ ỉ ế ề

tra nào) đang b l i m t ho c m t s ch tiêu nào đó.ị ỗ ở ộ ặ ộ ố ỉ• Cách 1 (ph ng pháp 1)ươ

1. Trong c a s Data Editor, vào Data/Sort casesử ổ2. Ch n bi n mà b n đã bi t r ng có l i (vd: sex) và đ a vào h p Sort by/ Ascending ho c ọ ế ạ ế ằ ỗ ư ộ ặ

Descending/ Ok

– Vd: v i bi n sex, hãy ch n descending, nó s giúp b n tìm ra case có giá tr bi n sex =3. ớ ế ọ ẽ ạ ị ếCase nào (phi u đi u tra nào) có l i? B n s làm gì v i nó?ế ề ỗ ạ ẽ ớ

• Cách 2:

– c a s Data Editor, trong sheet data viewingỞ ử ổ– Ch n c t (bi n) mà ta bi t r ng đã có l i (vd: sex)/ Ch n Edit / Findọ ộ ế ế ằ ỗ ọ– Trong h p Search for, hãy ch n giá tr l i mà b n mu n tìm (vd: 3 ộ ọ ị ỗ ạ ố t i sao???ạ )

– Ch n Search Forward (ho c Find Next). SPSS s check kh p file d li u đ tìm ra v trí ọ ặ ẽ ắ ữ ệ ể ịc a bi n b l i. Hãy take some note đ bi t v trí c n ph i s a trong file d li u.ủ ế ị ỗ ể ế ị ầ ả ử ữ ệ

– Ti p t c n vào Find Next đ tìm ra v trí có d li u saiế ụ ấ ể ị ữ ệ

Page 56: Spss lesson #1 #4.1 (Vietnamese)

Sau khi th c hi n check và correct l i xong, hãy ự ệ ỗth l i vi c ki m tra l i vì r t có th trong lúc s a ử ạ ệ ể ỗ ấ ể ửl i (ỗ có th do tay chân lóng ngóngể ) b n đã t o ra ạ ạ

m t s l i khác. Đ làm đi u này, hãy quay l i ộ ố ỗ ể ề ạb c 1 (ướ frequencies cho bi n nominal và ế

descriptive cho bi n continuous)ế

Page 57: Spss lesson #1 #4.1 (Vietnamese)

• Ch c năng này cho phép xem m t ph n thông tin ứ ộ ầcho t ng case. Ví d : xem thông tin v gi i tính.ừ ụ ề ớ

• Các b c th c hi n:ướ ự ệ– Nh n vào Analyze/ Reports/ Summarize Casesấ– Ch n ID và các bi n khác c n xem xét (sex,…)ọ ế ầ– B l a ch n Limit cases to first 100ỏ ự ọ– Ch n Statistics/ B l a ch n Number of cases/ ọ ỏ ự ọ

Continue– Trong Option, b Subheadings for totals/ Continue/ ỏ

Ok

Ki m tra d li u: ể ữ ệS d ng ch c năng Case Summaries ử ụ ứ

(not highly recommended)

Page 58: Spss lesson #1 #4.1 (Vietnamese)
Page 59: Spss lesson #1 #4.1 (Vietnamese)

PH N 3. M T S PHÂN TÍCH CĂN B NẦ Ộ Ố Ả6. Phân tích th ng kê mô tố ả

• Chú ý: hãy ch c ch n r ng d li u c a b n đã đ c ki m tra và s a l i ắ ắ ằ ữ ệ ủ ạ ượ ể ử ỗtr c khi ti n hành phân tích nàyướ ế

• Phân tích th ng kê mô t đ làm gì?ố ả ể– Đ mô t đ c tính c a m u mà b n s trình bày trong ph n ể ả ặ ủ ẫ ạ ẽ ầ Ph ng ươ

pháp nghiên c u ứ (trong báo cáo nghiên c u)ứ– Đ ki m tra xem các bi n có ể ể ế vi ph m các gi đ nh c a k thu t ạ ả ị ủ ỹ ậ

th ng kêố s s d ng đ tr l i câu h i nghiên c u hay không?ẽ ử ụ ể ả ờ ỏ ứ– Giúp tr l i m t s câu h i nghiên c u c thả ờ ộ ố ỏ ứ ụ ể

• Thông th ng, các th ng kê mô t bao g m giá tr trung bình (mean), đ ườ ố ả ồ ị ộl ch chu n (standard deviation), m c đ bao ph c a bi n (range of ệ ẩ ứ ộ ủ ủ ếscores), đ nghiêng, ho c l ch (skewness), và đ nh n (kurtosis)ộ ặ ệ ộ ọ

• Các th ng kê này có th đ c ti n hành b ng vi c s d ng: Frequencies, ố ể ượ ế ằ ệ ử ụDescriptive, ho c Explore trong ph n Analyze/ Descriptive Statisticsặ ầ

Page 60: Spss lesson #1 #4.1 (Vietnamese)

Ví d v đ nghiêng (skewness) và đ l ch ụ ề ộ ộ ệ(kurtosis)

Page 61: Spss lesson #1 #4.1 (Vietnamese)

PHÂN TÍCH TH NG KÊ MÔ T Ố ẢCHO BI N Đ NH DANHẾ Ị

• Phân tích TKMT v i bi n đ nh danh giúp đ a ra th ng kê xem bao nhiêu ớ ế ị ư ống i đã đ ng thu n v i m t tr l i c th . Vd: males, femalesườ ồ ậ ớ ộ ả ờ ụ ể

• Tuy nhiên, phân tích này s không có ý nghĩa n u tính ra các giá tr mean, ẽ ế ịstandard deviation.

• Các b c th c hi n: hãy m file survey3ED.saveướ ự ệ ở1. Trên c a s Data Editor, ch n Analyze/ Descriptive Statistics/ ử ổ ọ

Frequencies

2. Ch n bi n c n phân tích đ a vào h p Variablesọ ế ầ ư ộ3. Ch n Continue/ Okọ

Các k t qu này có v n đ gì ế ả ấ ềkhông? Ch liên quan đ n gi ỉ ế ảđ nh c a k thu t th ng kêị ủ ỹ ậ ố

Page 62: Spss lesson #1 #4.1 (Vietnamese)

PHÂN TÍCH TH NG KÊ MÔ T Ố ẢCho bi n liên t cế ụ

• Ch n Analyze/ Descriptive Statistics/ Descriptivesọ• Ch n bi n d đ nh phân tích đ a vào h p Variablesọ ế ự ị ư ộ• Vào Options/ ch n mean, standard deviation, minimum, maximum, ọ

skewness, kurtosis• Continue/ Ok

Page 63: Spss lesson #1 #4.1 (Vietnamese)

Đ c k t qu phân tích trên nh th nào, đ làm ọ ế ả ư ế ểgì???

• Các thông tin v mean, range, standard deviation th ng đ c dùng cho ề ườ ượph n ầ Ph ng pháp nghiên c uươ ứ trong báo cáo (mô t v m u đi u tra)ả ề ẫ ề

• Thông tin v skewness và kurtosis cung c p thông tin đ n phân b (phân ề ấ ế ốph i) c a bi n.ố ủ ế– Skewness là đ nghiêng (hay cân x ng), kurtosis nói đ n đ b t (đ ộ ứ ế ộ ẹ ộ

nh n) trong phân ph i c a bi n. Trong phân ph i chu n, ta s có ọ ố ủ ế ố ẩ ẽskewness và kurtosis b ng 0ằ

– N u Skewness >0, phân b s l ch trái v phía giá tr th p, ng c l i ế ố ẽ ệ ề ị ấ ượ ạphân b l ch ph i v giá tr caoố ệ ả ề ị

– N u kurtosis >0, các giá tr t p trung hai bên giá tr trung bình nhi u ế ị ậ ở ị ềh n, đ ng phân ph i h p và có đuôi dài sang hai bên. Ng c l i, ơ ườ ố ẹ ượ ạđ ng phân ph i ph ng h n.ườ ố ẳ ơ

– Đ i v i nh ng dung l ng m u trên 200 thì vi c ki m tra Skewness có ố ớ ữ ượ ẫ ệ ểth tricky (ể ta ch c n bi t v y thôiỉ ầ ế ậ )

Page 64: Spss lesson #1 #4.1 (Vietnamese)

Đ nh n v t chu nộ ọ ượ ẩ

Đ nh n chu nộ ọ ẩ

Đ nh n d i ộ ọ ướchu nẩ

Page 65: Spss lesson #1 #4.1 (Vietnamese)

THI U D LI U (Ế Ữ Ệ MISSING DATA) • Trong nghiên c u, hi m khi b n thu th p đ y đ thông tin. Do đó, hãy quan tâm ứ ế ạ ậ ầ ủ

các d li u b thi uữ ệ ị ế• B n có th ch y Descriptive đ tìm ra t l % các giá tr b thi u cho m i bi nạ ể ạ ể ỷ ệ ị ị ế ỗ ế• Khi có quá nhi u missing data, hãy t đ t ra câu h i:ề ự ặ ỏ

– Đi u đó có ph i do ng u nhiên không? Vd: dân nuôi l n th rong, không cho ề ả ẫ ợ ảăn.

– Đó có ph i là m t lý do h th ng? Vd: r t nhi u ph n không tr l i v s ả ộ ệ ố ấ ề ụ ữ ả ờ ề ốtu i c a hổ ủ ọ

• Trong phân tích, ta ph i x lý v i các s li u missing nh th nào??? ả ử ớ ố ệ ư ế R t may ấSPSS đã có nh ng l u ý cho vi c này!!!ữ ư ệ– V i b t kỳ phân tích nào, hãy nh n vào nút Options ớ ấ ấ– Ch n ọ Exclude cases listwise: SPSS s ch đ a vào n i dung phân tích đ i v i ẽ ỉ ư ộ ố ớ

nh ng cases mà có đ y đ d li u cho t t c các bi n c n phân tích (đ ng ữ ầ ủ ữ ệ ấ ả ế ầ ồth i)ờ . Khá nguy hi m!!! N u b ép bu c thì hãy ch n!!!ể ế ị ộ ọ

– Exclude cases pairwise: SPSS s lo i tr case không có thông tin c a bi n ẽ ạ ừ ủ ếđ c phân tích, tuy nhiên n u thông tin cho bi n khác là đ y đ thì SPSS l i ượ ế ế ầ ủ ạđ a case y vào phân tích. ư ấ Nên ch n!!!ọ

– Replicate with mean: SPSS s t đ ng gán giá tr trung bình cho các case b ẽ ự ộ ị ịmiss thông tin. Cũng r t nguy hi m, đ c bi n u d li u b thi u quá ấ ể ặ ệ ế ữ ệ ị ếnhi u!!!ề

Page 66: Spss lesson #1 #4.1 (Vietnamese)

Ví d v các l a ch n phân tích v i ụ ề ự ọ ớ missing data

Page 67: Spss lesson #1 #4.1 (Vietnamese)

ĐÁNH GIÁ PHÂN PH I CHU NỐ Ẩ

• Vi c xem xét xem d li u (s li u) có chu n hay không cũng có th đ c th c ệ ữ ệ ố ệ ẩ ể ượ ựhi n b i phân tích ệ ở Skewness và Kurtosis. Tuy nhiên hai giá tr này nên b ng bao ị ằnhiêu thì c n ph i…???ầ ả

• Th ng kê mô t có th giúp ta xem xét đ “ố ả ể ộ chu nẩ ” trong phân ph i c a d li uố ủ ữ ệ• Các b c th c hi n: hãy m t p survey3ED raướ ự ệ ở ệ

1. Vào Analyze/ Descriptive Statistics/ Explore

2. Ch n bi n mu n phân tích (vd: total perceived stress) đ a vào h p ọ ế ố ư ộDependent List

3. Trong h p Label Cases by, ch n bi n IDộ ọ ế

4. Trong h p Display, nh ch n c hai bi n trênộ ớ ọ ả ế

5. Ch n Statistics/ Descriptive and Outliersọ

6. Plots/ Histogram/ Normality plots with tests/ Continue

7. Options/ Missing values/ Exclude cases pairwise/ Continue/ Ok

Page 68: Spss lesson #1 #4.1 (Vietnamese)

K t qu phân tích nh sau:ế ả ư

Page 69: Spss lesson #1 #4.1 (Vietnamese)
Page 70: Spss lesson #1 #4.1 (Vietnamese)

Đ ng th ng th hi n phân ph i chu n, còn đ ng ch m th hi n phân ườ ẳ ể ệ ố ẩ ườ ấ ể ệph i th c c a m u ố ự ủ ẫ

Page 71: Spss lesson #1 #4.1 (Vietnamese)

Đ c k t qu phân tích Normality th nào?ọ ế ả ế• Hãy nhìn vào b ng Descriptives, các thông tin quan tr ng c n quan tâm ả ọ ầ

g m có:ồ– 5% Trimmed mean: giá tr trung bình c a m u khi 5% các s li u có giá tr cao ị ủ ẫ ố ệ ị

nh t và 5% giá tr th p nh t đ c lo i ra (trimmed) kh i m u. Hãy nghĩ v ý ấ ị ấ ấ ượ ạ ỏ ẫ ềnghĩa c a giá tr trung bình này???ủ ị

– Hãy chú ý đ n giá tr c a đ nghiêng (skewness) và đ nh n (kurtosis)ế ị ủ ộ ộ ọ

• Trong b ng Test of Normality, hãy chú ý đ n giá tr ki m đ nh Kolmogorov. ả ế ị ể ịN u giá tr này > 0.05 thì s li u là chu n, và ng c l iế ị ố ệ ẩ ượ ạ

• Hình d ng c a phân ph i đ c mô t bi u đ Histogram. Hãy nhìn vào đó ạ ủ ố ượ ả ở ể ồxem nó có d ng hình m t qu chuông (ho c g n gi ng nh v y) không?ạ ộ ả ặ ầ ố ư ậ

• Cu i cùng, hãy nhìn vào bi u đ hình h p (Box plot), cái h p y t đáy d i ố ể ồ ộ ộ ấ ừ ướlên đáy trên mô t cho 50% s li u c a m u (các s li u gi a m u). B t ả ố ệ ủ ẫ ố ệ ở ữ ẫ ấkỳ nh ng đi m nào đ c li t kê ngoài ph m vi hai đ ng k song song ữ ể ượ ệ ở ạ ườ ẻv i hai đáy h p đ u đ c coi là các outliers c a dãy s li u (t c là nh ng s ớ ộ ề ượ ủ ố ệ ứ ữ ốli u quá cao, ho c quá th p so v i các s li u khác trong m u)ệ ặ ấ ớ ố ệ ẫ

Page 72: Spss lesson #1 #4.1 (Vietnamese)

Bài t p ph n 3, m c 6 – th ng kê mô tậ ầ ụ ố ảBài 1 – Kinh doanh (business)

1. Hãy m file staffsurvey3ED.sav ra và s d ng th ng kê mô t đ ở ử ụ ố ả ểtr l i các câu h i sauả ờ ỏa. Hãy cho bi t t l % nhân viên trong t ch c là lao đ ng dài ế ỷ ệ ổ ứ ộ

h n (bi n employstatus)ạ ếb. Th i gian làm vi c trung bình c a nhân viên trong t ch c là ờ ệ ủ ổ ứ

bao nhiêu (bi n service)ếc. T l % s ng i tr l i cho r ng t ch c (đang đ c nghiên ỷ ệ ố ườ ả ờ ằ ổ ứ ượ

c u) là m t n i làm vi c t t là bao nhiêu? (bi n recommend)ứ ộ ơ ệ ố ế2. V n trên file staffsurvey3ED, hãy đánh giá phân b c a bi n t ng ẫ ố ủ ế ổ

m c hài lòng c a nhân viên (bi n totsatis)ứ ủ ếa. Có b t kỳ giá tr nào c a bi n mà b n cho r ng nó quá cao ấ ị ủ ế ạ ằ

ho c quá th p (outlier) không?ặ ấb. Phân b c a bi n totsatis cho m i nhóm có chu n không?ố ủ ế ỗ ẩ

Page 73: Spss lesson #1 #4.1 (Vietnamese)

1. Hãy s d ng th ng kê mô t đ tr l i các câu h i sau:ử ụ ố ả ể ả ờ ỏa. T l % ng i đ c đi u tra là n gi i (bi n gender) là bao ỷ ệ ườ ượ ề ữ ớ ế

nhiêu?

b. Tu i trung bình c a ng i đ c h i trong m u đi u tra là bao ổ ủ ườ ượ ỏ ẫ ềnhiêu?

c. T l % s ng i tr l i cho r ng h có v n đ v i gi c ng là ỷ ệ ố ườ ả ờ ằ ọ ấ ề ớ ấ ủbao nhiêu? (bi n problem)ế

d. Trung v (median) c a th i gian ng m t tu n là bao nhiêu ị ủ ờ ủ ộ ầ(bi n hourwnit)ế

2. Hãy đánh giá phân ph i giá tr c a bi n “ố ị ủ ế ng và các v n đ căng ủ ấ ềth ngẳ ” (totSAS) cho nh ng ng i cho r ng/ không cho r ng h có ữ ườ ằ ằ ọv n đ v i gi c ng (bi n problem)ấ ề ớ ấ ủ ếa. Có giá tr outlier nào không?ịb. V i m i nhóm, giá tr bi n totSAS có phân ph i chu n không?ớ ỗ ị ế ố ẩ

Bài t p ph n 3, m c 6 – th ng kê mô tậ ầ ụ ố ảBài 2 – S c kh e (Health) – ứ ỏ file sleep3ED