1 SPSS 16.0 GIỚI THIỆU VÀ THIẾT KẾ BẢNG CÂU HỎI Ph ần m ềm SPSS (nguyên g ốc là từ vi ết t ắt của Statistical Package for Social Sciences) được dùng để phân tích các kết qu ả điều tra trong nhi ều lĩnh vực t ừ xã h ội, giáo dụ c, kinh tế, dị ch v ụ , marketing, nông nghi ệp, y khoa… Ngày nay SPSS for Windows đã trở thành m ột trong nh ững ph ần m ềm phân tích số li ệu th ống kê hi ệu qu ả, ph ổ bi ến nh ất và được nhi ều nhà nghiên cứu sử dụng để phân tích dữ li ệu trong nghiên cứu khoa h ọc. Ph ần m ềm SPSS dễ dàng cài đặt cho m ọi cấu hình củ a máy vi tính, v ới dung lượng th ấp người sử dụ ng không cần đến m ột máy vi tính có cấu hình th ật m ạnh. Vi ệc cài đặt SPSS đơn giản và tương tự như một số ph ần m ềm ứng dụ ng khác. Nhà nghiên cứu sử dụng chương trình SPSS trong máy vi tính để th ực hi ện các kỹ thu ật th ống kê, nhưng việc làm cho các con số th ống kê có ý nghĩa lại ph ụ thu ộc vào cách di ễn gi ải kết qu ả, suy di ễn và dự đoán để gi ải quy ết m ụ c tiêu củ a v ấn đề nghiên cứu. 1. LÀM QUEN VỚI SPSS Kh ởi động SPSS từ bi ểu tượng của chương trình trên Desktop hoặc t ừ Star/Program/SPSS SPSS có 2 cửa sổ làm vi ệc: Cửa sổ dữ li ệu (Dataset) và Cửa sổ kết qu ả x ử lý (Output) - Cửa s ổ d ữ li ệ u có 2 giao diệ n : Giao di ện mã hoá dữ li ệu (Variable View) và Giao di ện nh ập li ệu (Data View). Thay đổi giao di ện bằng cách nh ấp chu ột ch ọn ở g ốc trái bên dưới màn hình, hoặc bấm t ổ h ợp phím Ctrl+T. Thành ph ần Menu củ a cửa sổ dữ li ệu bao g ồm: File: giúp tạo t ập tin SPSS m ới, m ở t ập tin có sẵn, lưu, thoát … Edit: xác l ập các m ặc đị nh của chương trình (Option), cắt, dán, tìm ki ếm, thay th ế… View: cho hi ện dòng trạng thái, thanh công cụ , font ch ữ, giá trị nh ập vào hay nhãn ý nghĩa Data: bao g ồm các l ựa ch ọn chèn thêm bi ến, tìm nhanh m ột quan sát, sắp x ếp th ứ t ự quan sát, chia và ghép tập tin… Transform: g ồm các l ệnh tính toán, chuy ển đổi và mã hoá l ại bi ến … Analyze: ch ứa các công cụ phân tích số li ệu như: thống kê mô tả, phân tích bảng chéo, các ki ểm đị nh tham số và phi tham số, phân tích tương quan và hồi quy … Graphs: bao g ồm các công cụ liên quan đến bi ểu đồ và đồ th ị Utilities: tìm hi ểu thông tin v ề các bi ến, t ập tin…
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
1
SPSS 16.0
GIỚI THIỆU VÀ THIẾT KẾ BẢNG CÂU HỎI
Phần mềm SPSS (nguyên gốc là từ viết tắt của Statistical Package for Social Sciences) được dùng
để phân tích các kết quả điều tra trong nhiều lĩnh vực từ xã hội, giáo dục, kinh tế, dịch vụ, marketing, nông nghiệp, y khoa… Ngày nay SPSS for Windows đã trở thành một trong những phần
mềm phân tích số liệu thống kê hiệu quả, phổ biến nhất và được nhiều nhà nghiên cứu sử dụng để phân tích dữ liệu trong nghiên cứu khoa học.
Phần mềm SPSS dễ dàng cài đặt cho mọi cấu hình của máy vi tính, với dung lượng thấp người sử dụng không cần đến một máy vi tính có cấu hình thật mạnh. Việc cài đặt SPSS đơn giản và tương tự
như một số phần mềm ứng dụng khác.
Nhà nghiên cứu sử dụng chương trình SPSS trong máy vi tính để thực hiện các kỹ thuật thống kê, nhưng việc làm cho các con số thống kê có ý nghĩa lại phụ thuộc vào cách diễn giải kết quả, suy
diễn và dự đoán để giải quyết mục tiêu của vấn đề nghiên cứu.
1. LÀM QUEN VỚI SPSS
Khởi động SPSS từ biểu tượng của chương trình trên Desktop hoặc từ Star/Program/SPSS
SPSS có 2 cửa sổ làm việc: Cửa sổ dữ liệu (Dataset) và Cửa sổ kết quả xử lý (Output)
- Cửa sổ dữ liệu có 2 giao diện: Giao diện mã hoá dữ liệu (Variable View) và Giao diện nhập liệu
(Data View). Thay đổi giao diện bằng cách nhấp chuột chọn ở gốc trái bên dưới màn hình, hoặc bấm tổ hợp phím Ctrl+T.
Thành phần Menu của cửa sổ dữ liệu bao gồm:
File: giúp tạo tập tin SPSS mới, mở tập tin có sẵn, lưu, thoát …
Edit: xác lập các mặc định của chương trình (Option), cắt, dán, tìm kiếm, thay thế…
View: cho hiện dòng trạng thái, thanh công cụ, font chữ, giá trị nhập vào hay nhãn ý nghĩa
Data: bao gồm các lựa chọn chèn thêm biến, tìm nhanh một quan sát, sắp xếp thứ tự quan sát, chia và ghép tập tin…
Transform: gồm các lệnh tính toán, chuyển đổi và mã hoá lại biến …
Analyze: chứa các công cụ phân tích số liệu như: thống kê mô tả, phân tích bảng chéo, các kiểm
định tham số và phi tham số, phân tích tương quan và hồi quy …
Graphs: bao gồm các công cụ liên quan đến biểu đồ và đồ thị
Utilities: tìm hiểu thông tin về các biến, tập tin…
2
Windows: sắp xếp và di chuyển giữa các cửa sổ làm việc của SPSS
- Cửa sổ kết quả (Output): chứa các kết quả xử lý số liệu, biểu đồ …
2. THIẾT KẾ BẢNG CÂU HỎI
2.1. Số đo và thang đo
Đánh dấu bằng số hay các ký hiệu để mô tả đặc điểm của đối tượng nghiên cứu (sự chấp nhận, thái độ, thị hiếu) theo một qui luật cụ thể nào đó. Mô tả bằng số cho phép phân tích dữ liệu bằng phương pháp thống kê và truyền đạt kết quả một cách dễ dàng. Có 4 loại thang đo chính được sử dụng trong
nghiên cứu Marketing: thang đo biểu danh, thang đo tỷ lệ, thang đo thứ tự và thang đo khoảng.
Thang đo biểu danh (danh nghĩa) (Nominal scale)
Là thang đo sử dụng các con số đánh dấu (mã số) để phân loại đối tượng hoặc sử dụng như ký hiệu để phân biệt và nhận dạng đối tượng. Thang đo biểu danh hay thang đo danh nghĩa không có ý nghĩa về mặt lượng mặc dù nó được ký hiệu bằng các con số.
Trong nghiên cứu Marketing, thang đo biểu danh dùng để nhận dạng, xếp loại đối tượng được phỏng vấn (giới tính, nghề nghiệp, tôn giáo,…), tên sản phẩm, phẩm chất, và các đối tượng khác.
Ví dụ: Vui lòng cho biết hiện gia đình anh (chị) đang sử dụng loại chất đốt nào?
(1) Củi (2) Than đá (3) Dầu (4) Gas
Thang đo thứ tự (Ordinal scale)
Là thang đo thể hiện sự xếp hạng, thể hiện mối quan hệ so sánh thứ tự giữa các loại đối tượng để chỉ ra phạm vi liên hệ đến một đặc tính nào đó. Thang đo này cũng không có ý nghĩa về mặt lượng
(không cho biết nhiều hơn hay ít hơn bao nhiêu, chỉ cho biết cấp độ chênh lệch). Ví dụ: Vui lòng xếp thứ tự các loại chất đốt mà anh (chị) ưa thích?
( ) Củi
( ) Than đá
( ) Dầu
( ) Gas
Thang đo khoảng (Interval scale)
3
Là thang đo cũng có thể dùng để xếp hạng các đối tượng nghiên cứu nhưng khoảng cách bằng nhau trên thang đo đại diện cho khoảng cách bằng nhau trong đặc điểm của đối tượng. Một thang đo khoảng chứa đựng tất cả thông tin trong thang đo thứ tự nhưng nó cũng cho phép só sánh sự khác
biệt giữa các đối tượng. Ví dụ: sự khác biệt giữa “3” và “4” thì bằng sự khác biệt giữa “1” và “2”, hoặc sự khác biệt giữa “2” và “4” thì gấp đôi sự khác biệt giữa “1” và “2”.
Thang đo tỷ lệ (Ratio scale)
Là loại thang đo cao nhất, nó chứa đựng tất cả nội dung của thang đo biểu danh, thang đo thứ tự và thang đo khoảng. Trong thang đo tỷ lệ, ta có thể nhận dạng hoặc phân loại đối tượng, xếp hạng đối
tượng và so sánh sự khác biệt. Thang đo tỷ lệ không chỉ cho biết sự khác biệt giữa 2 và 5 thì bằng sự khác biệt giữa giữa 14 và 17 mà nó còn cho biết thêm 14 thì gấp 7 lấn của 2.
2.2. Tiến trình thiết kế bảng câu hỏi
Thiết kế bảng câu hỏi là một kỹ năng đòi hỏi thông qua kinh nghiệm, và nó còn là một nghệ thuật. Thiết kế bảng câu hỏi là một quá trình bao gồm 10 bước:
Bước 1: Xác định những thông tin cần thiết
Bước 2: Xác định hình thức phỏng vấn, thu dữ liệu
Bước 3: Xác định nội dung các câu hỏi cần thiết
Bước 4: Thiết kế câu hỏi để khắc phục trường hợp đáp viên không sẵn lòng trả lời
Bước 5: Quyết định cấu trúc câu hỏi (đóng, mở)
Bước 6: Quyết định từ ngữ sử dụng trong câu hỏi
Bước 7: Sắp xếp câu hỏi theo thứ tự hợp lý
Bước 8: Xác định hình thức bảng câu hỏi
Bước 9: Hoàn chỉnh bảng câu hỏi
Bước 10: Điều tra thử bảng câu hỏi
3. CÁCH THỨC MÃ HOÁ VÀ NHẬP LIỆU
3.1. Mã hóa dữ liệu
Tiến hành mã hóa dữ liệu ở giao diện Variable View. Bước mã hóa dữ liệu nên được hoàn thành trước khi tiến hành nhập liệu
Giao diện Variable View thể hiện:
- Các hàng là các biến
- Các cột là các thuộc tính của biến
4
Các thuộc tính của biến bao gồm:
- Tên biến (Name): ngắn gọn cho biết đang đề cập đến câu hỏi nào trong bảng câu hỏi. Độ dài tối đa là 8 ký tự, không sử dụng dấu cách hoặc các ký hiệu đặc biệt (như !, ?, *, và ‘). Tên
biến không được trùng lặp
- Loại dữ liệu (Type): mặc định là dạng số, có thể thay đổi định dạng biến ở phần Variable
Type.
- Số lượng con số hoặc chữ (With) tối đa có thể nhập vào, có thể thay đổi trong hộp Variable Type ở trên.
- Số lượng chữ số thập phân (Decimals), có thể thay đổi trong hộp Variable Type ở trên.
- Nhãn biến (Lable): mô tả chi tiết cho tên biến, có thể dài đến 256 ký tự, có thể dùng ký hiệu
đặc biệt.
- Nhãn trị số của biến (Value): dùng để mô tả cho từng trị số của biến (ví dụ mã số 1 đại diện cho nhóm nam và 2 đại diện cho nữ).
- Trị số khuyết thiếu (Missing): định nghĩa các trị số như là khuyết thiếu của người sử dụng để
giúp phân biệt trị số khuyết thiếu do đáp viên từ chối trả lời hay do câu hỏi đó không áp dụng đối với người này. Các trị số được chỉ định là khuyết thiếu của người sử dụng được đánh dấu để SPSS có thể nhận ra trong các phép tính toán.
- Canh lề (Align)
- Thang đo (Measure)
3.2. Nhập liệu
Sau khi mã hóa, trong giao diện Data View đã xuất hiện 1 form nhập dữ liệu. Tiến hành nhập liệu trong giao diện Data View. Nhập lần lượt từng bảng câu hỏi. Nhập trị số hay chuỗi theo bảng câu
hỏi.
5
4. MỘT SỐ XỬ LÝ TRÊN BIẾN
4.1. Mã hóa lại biến
Trong quá trình phân tích dữ liệu người làm nghiên cứu đôi khi sẽ phải mã hoá lại biến để sử
dụng cho nhiều mục đích khác nhau, và trường hợp đơn cử nhất là:
Khi nhà nghiên cứu muốn chuyển một biến định lượng (thang đo tỷ lệ) sang một biến định
tính (thang đo biểu danh hay thứ tự).
Ví dụ: Khi thu thập thông tin về độ tuổi của bệnh nhân, chúng ta sử dụng thang đo tỷ lệ (dùng chính xác số tuổi của bệnh nhân: 52, 67, hay 81 tuổi…). Đến khi xử lý số liệu, nhà nghiên
cứu lại muốn sử dụng nhóm tuổi để phân tích và viết báo cáo:
1. < 30 tuổi
2. 30 – 39 tuổi
3. 40 – 49 tuổi
4. 50 – 59 tuổi
5. ≥ 60 tuổi
Quy trình mã hoá lại biến như sau:
1. Vào menu Transform Recode into Different Variables…
Nếu chúng ta chọn Recode into Same Variables… thì biến cũ (số tuổi chính xác) sẽ mất đi và được thay thế bằng một biến mới với các biểu hiện mới (là nhóm tuổi).
Thông thường ta sẽ chọn Recode into Different Variables… để tạo ra biến mới mà vẫn giữ lại biến cũ.
2. Xuất hiện hộp thoại sau:
6
3. Đưa biến cần mã hoá lại từ khung chứa bộ biến sang khung Numeric Variable -> Output
Variable.
4. Tại khung Output Variable, khai báo tên và nhãn cho biến mới Click chọn Change để
thực hiện thay biến.
5. Tiếp tục thay đổi giá trị của biến bằng cách click chọn Old and New Values…, mở hộp thoại
sau:
6. Ta lần lượt khai báo giá trị cũ bên tay trái (Old Value) thành giá trị mới bên tay phải (New
Value) Click chọn Add sau mỗi lần khai báo. Với giá trị cũ có các dạng sau đây:
- Value: từng giá trị cũ rời rạc
- System-missing: giá trị khuyết hệ thống - System or user missing: giá trị khuyết của hệ thống hoặc do người sử dụng định nghĩa
7
- Range: một khoảng giá trị (từ … đến … / range: … through: …) - Range, LOWEST through value: một khoảng giá trị từ giá trị nhỏ nhất đến một giá trị
được nhập vào
- Range, value through HIGHEST: một khoảng giá trị từ giá trị nhập vào đến giá trị lớn nhất
7. Chọn Continue trở về hộp thoại trước, và chọn OK để hoàn tất kệnh.
8. Khai báo value cho biến vừa tạo tại ô Value của cửa sổ Variable View như hình sau:
Tiếp tục thực hiện các phép thống kê mô tả hay kiểm định dựa trên biến mới vừa tạo nhằm phục vụ cho mục tiêu nghiên cứu.
4.2. Làm sạch dữ liệu
Dữ liệu sau khi nhập xong có thể có sai sót do trong quá trình nhập liệu, nên việc làm sạch dữ liệu
là rất cần thiết. Có nhiều phương thức để làm sạch dữ liệu như: tìm ngay trên cửa sổ Data View, dùng bảng tần số đơn giản, hay bảng phối hợp 2 hay 3 biến… Trong những cách trên, việc lập bảng tần số để phát hiện lỗi trong quá trình nhập liệu là đơn giản nhất và hiệu quả cao.
Khi tiến hành lập bảng tần số (bằng lệnh Frequency – xem them phần tính tần số), có bảng kết quả như sau:
Gioi tinh
Frequency Percent Valid Percent Cumulative Percent
Valid Nam 38 76.0 76.0 76.0
Nu 11 22.0 22.0 98.0
12 1 2.0 2.0 100.0
Total 50 100.0 100.0
Nhìn vào bảng thấy có giá trị “12” xuất hiện trong bảng giới tính Nam và Nữ. Lỗi này có thể do quá
trình nhập liệu bị sai sót. Cách khắc phục là tìm ra chỗ nhập sai để chỉnh sửa lại cho hợp lý. Chúng ta sẽ dùng thủ tục Find để tìm lỗi.
Trên cửa sổ Data View, chọn toàn bộ cột tương ứng với biến có giá trị bị lỗi. Vào menu Edit Find để mở hộp thoại:
8
Nhập giá trị 12 vào ô Find rồi click chọn Find next thì vị trí chứa giá trị lỗi 12 xuất hiện trên màn hình. Truy ngược lại số thứ tự bảng câu hỏi để chỉnh sửa lại cho đúng.
4.3. Tính toán giá trị biến mới từ biến có sẵn
Có thể sử dụng SPSS để cộng, trừ, nhân chia các biến đã có sẵn để trở thành 1 biến mới (thủ tục
TransformCompute). Tuy nhiên biến mới được tính toán này không tự động thay đổi nếu ta thay đổi các biến thành phần như công cụ tính toán trong Excel. Vì vậy, thủ tục tính toán này thường được tiến hành sau khi đã chỉnh lý dữ liệu.
Thủ tục tính toán này được sử dụng khá nhiều trong phân tích số liệu. Đặc biệt đối với những đề tài có sử dụng phân tích nhân tố để gom nhóm.
9
CÁCH THỨC TIẾN HÀNH LỆNH FREQUENCIES
TÍNH TẦN SỐ
Tính tần số được áp dụng cho những câu hỏi sử dụng thang đo biểu danh hoặc thứ tự
(biến định tính) để đếm số lần và tính tỷ lệ xuất hiện của các biểu hiện. Thao tác thực hiện
trong SPSS như sau:
1. Sau khi mở file dữ liệu, vào menu Analyze Descriptive Statistics Frequencies
Màn hình sẽ xuất hiện hộp thoại sau:
2. Chọn biến muốn tính tần số (biến Place V1) bằng cách click chuột vào tên biến rồi
đưa sang khung Variable(s).
3. Click Ok. Trường hợp muốn vẽ biểu đồ thực hiện thêm bước 4 trước khi click Ok.
Vẽ biểu đồ
10
4. Để vẽ biểu đồ click chuột vào ô Charts…. Chọn dạng biểu đồ ở Chart type, chọn giá
trị thể hiện trên biểu đồ là số đếm (frequencies) hay phần trăm (percentages). Click
Continue để trở lại hộp thoại Frequencies Ok để thực hiện lệnh.
TÍNH TRỊ TRUNG BÌNH (2 CÁCH)
CÁCH 1. DÙNG LỆNH FREQUENCY
1. Vào menu Analyze Descriptive Statistics Frequencies. Đưa biến cần tính trị
trung bình vào ô variables như bước 1 và 2 ở phần trước.
2. Click chọn thẻ Statistic, mở hộp thoại, và click chọn các thông số cần thiết:
3. Ý nghĩa một số thông số thông dụng:
Mean: trung bình cộng
Sum: tổng cộng (cộng tất cả các giá tị trong tập dữ liệu quan sát)
Std. Deviation: độ lệch chuẩn
Minimum: giá trị nhỏ nhất
Maximum: giá trị lớn nhất
S.E. mean: sai số chuẩn khi ước lượng trị trung bình
11
CÁCH 2. DÙNG LỆNH DESCRIPTIVES
1. Vào menu Analyze Descriptive Statistics Descriptives…, xuất hiện hộp thoại
2. Chọn 1 hay nhiều biến (định lượng) muốn tính điểm trung bình đưa vào khung
Variable(s).
3. Click vào ô Options… để xuất hiện hộp thoại Descriptive Options. Chọn các đại
lượng thống kê muốn tính toán bằng cách click vào ô vuông cần thiết.
4. Chọn cách sắp xếp kết quả tính toán theo thứ tự danh sách biến (Variable list), thứ tự
Alphabetic của nhãn biến, thứ tự tăng dần (Ascending list), và thứ tự giảm dần
(Descending list).
5. Click Continue để trở về hộp thoại Descriptive Ok để thực hiện lệnh.
12
CÁCH THỨC TIẾN HÀNH PHÂN TÍCH BẢNG CHÉO
(CROSSTABULATION)
Phân tích bảng chéo dùng để kiểm định mối quan hệ giữa các biến định tính với nhau
bằng cách dùng kiểm định Chi – bình phương (Chi-square). Cách thức tiến hành với SPSS
như sau:
1. Vào menu Analyze Descriptive Statistics Crosstabs…,
2. Xuất hiện hộp thoại sau:
3. Chọn và đưa các biến vào khung Row(s) (dòng) và Column(s) (cột) và Layer 1 of 1
(đối với trường hợp trên 2 biến).
4. Click vào ô Statistics, xuất hiện hộp thoại sau:
13
5. Chọn các kiểm định cần thiết. Trong trường hợp này ta dùng kiểm định Chi – bình
phương (Chi-square).
- Các kiểm định ở ô Norminal dùng để kiểm định mối liên hệ giữa các biến biểu
danh.
- Các kiểm định ở ô Ordinal dùng để kiểm định mối liên hệ giữa các biến thứ tự.
6. Click vào continue để trở lại hộp thoại Crosstabs Click vào ô Cells, hộp thoại sau
xuất hiện:
7. Ở ô Counts chọn Observed (thể hiện tần số quan sát). Trong trường hợp muốn thể
hiện tần số mong đợi chọn Expected.
8. Chọn cách thể hiện phần trăm theo dòng hay theo cột ở ô Percentages.
9. Click Continue để trở lại hộp thoại Crosstabs Ok để thực hiện lệnh.
14
CÁCH ĐỌC KẾT QUẢ KIỂM ĐỊNH
Khi thực hiện kiểm định, ta có 2 giả thuyết.
H0: không có mối quan hệ giữa các biến.
H1: có mối quan hệ giữa các biến.
Để kết luận là chấp nhận hay bác bỏ giả thuyết H0, ta sẽ dùng các kiểm định phù hợp.
Dựa vào giá trị P (p-value) (SPSS viết tắt p-value là sig.) để kết luận là chấp nhận hay bác
bỏ giả thuyết H0
p-value (sig.) ≤ α (mức ý nghĩa) bác bỏ giả thuyết H0. Có nghĩa là có mối quan hệ
có ý nghĩa giữa các biến cần kiểm định.
p-value (sig.) > α (mức ý nghĩa) chấp nhận H0. Không có mối quan hệ giữa các
biến cần kiểm định.
ĐỐI VỚI KIỂM ĐỊNH CHI – BÌNH PHƯƠNG
Hàng đầu tiên của bảng Chi-square tests thể hiện giá trị P
Chi-Square Tests
Value df Asymp. Sig. (2-sided)
Pearson Chi-Square 16.217a 8 .039
Likelihood Ratio 18.708 8 .017
Linear-by-Linear Association .202 1 .653
N of Valid Cases 511
a. 8 cells (44.4%) have expected count less than 5. The minimum expected count is 1.69.
Cuối bảng Chi-Square tests SPSS sẽ đưa ra dòng thông báo cho biết % số ô có tần
suất mong đợi dưới 5. Kiểm định Chi-bình phương chỉ có ý nghĩa khi số quan sát đủ lớn,
nếu có quá 20% số ô trong bảng chéo có tần số lý thuyết nhỏ hơn 5 thì giá trị chi-bình
phương không còn đáng tin cậy.
Trong ví dụ trên có đến 44.4% số ô có tần số mong đợi dưới 5, biện pháp cho trường
hợp này là ta sẽ gom các biểu hiện trên các biến lại để tăng số quan sát trong mỗi nhóm.
p-value
15
KIỂM ĐỊNH CHI – BÌNH PHƯƠNG MỘT MẪU
(KIỂM ĐỊNH PHI THAM SỐ)
Ví dụ: nhà nghiên cứu muốn xem xét lý do vào viện của bệnh nhân có như nhau hay
không. Với những lý do như sau:
1. Đau hạ vị
2. Ra huyết âm đạo bất thường
3. Tự sờ thấy u
4. Siêu âm phát hiện
Ta giả định rằng, nếu xác suất lý do vào viện là như nhau thì xác suất xảy ra của mỗi
lý do vào viện bằng 1/4. Với tổng số quan sát là 88 bệnh nhân, thì xác suất xảy ra của mỗi lý
do = 1/4 x 88 = 22 trường hợp nhập viện.
Với giả thuyết H0: xác suất lý do vào viện của bệnh nhân là như nhau, ta sẽ thực hiện
kiểm định Chi – bình phương 1 mẫu.
1. Từ menu Analyze Nonparametric Tests Chi-square…, mở hộp thoại sau:
2. Đưa biến cần kiểm định sang khung Test Variable List Click chọn OK để hoàn tất
lệnh.
3. Kết quả xuất hiện ở cửa sổ Output như sau:
16
ly do vao vien
Observed N Expected N Residual
dau ha vi 69 22.0 47.0
ra huyet ad bat thuong 13 22.0 -9.0
tu so thay u 3 22.0 -19.0
sieu am 3 22.0 -19.0
Total 88
Test Statistics
ly do vao vien
Chi-Square 136.909a
df 3
Asymp. Sig. .000
a. 0 cells (.0%) have expected
frequencies less than 5. The
minimum expected cell frequency
is 22.0.
Không sử dụng bảng số liệu từ cửa sổ kết quả SPSS để trình bày báo cáo, nhà nghiên
cứu sẽ lập lại bảng theo mục đích và cách thức trình bày báo cáo như sau:
Kết hợp với kết quả phân tích tần số thông thường, ta có bảng kết quả sau
Lý do vào viện Số mẫu Tỷ lệ
p = 0.000 < α
1. Đau hạ vị
2. Ra huyết âm đạo bất thường
3. Tự sờ thấy u
4. Siêu âm phát hiện
69
13
3
3
78.4
14.8
3.4
3.4
TỔNG 88 100
Kết quả cho thấy giá trị p < α, nên ta bác bỏ giả thuyết H0. Ta kết luận rằng lý do
nhập viện của bệnh nhân là khác nhau và phần lớn bệnh nhân vào viện là do đau hạ vị
(78.4%), tiếp theo là do ra huyết âm đạo (14.8%), trong khi số bệnh nhân vào viện do tự sờ
thấy khối u hay do siêu âm phát hiện là ít nhất (3.4%).
p-value
17
CÁCH THỨC TIẾN HÀNH KIỂM ĐỊNH GIẢ THUYẾT VỀ TRỊ TRUNG BÌNH
CỦA 2 TỔNG THỂ ĐỘC LẬP (Independent Samples T-test)
1. Vào menu Analyze Compare Means Independent-samples T-test
2. Chọn biến định lượng cần kiểm định trị trung bình đưa vào khung Test Variable(s).
Chọn biến định tính chia số quan sát thành 2 nhóm mẫu để so sánh giữa 2 nhóm này
với nhau đưa vào khung Grouping Variable.
3. Chọn Define Groups… để nhập mã số của 2 nhóm. Click Continue để trở lại hộp
thoại chính Click Ok để thực hiện lệnh
18
Trong kiểm định Independent-samples T-test, ta cần dựa vào kết quả kiểm định sự
bằng nhau của 2 phương sai tổng thể (kiểm định Levene). Phương sai diễn tả mức độ đồng
đều hoặc không đồng đều (độ phân tán) của dữ liệu quan sát.
Independent Samples Test
A.Cleanliness and comfort of
room
Equal
variances
assumed
Equal
variances not
assumed
Levene's Test for Equality of
Variances
F .138
Sig. .710
t-test for Equality of Means t -3.066 -3.040
df 509 448.100
Sig. (2-tailed) .002 .003
Mean Difference -.231 -.231
Std. Error Difference .075 .076
95% Confidence Interval
of the Difference
Lower -.379 -.380
Upper -.083 -.082
Nếu giá trị Sig. trong kiểm định Levene (kiểm định F) < 0.05 thì phương sai của 2
tổng thể khác nhau, ta sử dụng kết quả kiểm định t ở dòng Equal variances not assumed.
Nếu Sig. ≥ 0.05 thì phương sai của 2 tổng thể không khác nhau, ta sử dụng kết quả
kiểm định t ở dòng Equal variances assumed.
Trong VD trên Sig. của kiểm định F = 0.71 > 0.05 chấp nhận giả thuyết H0 không có sự
khác nhau về phương sai của 2 tổng thể sử dụng kết quả ở dòng Equal variances
assumed.
Nếu Sig. của kiểm định t ≤ α (mức ý nghĩa) có sự phác biệt có ý nghĩa về trung
bình của 2 tổng thể.
Nếu Sig. > α (mức ý nghĩa) không có sự khác biệt có ý nghĩa về trung bình của 2
tổng thể.
Trong VD trên sig. = 0.002 < 0.05 có sự khác biệt có ý nghĩa về trung bình của 2 tổng thể.
ỨNG DỤNG TRONG Y HỌC
XEM CÁC CHỈ SỐ CẦN KIỂM ĐỊNH GIỮA 2 NHÓM BỆNH NHÂN CÓ KHÁC
NHAU HAY KHÔNG
19
CÁCH THỨC TIẾN HÀNH KIỂM ĐỊNH GIẢ THUYẾT VỀ TRỊ TRUNG BÌNH
CỦA 2 TỔNG THỂ PHỤ THUỘC HAY PHỐI HỢP TỪNG CẶP
(Paired-Samples T-test)
1. Vào menu Analyze Compare means Paired-samples T-test
2. Chọn cặp biến muốn so sánh (nhấn giữ phím ctrl để chọn 2 biến) đưa vào khung
Paired Variable(s). Có thể chọn nhiều cặp để so sánh cùng 1 lúc.
3. Có thể chỉnh lại độ tin cậy bằng cách click vào ô Option, nhập độ tin cậy vào khung
Confidence Interval.
4. Click Ok để thực hiện lệnh.
5. Xem cách đọc kết quả kiểm định ở phần trên. Cũng dùng giá trị Sig.
ỨNG DỤNG TRONG Y HỌC
XEM CÁC CHỈ SỐ CẦN KIỂM ĐỊNH TRƯỚC VÀ SAU (PHẨU THUẬT) CÓ
KHÁC NHAU HAY KHÔNG
20
CÁCH THỨC TIẾN HÀNH PHÂN TÍCH PHƯƠNG SAI
(ANOVA – Analysis of Variance)
Phân tích phương sai ANOVA là phương pháp so sánh trị trung bình của 3 nhóm trở
lên. Có 2 kỹ thuật phân tích phương sai: ANOVA 1 yếu tố (một biến yếu tố để phân loại các
quan sát thành các nhóm khác nhau) và ANOVA nhiều yếu tố(2 hay nhiều biến để phân
loại). Ở phần thực hành cơ bản chỉ đề cập đến phân tích phương sai 1 yếu tố (One-way
ANOVA).
Một số giả định đối với phân tích phương sai một yếu tố:
- Các nhóm so sánh phải độc lập và được chọn một cách ngẫu nhiên.
- Các nhóm so sánh phải có phân phối chuẩn hoặc cỡ mẫu phải đủ lớn để được xem
như tiệm cận phân phối chuẩn.
- Phương sai của các nhóm so sánh phải đồng nhất.
1. Từ menu Analyze Compare Means One-Way ANOVA, xuất hiện hộp thoại
sau:
2. Đưa biến định lượng (trị trung bình) vào khung Dependent list.
Đưa biến phân loại xác định các nhóm cần so sánh với nhau vào khung Factor.
3. Click vào nút Option để mở hộp thoại One-Way ANOVA Options.
Trong hộp thoại One-way ANOVA Options:
- Click chọn ô Descriptive để tính đại lượng thống kê mô tả (tính trị trung bình)
theo từng nhóm so sánh.
- Click chọn ô Homogeneity of variance test để kiểm định sự bằng nhau của các
phương sai nhóm (thực hiện kiểm định Levene).
2 kỹ thuật dùng để
kiểm định sâu
ANOVA
21
4. Click chọn Continue để trở lại hộp thoại ban đầu click Ok để thực hiện lệnh.
5. Dựa vào kết quả kiểm định ANOVA, nếu H0 được chấp nhận thì kết luận không có
sự khác biệt có ý nghĩa giữa các nhóm với nhau. Nếu H0 bị bác bỏ có sự khác biệt
có ý nghĩa giữa các nhóm trở lại hộp thoại One – way ANOVA để thực hiện kiểm
định sâu ANOVA nhằm xác định cụ thể trung bình của nhóm nào khác với nhóm
nào, nghĩa là tìm xem sự khác biệt của các nhóm xảy ra ở đâu.
6. Tuy nhiên có thể thực hiện kiểm định ANOVA và sâu ANOVA cùng lúc với nhau.
Dựa vào sự chấp nhận hay bác bỏ giả thuyết H0 để quan tâm hay không quan tâm đến
kết quả kiểm định sâu ANOVA.
Phân tích sâu ANOVA – Xác định chỗ khác biệt
Có 2 phương pháp để phân tích sâu ANOVA, đó là kiểm định “trước” (kiểm định
Priori Contrasts) và kiểm định “sau” (kiểm định Post-Hoc test). Phương pháp kiểm định gần
với phương pháp nghiên cứu thực là Post-Hoc test. Nên trong phần này ta sẽ sử dụng Post-
Hoc test để thực hiện kiểm định sâu ANOVA nhằm tìm ra chỗ khác biệt.
Các phương pháp kiểm định thống kê của Post-Hoc test thường được sử dụng:
- LSD: đây là phép kiểm định dùng kiểm định t lần lượt cho từng cặp trung bình
nhóm, do vậy nhược điểm của nó là độ tin cậy không cao vì làm gia tăng mức độ
phạm sai lầm tương ứng với việc so sánh nhiều nhóm cùng một lúc.
- Bonferroni : giống quy tắc của LSD nhưng điều chỉnh được mức ý nghĩa khi tiến
hành so sánh bội dựa trên số lần tiến hành so sánh. Đây là một trong những thủ
tục kiểm định đơn giản nhất và hay được sử dụng cho mục tiêu này.
22
- Tukey: cũng được sử dụng phổ biến cho việc tìm kiếm các trung bình các nhóm
khác biệt. Nó sử dụng bảng phân phối Studentizze range distribution. Tukey hiệu
quả hơn Bonferroni khi số lượng các cặp trung bình cần so sánh khá nhiều.
- R-E-G-W: thực hiện 2 bước kiểm định, đầu tiên tiến hành kiểm định lại toàn bộ
các giá trị trung bình nhóm xem có bằng nhau không; nếu không bằng thì bước kế
tiếp nó sẽ kiểm định để tìm các nhóm nào khác biệt thật sự với nhau về trị trung
bình. Nhưng kiểm định này không phù hợp khi kích cỡ các nhóm mẫu không
bằng nhau.
- Dunnett: là thủ tục cho phép chọn so sánh các trị trung bình của các nhóm mẫu
còn lại với trị trung bình của một nhóm mẫu cụ thể nào đó được chọn ra so sánh
(nhóm điều khiển), SPSS mặc định chọn nhóm cuối (last) để làm nhóm điều
khiển.
Sử dụng kiểm định nào là tuỳ thuộc vào mục đích của nhà nghiên cứu và tình hình
thực tế nghiên cứu.
Đọc kết quả phân tích phương sai
1. Bảng đầu tiên thể hiện các đại lượng thống kê mô tả
2. Bảng thứ 2 thể hiện kết quả kiểm định Levene. Trong VD này Sig. = 0.273 > mức ý
nghĩa 0.1 chấp nhận giả thuyết H0 phương sai các nhóm không khác nhau một
cách có ý nghĩa có thể sử dụng kết quả phân tích ANOVA ở bảng tiếp theo.
Test of Homogeneity of Variances
Willingness to introduce
Levene Statistic df1 df2 Sig.
1.303 3 507 .273
23
3. Bảng thứ 3 thể hiện kết quả kiểm định ANOVA. Trong VD này sig. = 0.089 < mức ý
nghĩa 0.1 bác bỏ giả thuyết H0 có sự khác biệt có ý nghĩa về giá trị trung bình
của mức độ sẵn lòng giới thiệu của các nhóm tình trạng hôn nhân.
ANOVA
Willingness to introduce
Sum of Squares df Mean Square F Sig.
Between Groups 3.228 3 1.076 2.186 .089
Within Groups 249.523 507 .492
Total 252.751 510
4. Bảng thứ 4 thể hiện kết quả kiểm định sâu ANOVA (dùng kiểm định LSD).
Multiple Comparisons
Willingness to introduce
LSD
(I) Marital status (J) Marital status
Mean
Difference (I-J) Std. Error Sig.
95% Confidence Interval
Lower Bound Upper Bound
Single Married/Living with partner -.167* .068 .015 -.30 -.03
Divorced -.016 .190 .934 -.39 .36
Widowed -.382 .499 .444 -1.36 .60
Married/Living with
partner
Single .167* .068 .015 .03 .30
Divorced .151 .185 .415 -.21 .51
Widowed -.216 .498 .665 -1.19 .76
Divorced Single .016 .190 .934 -.36 .39
Married/Living with partner -.151 .185 .415 -.51 .21
Widowed -.367 .528 .488 -1.40 .67
Widowed Single .382 .499 .444 -.60 1.36
Married/Living with partner .216 .498 .665 -.76 1.19
Divorced .367 .528 .488 -.67 1.40
*. The mean difference is significant at the 0.05 level.
Dựa vào kết quả kiểm định LSD này, ta có thể kết luận chỉ có hai nhóm đã kết hôn và
độc thân là có sự khác nhau về mức độ sẵn lòng giới thiệu. Trong VD này nhóm đã kết hôn
sẽ sẵn lòng giới thiệu hơn nhóm độc thân (xem bảng thống kê mô tả).
GHI CHÚ
CÓ THỂ KHÔNG CẦN ĐẾN PHẦN KIỂM ĐỊNH SÂU ANOVA.
ÁP DỤNG TRONG Y HỌC
XEM CÁC CHỈ SỐ CẦN KIỂM ĐỊNH GIỮA 3 NHÓM BỆNH NHÂN TRỞ LÊN
CÓ KHÁC NHAU HAY KHÔNG
24
XỬ LÝ CÂU HỎI NHIỀU LỰA CHỌN
1. MÃ HOÁ
Trong quá trình nghiên cứu, có những câu hỏi cho phép người trả lời chọn nhiều hơn
1 lựa chọn. Ví dụ: câu hỏi về tiền sử phẫu thuật, bệnh nhân có thể cùng một lúc có nhiều
phẩu thuật trước đây. Đây được gọi là câu hỏi nhiều lựa chọn.
Số thứ tự Tên phẫu thuật Đánh dấu và ghi chú (nếu có)
1. Cắt viêm ruột thừa
2. Mổ lấy thai
3. Cắt tử cung
4. Phẫu thuật u buồng trứng
5. Viêm túi mật
6. Phẫu thuật khác
Đối với câu hỏi nhiều lựa chọn, mỗi một lựa chọn sẽ được mã hoá thành 1 biến. Theo
ví dụ trên ta sẽ mã hoá thành 6 biến.
Cách thức khai báo Value: có 2 cách thức
- Cách 1: dùng dạng câu hỏi phân đôi Có – Không (Dạng biến Dichotomy)
- Cách 2: dùng chính số thứ tự của biến để mã hoá. Nếu bệnh nhân nào có tiền sử
cắt viêm ruột thừa sẽ nhập vào số 1, có tiền sử mổ lấy thai sẽ nhập vào số 2.
(Dạng biến Category)
25
2. CÁCH THỨC XỬ LÝ
Đối với câu hỏi nhiều lựa chọn, khi cần phân tích tần số chúng ta không sử dụng
công cụ thống kê mô tả tính Frequency thông thường. Công cụ dùng xử lý câu hỏi nhiều lựa
chọn là Multiple Response.
2.1. Định dạng biến tổng hợp
1. Từ menu Analyze Multiple Response Define Variable Sets… để mở hộp
thoại sau:
2. Chọn tất cả các biến thuộc câu nhiều lựa chọn đưa vào khung Variables in Set.
3. Khai báo cách mã hoá ở khung Variables Are Coded As:
- Nếu dùng cách mã hoá 1: dùng dạng câu hỏi phân đôi Có – Không, ta sẽ khai báo
biến ở dòng Dichotomies. Và sẽ đếm giá trị “Có” ở ô Counted value. Đối với ví
dụ trên, do ta khai báo 1. Không, 2. Có, nên ở ô này ta sẽ nhập giá trị cần đếm là
“2”
- Nếu dùng cách mã hoá 2, ta sẽ khai báo ở dòng Categories, và đếm các số thứ tự
của biến. Trong ví dụ trên có 6 biến, ta sẽ đếm từ giá trị 1 đến 6 tại ô Range: 1
through: 6.
4. Khai báo tên và nhãn biến ở khung Name và Label.
5. Click vào Add để xác nhận biến tổng hợp đã được tạo Click chọn Close để
hoàn tất quá trình định dạng biến tổng hợp.
26
2.2. Phân tích tần số (Frequency)
1. Từ menu Analyze Multiple Response Frequency, xuất hiện hộp thoại sau:
2. Đưa biến tổng hợp vừa tạo ở phần trên vào ô Tables for Click chọn Ok để hoàn
tất thao tác.
3. Kết quả hiện ra ở cửa sổ Output như sau:
$TSPHAUTHUATTH Frequencies
Responses Percent of
Cases N Percent
TIEN SU PHAU THUAT
TONG HOPa
tien su cat viem ruot thua 38 69.1% 76.0%
tien su mo lay thai 3 5.5% 6.0%
tien su mo cat tu cung 2 3.6% 4.0%
tien su phau thuat u buong
trung 3 5.5% 6.0%
ts mo do benh khac 9 16.4% 18.0%
Total 55 100.0% 110.0%
a. Dichotomy group tabulated at value 2.
- Percent of Cases: phần trăm trên tổng số bệnh nhân được quan sát (50 bệnh nhân) - Percent of Responses: phần trăm trên tổng sự trả lời (vì mỗi bệnh nhân có thể có nhiều
tiền sử phẩu thuật nên tổng sự trả lời = 55 > cỡ mẫu quan sát = 50)
27
CÁCH THỨC TIẾN HÀNH PHÂN TÍCH NHÂN TỐ
1. Từ menu Analyze Data Reduction Factor
2. Xuất hiện hộp thoại sau:
3. Chọn tất cả các biến cần gom nhóm vào ô Variables.
4. Click chọn ô Descriptives…, xuất hiện hộp thoại sau:
28
- Chọn các tham số thống kê mô tả.
- Chọn tính các ma trận hệ số tương quan.
- Chọn kiểm định Bartlett. Trong phân tích nhân tố, cần kiểm định mối tương quan
của các biến với nhau (H0: các biến không có tương quan với nhau trong tổng
thể). Nếu giả thuyết H0 không được bác bỏ thì phân tích nhân tố có khả năng
không thích hợp.
- Click continue để trở lại hộp thoại Factor analysis
5. Click chọn ô Extraction để mở hộp thoại sau:
- Chọn phương pháp rút trích nhân tố, phương pháp mặc định là rút các thành phần
chính – Principal components.
- Phân tích ma trận tương quan hay hiệp phương sai ở ô Analyze.
- Thể hiện phương án nhân tố chưa xoay và vẽ biểu đồ dốc ở ô Display.
- Xác định tiêu chuẩn rút trích nhân tố hay số lượng nhân tố cần rút trích.
Có 2 cách để xác định tiêu chuẩn này ở ô Extract:
Xác định từ trước dựa vào ý đồ của nhà nghiên cứu và kết quả của các cuộc
nghiên cứu trước. Nhà nghiên cứu xác định số nhân tố ở ô Number of factors.
Xác định dựa vào Eigenvalue (Determination based on eigenvalue. Chỉ có
những nhân tố nào lớn hơn 1 mới được giữ lại trong mô hình phân tích.
- Click Continue để trở lại hộp thoại Factor Analysis.
6. Click chọn ô Rotation (Xoay nhân tố) để mở hộp thoại sau:
Xoay nhân tố là thủ tục giúp ma trận nhân tố trở nên đơn giản và dễ giải thích hơn.
29
Có nhiều phương pháp xoay khác nhau trong đó được sử dụng rộng rãi nhất là
Varimax procedure (xoay nguyên góc các nhân tố để tối thiểu hoá số lượng biến có hệ số
lớn tại cùng một nhân tố, vì vậy sẽ tăng cường khả năng giải thích các nhân tố).
Click Continue để trở lại hộp thoại chính.
7. Click chọn ô Factor Score để tính điểm các nhân tố
Nếu nhà nghiên cứu muốn xác định tập hợp nhân tố ít hơn để sử dụng trong các
phương pháp phân tích đa biến tiếp theo (phân tích ANOVA, hồi quy…), ta có thể tính toán
ra các nhân số (trị số của các biến tổng hợp) cho từng trường hợp quan sát một. Nhân số của
nhân tố thứ i bằng:
Fi = Wi1X1 + Wi2X2 + Wi3X3 + … + WikXk
Máy tính sẽ tính các nhân số này và tự động save vào file dữ liệu những biến mới
này.
- Mặc định của chương trình là phương pháp tính nhân số Regression (theo đơn vị
đo lường độ lệch chuẩn).
- Chọn thể hiện bảng trọng số nhân tố bằng cách click vào ô Display factor …
- Click Continue để trở lại hộp thoại ban đầu click Ok để thực hiện lệnh.
30
ĐỌC KẾT QUẢ CỦA VÍ DỤ SAU
VD: xác định nhân tố ảnh hưởng đến quyết định chọn nhà trọ của sinh viên khoa công nghệ
trường Đại học Cần thơ.
Bảng 1. Descriptive Statistics
Mean Std. Deviation Analysis N
gia ca 3.91 1.065 43
ve sinh 4.05 .950 43
an ninh 4.35 .948 43
moi truong song 4.09 .811 43
gan truong 3.60 1.072 43
gan khu vui choi, giai tri 3.28 1.161 43
phong co gac lung 3.33 .993 43
co nha ve sinh trong phong 3.67 1.063 43
noi qui 3.79 .940 43
dien, nuoc 4.16 .871 43
Bảng 2. Correlation Matrix
Correlation
gia ca ve sinh an ninh
moi
truong
song
gan
truong
gan khu
vui choi,
giai tri
phong co
gac lung
co nha ve
sinh trong
phong noi qui
dien,
nuoc
gia ca 1.000 .522 .528 .313 .238 .291 .209 .288 .123 .402
ve sinh .522 1.000 .801 .581 .392 .096 .337 .298 .198 .393