www.ba.nccu.edu.tw/aihwa/under/SPSS基礎教學
Ya-Yun Cheng & How-Ran GuoDepartment of Environmental and
Occupational Health National Cheng Kung University
2011.03.02
Agenda
•第一章 編碼與變數檢視
•第二章 資料轉換
•第三章 資料的合併與篩選
•第四章 敘述統計量
•第五章 均數檢定
第一章編碼與變數檢視
進入SPSS之前的準備工作
1-1數據資料的形式:
矩陣式數據要求每一個橫行代表一筆觀察值,縱列
按變數排列;成為矩陣格式。
編碼
輸入
1-2 編碼的概念:
根據一定的規格將研究資料轉換成可進行統計分析的數碼資料過程
問題5:您以為外勞對於台北市的社會秩序是否有影響?(單選)1□有很大影響 2□有較大影響3□影響很小 4□沒有影響 4
編碼答案
*名稱(Name)設定變數名稱,在資料檢視視窗會呈現var1、var2,可經由變數檢是視窗做更改,但是變數命名有其原則,如下所示:
(1) 變數名第一個字必頇為英文字(a~z),其後面才可以連接數字(0~9)、英文字、句點、@、#、_或$等符號
(2) 變數命名最後一個字絕對不能是句點(3) 變數名稱的長度不可超過8個位元(一個中文字為2位元)(4) 空白字或特殊字元(如 !、?、* )嚴禁使用(5) 每個變數命名必頇唯一性,不能有兩個相同變數名(6) 英文大小寫命名皆相同(7) SPSS的保留字不能當變數名稱,如:ALL NE EQ TO LE
LT BY OR GT GE AND NOT WITH
1-3 變數檢視(Variable View)
在此敲擊滑鼠左鍵,即跳出變數類型的對話框
*類型(Type)
(1) 數字 Numeric:數值型變數,其數值可以正、負號(2) 逗點 Comma:三位一小撇之貨幣符號(3) 點 Dot:其數值前面可有正、負符號當前導字,
並以一個逗號當小數點,其餘逗點當三位一小撇之貨幣符號(4) 科學記號 Scientific notation:變數為數值且以科學記號表現(5) 日期 Date:其有效值可以是日期and/or時間(6) 貨幣 Dollar:變數為金額,包括$符號(7) 自定貨幣 Custom currency:變數為金額,以自定格式顯示(8) 字串 String:可用任何中文或英文字母(9) 字元;可自行設定,但是必頇注意一個中文字母為2位元
在此敲擊滑鼠左鍵,即跳出變數類型的對話框
*寬度(Width)變數資料內容實際位元長度
*小數(Decimal)變數內容的小數位數
【範例】以「性別」這個變數為例Step1:數值(U)空格中鍵入「1」Step2:數值註解(E)空格中鍵入「男性」Step3:點選新增(A)按鈕Step4:數值(U)空格中鍵入「2」Step5:數值註解(E)空格中鍵入「女性」Step6:點選確定後即完成
*註解(Label)變數內容的註解說明,最大為120個位元
*數值(Value)給原始值一個標註,最大為60個位元
*遺漏(Missing)用來定義遺失值,若變數為數值變數,則系統預設為None,表不設定使用遺失值以空白代表
*欄(Columns)編輯視窗中變數顯現出來欄位寬度
*對齊(Align)輸入內容的對齊方式,分為置左對齊、置中對齊、置右對齊,系統預設為置右對齊
第二章資料轉換
2-1 新觀察值的計算
設定目標變數之數值運算式
SPSS
內建函數
計算按鍵台
設定目標變數之名稱
舊有變數
內建函數
算數函數─• ABS():取絕對值• RND():取四捨五入• TRUNC():截去小數位數• MOD(X,Y):將X除以Y後取其餘數• SQRT():開根號• EXP():取自然指數函數• LG10():取以10為底之對數函數• LN():取以EXP(1)為底之對數函數• ARSIN():取反正弦函數• ARTAN():取反正切函數• SIN():取正弦函數• COS():取餘弦函數
統計函數─• SUM():求運算式總和• MEAN():求運算式平均數• SD():求運算式標準差• VARIANCE():求運算式變異數• CFVAR():求運算式變異係數• MIN():求運算值的最小值• MAX():求運算值的最大值
【範例】由於國文成績過低,所以設定原始成績開根號且乘以10之後為最後國文成績
Step2 Step3
Step1:轉換→計算
執行step1~step3出來的結果
2-2 重新編碼-
將已存在的數值變數或短字串變數的值加以重新編碼
Step1:轉換→重新編碼→成不同變數
Step2:把「性別」移至 數值變數(V)->輸出變數框中
Step3:設定輸出之新變數的名稱→變更(C)→舊值與新值(O)
Step4:先勾選 輸出變數為字串(B)→
舊值數值框中鍵入1→新值數值鍵入male→新增(A)
舊值數值框中鍵入2→新值數值鍵入female→新增(A)
→繼續→確定
執行Step1~Step4的結果
• Because the arsenic levels were divided into
three categories, two dummy variables
p=0.001p=0.001p=0.001
第三章 資料的合併與篩選(Merge & Select)
3-1 資料檔之合併(Merge)【範例】兩個資料檔做水平合併
Step1:資料→合併檔案→新增變數
Step2:匯入資料2檔案
Step3:按確定即可。
執行Step1~Step3的結果
3-2資料之篩選(Select)【範例】篩選後只留下性別為男性的觀察值
Step1:資料→選擇觀察值
Step2:點選如果滿足設定條件(C)→若(I)
Step3:把「性別」移至右邊框中並且運算=1,此代表我們只挑選當性別為1時的觀察值
執行Step1~Step3的結果,發現第5、7、10比的觀察值已被暫時刪除,當跑其他分析時並不會讀到這三筆觀察值,換言之,只讀得到「性別」為男性的觀察值
分割檔案
第四章 敘述統計量(Descriptive Statistics)
4-1 次數分配表(Frequencies)目的:求得資料之次數分配表及一些特徵量數,
或繪製資料支圓餅圖、長條圖或直方圖等
點選:分析(A)→描述性統計(E)→次數分配表(F)
次數分配表裡有三個次指令,分別為統計量(S)、圖表(C)、格式(F)
圖表(C):其功能在執行所輸出之統計圖,SPSS提供長條圖(Bar charts)、 圓形圖(Pie
charts)、直方圖(Histograms),其中直方圖還可進一步界定SPSS印出常態分配曲線。而各圖形之呈現方式,可以選擇次數(Frequencies)或百分比(Percentages)
格式(F):其功能在設定輸出報表之格式順序依據(Order by):選擇資料呈現時排序的方式多重變數(Multiple variance):若處理變數有多個時,在列印統計量時,選擇將多格變數列印在同一表中以作比較,或分開列表
4-2 描述性統計量(Descriptive) 目的:可求得資料中之數值變數之敘述統計量
點選:分析(A)→描述性統計(E)→描述性統計量(D)
【範例】計算英文成績的平均數、變異數、偏態係數
Step1:分析(A)→描述性統計(E)→描述性統計量(D)
Step2:將英文成績移至變數(V)框中→點選選項(O)
Step3:點選平均數(M)、變異數(V)、偏態(W)→點選繼續→確定
十個人英文成績平均為49分,變異數為419.111代表成績差異大較分散,偏態係數為-0.15代表這組資料為左偏
敘述 統計
10 49.00 419.111 -.150 .68710
英文成績有效的 N (完全排除)
統計量 統計量 統計量 統計量 標準誤個數 平均數 變異數 偏態
執行Step1~Step3的結果如下表
第五章 均數檢定(Compare Means)
5-1 分群之統計量(Means)
【範例】現在想依「性別」作為分層之依據,求出男女生數學成績之平均數與變異數
Step1:分析(A)→比較平均數法(M)→平均數(M)
Step2:將數學成績移至依變數清單(D),將性別移至自變數清單(D)→點選選項(O)
Step3:將左邊的平均數與變異數移至右邊格統計量(C)框中→繼續→確定
Step1~Step3即出現下表之結果
男性平均為66.14分,女性平均為44.67分,整體來說男性數學成績比女性好,此外,根據變異數可看出男性成績比起女性較為集中
5-2 單一母體平均數檢定(One-Sample T Test)
【範例】檢定國文成績0H :國文平均成績 50
Step1:分析(A)→比較平均數法(M)→單一樣本T檢定(S)
Step2:將國文成績移至檢定變數(T)框中,檢定值(V)框中輸入50→點選選項(O)
Step3:信賴區間設定95%
→繼續→確定
執行Step1~Step3結果如下報表,依據題意得知此題為單尾檢定,判別t值=1.31 0,所以單尾P-Value=1-
2
223.0
=0.8885。在顯著水準95%之下,不拒絕
0H ,國文成績 50
單一 樣本 檢定
1.310 9 .223 9.60 -6.98 26.18國文成績t 自由度 顯著性 (雙尾) 平均差異 下界 上界
差異的 95% 信賴區間檢定值 = 50
5-3 兩獨立母體平均數檢定(Independent-Sample T Test)
【範例】檢定男生與女生數學平均成績相等 0H 21
Step1:分析(A)→比較平均數法(M)→獨立樣本T檢定(T)
Step2:將數學成績移至檢定變數(T)框中,性別移至分組變數(G)框中→點選定義組別(D)
Step3:組別1(1)鍵入1,組別2(2)鍵入2→繼續→確定
執行Step1~Step3之後得到下表由於平均數差異檢定有一個很重要的基本假設─變異數同質性,因此進行T檢定前會先對二組樣本之變異數是否同質進行檢定。下表左半部就是對二組樣本進行同質行性檢定的結果,F值為0.196(P-Value=0.67)不顯著,代表二組樣本變異數相等,於是右半部的報表則看第一列的數據,反之,變異數不相等則看右部第二列的數據。此例題我們看第一列之數據,發現t值之P-Value值不顯著,因此不拒絕,代表男生與女生數學平均相等
0H
獨立 樣本檢 定
.196 .670 1.149 8 .284 21.48 18.69 -21.63 64.581.026 3.097 .378 21.48 20.94 -43.99 86.94
假設變異數相等不假設變異數相等
數學成績F 檢定 顯著性
變異數相等的 Levene 檢定
t 自由度 顯著性 (雙尾) 平均差異 標準誤差異 下界 上界差異的 95% 信賴區間
平均數相等的 t 檢定