CHAPTER 15 CHAPTER 15 簡簡簡簡簡簡簡簡簡 簡簡簡簡簡簡簡簡簡 簡簡簡簡簡 STATISTICS FOR MANAGEMENT AND ECONOMICS
Jan 29, 2016
CHAPTER 15CHAPTER 15簡單線性迴歸及相關簡單線性迴歸及相關
基礎統計學STATISTICS FOR MANAGEMENT
AND ECONOMICS
目錄目錄15.1 導 論15.2 建立迴歸模型15.3 估計迴歸係數15.4 迴歸模型的假設條件15.5 評價迴歸模型15.6 利用迴歸模型進行預測15.7 公式彙整
15.115.1 導 論導 論 應用 1 某兒童早餐穀片的產品經理想預測下年度穀片的需求量,為了採用迴歸分析,她和幕僚們列出了以下所有可能影響銷售量的變數:1. 產品價格。 2. 5 到 12 歲兒童的總人口數 ( 目標市場 ) 。 3. 競爭產品的價格。 4. 廣告曝光率。 5. 今年的銷售量。 6. 去年的銷售量。
15.115.1 導 論導 論應用 2 某投機者正考慮大筆買進黃金,他將採用迴歸分析來預測未來兩年的黃金價格。在進行分析之前,他列出了以下的自變數: 1. 市場利率。 2. 通貨膨脹率。 3. 原油價格。 4. 金飾的需求量。 5. 工業及商業用黃金的需求量。 6. 道瓊工業指數的平均值。
15.115.1 導 論導 論應用 3 某不動產代理商想要更精確預測房屋的銷售價格。她深信以下變數將影響房屋售價: 1. 面積大小。 2. 房間的數量。 3. 房屋方位座向。 4. 屋況。 5. 座落的區段。
15.215.2 建立迴歸模型建立迴歸模型
1515 .3.3 估計迴歸係數估計迴歸係數
1515 .3.3 估計迴歸係數估計迴歸係數
例題例題 15.115.1
工作年資與年終獎金之間有何關聯?隨機抽取甲公司六名員工並記錄他們的工作年資與年終獎金 ( 單位: 1,000 美元 ) 列示如下:
請分析工作年資與年終獎金之間有何關聯?
例題例題 15.115.1解 答計算共變數及 x 的變異數,
1 1
1
2
2
12
1
2
11
(21)(50)1 7.42126 1 6
11
(21)1 3.5916 1 6
n n
i inxy i i
i i
i
n
inx ii
i
x ys
n x yn
xs
n xn
接著導出樣本迴歸係數。 1 2
0 1
7.4 2.1143.5
21 3.56
50 8.3336
8.333 (2.114)(3.5) 0.934
xy
x
i
i
sb
s
xx
n
yy n
b b xy
例題例題 15.115.1
例題例題 15.115.1
例題例題 15.215.2福特二手車價格與累積里程數 北美洲的汽車經銷商賣出新車時,經常參考藍皮書 (Blue Book) 來決定顧客抵購舊車的價格。每月出刊的藍皮書詳載各汽車廠牌重要車款二手車的交易價格,每款車會因為車況及配備不同而有不同的建議價格。這些價格乃源自於近期二手車拍賣市場買方的平均買價。但是藍皮書中並未指出累積里程數如何影響價格,雖然累積里程數是評鑑二手車的一個極重要因素。為了探討這個議題,某二手車經銷商隨機自前一月二手車拍賣市場中抽取 100輛三年舊的福特 Tauruses ,每輛車都是在最佳狀況且配有自動排檔、 AM/FM 錄音帶播放匣及冷氣設備。經銷商記錄了售價 ( 單位為 1,000 美元 ) 與累積里程數 ( 單位為 1,000哩 ) ,所有資料被儲存在 XM15-02 的檔案中,部分資料如下,經銷商想找出兩變數之迴歸模型。
例題例題 15.215.2
例題例題 15.215.2解 答 本題核心在研究兩區間變數之間的關係。累積里程數普遍被認為會影響二手車的價格,因此設定價格為依變數 y ,累積里程數為自變數 x。從樣本資料可計算下列各式:
1
1
1
2
1
3,601.1
1,484.1
53,155.9
133,986.59
n
i
i
n
i
i
n
i i
i
n
i
i
x
y
x y
x
計算共變數及 x 的變異數,
1 1
1
2
2
12
1
2
11
(3,601.1)(1,484.1)1 2.90953,155.9100 1 100
11
(3,601.1)1 43.509133,986.59100 1 100
n n
i inxy i i
i i
i
n
inx ii
i
x ys
n x yn
xs
n xn
接著導出樣本迴歸係數。
1 22.909 0.0669
43.509
3,601.136.011
100
1,484.114.841
100
xy
x
i
i
sb
s
xx
n
yy n
0 1 14.841 ( 0.0669)(36.011) 17.250b b xy
最後找出樣本迴歸線, 17.250 0.0669y x
解釋迴歸模型 斜率係數 b1 為 0.0669 ,表示每增加 1,000
哩的累積里程,車價平均減少 66.9 美元。換言之,累積里程每額外增加 1哩,車價平均降低 0.0669 美元。 截距 b0 為 17.250 ,表示在 x = 0 時,也就是車子根本還沒開始上路,售價為 17,250 美元。然而,在這個例題,這種解釋是沒有意義的,因為在我們的樣本中,累積里程數 x 是介於 19.1 和 49.2 之間,並沒有任何車的累積哩程為 0 ,只要 x 值不在樣本 x 的範圍內,就不能準確地解釋 y 的值。 解釋迴歸係數時,必須謹記在心,這些解釋僅適用於樣本,也就是這 100個觀測值。如果要推論到整個母體,一定得循著較嚴謹的統計推論方法。
15.415.4 迴歸模型的假設條件迴歸模型的假設條件
15.415.4 迴歸模型的假設條件迴歸模型的假設條件
對所有 x 值而言, y都是屬於常態分配且具有相同的標準差。
15.515.5 評價迴歸模型評價迴歸模型檢定回歸直線的斜率 (β1)計算判定係數 (R2)檢定相關係數 (ρ)
15.5.115.5.1 檢定直線斜率檢定直線斜率
15.5.215.5.2 11 的估 計值與抽樣分配的估 計值與抽樣分配
檢定回歸直線的斜率 β1
H0: β1=0
H1: β1≠0
15.5.215.5.2 11 的估 計值與抽樣分配的估 計值與抽樣分配
例題例題 15.315.3福特二手車的價格與累積里程數相關嗎?檢定斜率係數請檢定斜率係數,以確定是否有足夠的證據認定例題 15.2 中價格與累積里程數有線性關係。顯著水準為 5% 。
解 答在例題 15.2 ,已得到下列各值:
1
2
0.0669
43.509
x
b
s
例題例題 15.315.3
1 2
0.3265 0.00497(99)(43.509)( 1)
b
x
ssn s
1
1 1 0.669 0 13.440.00497
b
bt
s
/ 2, 0.025, 98 1.984 t t t
/ 2, 0.025, 98 1.984 t t t
拒絕域為,
或
因此,否決虛無假設 (H0: β1=0)
15.5.3 15.5.3 判定係數判定係數
15.5.3 15.5.3 判定係數判定係數
例題例題 15.415.4
測量福特 Tauruses 二手車售價與累計里程數線性關係的強度
請根據例題 15.2 計算判定係數並敘述該統計量所代表的涵義。
例題例題 15.415.4
解 答在例題 15.2 中,已有下列資料:
在例題 15.3 中,也已算得下式:
2
2.909
43.509
xy
x
s
s
2 0.3000ys
例題例題 15.415.4
所以,
R2為 0.6483,這個結果說明了 64.83% 的售價總變異可用累計里程數的變異來解釋,剩下的 35.17% 則是不可解釋的。
2 22
2 2
( 2.909)0.6483
(43.509)(0.3000) xy
x y
sR
s s
15.5.515.5.5 檢定相關係數檢定相關係數 ρρ
母體的相關係數 (population coefficient of correlation) ,因為 經常是未知的母體參數,必須由樣本資料來估計它的值,樣本相關係數 (sample coefficient of correlation) 的公式如下:
15.5.515.5.5 檢定相關係數檢定相關係數 ρρ
檢定統計量為下式:
0
1
: 0
: 0
H
H
例題例題 15.515.5
福特 Tauruses 二手車售價與累積里程數是否線性相關?
解 答在前面例題中,已經算出 Sxy=-2.909,
, 2 43.509xs 2 0.3000ys
43.509 6.596
0.3000 0.5477
x
y
s
s
例題例題 15.515.5
相關係數為,
T檢定統計量為:
拒絕域為, 或
2.909 0.8052(6.596)(0.5477)
xy
x y
sr
s s
2 22 100 20.8052 13.44
1 1 ( 0.8052)nt r
r
/ 2, 0.025, 98 1.984t t t / 2, 0.025, 98 1.984t t t
15.615.6 利用迴歸模型進行預測利用迴歸模型進行預測在對依變數進行預測區間時,又可分為兩種:第一種是預測依變數的平均數;第二種是預測個別的依變數。
15.6.115.6.1 在已知在已知 xx 下,預測個別依變數下,預測個別依變數 yy
15.6.2 在已知 x 下,預測依變數 y 的平均數
例題例題 15.615.6
預測福特 Tauruses 的個別售價與售價的平均值
1. 某二手車經銷商正要去標購一輛三年舊的福特 Tauruses ,配有自動排檔、 AM/FM錄音帶播放匣及冷氣設備,且累積里程數有 40,000哩 (xg=40) ,為了決定他該以多少價格搶標,經銷商需要預估該二手車的售價。
例題例題 15.615.6
2.第 1點中的二手車經銷商有機會參與標購由一家租車公司所提供的一些福特Tauruses 舊車,那家租車公司有 250輛福特 Tauruses ,全配有自動排檔、 AM/FM錄音帶播放匣及冷氣設備,且累積里程數均為 40,000哩 (xg=40) ,經銷商想要預估這批二手車的平均售價。
例題例題 15.615.6
解 答 1. 經銷商想預測單一汽車的售價,所以他必須採用預測區間的公式,從前面的例題中,已經有下列資料:
2
17.250 0.0669(40) 14.574
0.3265
43.509
36.011
x
y
s
s
x
例題例題 15.615.6
從附錄可查得:
在 95% 的信賴水準下,信賴區間為:/ 2 0.025, 98 0.025,100 1.984t t t
例題例題 15.615.6
2. 經銷商想預測一整批汽車的平均售價,所以他必須採用的 E(y|x=xg) 的信賴區間公式。在 95% 的信賴水準下,平均售價的預測信賴區間為:
2
/ 2, 2 2
2
( )1( 1)
(40 36.011)114.574 1.984 0.3265100 (100 1)(43.509)
14.574 0.076
gn
x
x xt sy
n n s
15.715.7 公式彙整公式彙整迴歸係數之最小平方估計式
誤差平方和
1 2
0 1
xy
x
sb
s
b b xy
2
1
( )n
i ii
SSE y y
15.715.7 公式彙整公式彙整估計值的標準誤
β1的檢定統計量
b1的估計標準差
2SSEsn
1
1 1
b
bt
s
1 2( 1)b
x
ssn s
15.715.7 公式彙整公式彙整判定係數
個別依變數的預測區間
22
2 2 21
( )xy
x y i
s SSERs s y y
2
/ 2, 2 2
( )11( 1)
gn
x
xxy t s
n n s
15.715.7 公式彙整公式彙整依變數平均數的信賴區間
樣本的相關係數
檢定 ρ=0之 t檢定統計量
2
/ 2, 2 2
( )1( 1)
gn
x
xxy t s
n n s
xy
x y
sr
s s
22
1nt r
r