Top Banner
สสสสสสสสสสสสสสสสสสส สสสสสสสสสสสสสสสสสสส Simple Linear Simple Linear Regression Regression สสสสสสสสสสสสสสสสสสสสสส สสสสสสสสส สสสสสสสสสสสสสสสสสสสสสสสสสสสสสสส สสสสสสสสสสสสสสสสสส ส.สสสสสสส
29

สมการถดถอยอย่างง่าย Simple Linear Regression

Jan 20, 2016

Download

Documents

Santa

สมการถดถอยอย่างง่าย Simple Linear Regression. ผู้ช่วยศาสตราจารย์นิคม ถนอมเสียง ภาควิชาชีวสถิติและประชากรศาสตร์ คณะสาธารณสุขศาสตร์ ม.ขอนแก่น. สมการถดถอยอย่างง่าย : Simple Linear Regression ใช้วิธีการทางสถิตินี้เมื่อไร ? ให้พิจารณาดูจากคำถามต่อไปนี้ - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: สมการถดถอยอย่างง่าย  Simple Linear Regression

สมการถดถอยอยางงาย สมการถดถอยอยางงายSimple Linear Simple Linear

RegressionRegression

ผ �ชวยศาสตราจารย�น�คม ถนอมเส�ยง ภาคว�ชาช�วสถ�ต�และประชากรศาสตร�

คณะสาธารณส!ขศาสตร� ม.ขอนแกน

Page 2: สมการถดถอยอย่างง่าย  Simple Linear Regression

สมการถดถอยอยางงายสมการถดถอยอยางงาย : : Simple Linear RegressionSimple Linear Regressionใช�ว�ธ�การทางสถ�ต�น�&เม'(อไร ? ให�พ�จารณาด จากค,าถามตอไปน�&•ระด-บไขม-นในเล'อดม�ความส-มพ-นธ�ก-บความด-นโลห�ต หร'อไม และสามารถท,านายความด-นโลห�ต ได�หร'อไม ?•จ,านวนคร-&งของการล�างหน�าม�ความส-มพ-นธ�ก-บ การเก�ดเม0ดส�วบนใบหน�าหร'อไม และสามารถท,านาย การเก�ดเม0ดส�วบนใบหน�าได�หร'อไม ?

Page 3: สมการถดถอยอย่างง่าย  Simple Linear Regression

สมการถดถอยอยางงายสมการถดถอยอยางงาย : : ว-ตถ!ประสงค�ว-ตถ!ประสงค�• เพ'(ออธ�บายความส-มพ-นธ�ระหวาง 2 ต-วแปร

•เพ'(อใช�ในการท,านายSystolic BPSystolic BPCHOL

Systolic BPSystolic BPCHOL

Page 4: สมการถดถอยอย่างง่าย  Simple Linear Regression

ระด-บ CHOLESTEROL (CHOL) จะท,านาย

Systolic BP ได� อยางไร ?Systolic BPSystolic BPCHOL

Systolic BPSystolic BPCHOL

Systolic BPSystolic BPCHOL

Page 5: สมการถดถอยอย่างง่าย  Simple Linear Regression

น-กว�จ-ยกล!มหน1(งศ1กษาข�อม ลผ �มาตรวจท�(โรงพยาบาล

จ,านวน 7 ราย ข�อม ลปรากฏตามตาราง

idno=คนท�(, chol=ระด-บไขม-นในเล'อด , sysbp = ความด-นโลห�ตแบบ systolic

Page 6: สมการถดถอยอย่างง่าย  Simple Linear Regression

ว�ธ�ท�(ตรวจสอบงายๆ ค'อการฟล0อตก ราฟแสดงความส-มพ-นธ�ระหวาง ระด-บ

ไขม-นในเล'อดและความด-นโลห�ตชน�ดSystolic เร�ยกกราฟน�&วา“Scatter PlotScatter Plot”

Page 7: สมการถดถอยอย่างง่าย  Simple Linear Regression

จากการฟล0อตกราฟ ถ�าหาร ปแบบ แสดงความส-มพ-นธ�ระหวาง 2

ต-วแปร ก0สามารถท,านายได� ท,า อยางไร ?

แนวค�ดท�( แนวค�ดท�(11 ใช�คาเฉล�(ยได�หร'อไม เม'(อ

143.4286X

xy

Page 8: สมการถดถอยอย่างง่าย  Simple Linear Regression

ต-วอยางต-วอยาง ระด-บไขม-นในเล'อดเป7นเทาไร ก0ตาม ท,านายวา

คาความด-นโลห�ตโลห�ตSystolic เทาก-บคาเฉล�(ย ด-งน-&น: สมการค'อ y= 143.4286

การใช�คาเฉล�(ยท,าให�ข�อม ลเบ�(ยงเบนจากคาท,านายส ง

143.4286X

Page 9: สมการถดถอยอย่างง่าย  Simple Linear Regression

แนวค�ดท�( แนวค�ดท�(22 ถ�าสร�างสมการแสดงความ ส-มพ-นธ�เช�งเส�น

ระหวาง 2 ต-วแปร จากสมการเส�นตรงด-งน�&

= คาต-วแปรตามa = คาคงท�(หร'อจ!ดต-ดบนแกน y (intercept) b = คาความช-น (slope) หร'อส-มประส�ทธ�8 (coefficient)x = คาต-วแปรอ�สระ

ii bxay

y

Page 10: สมการถดถอยอย่างง่าย  Simple Linear Regression

สมการ เร�ยกวาสมการ สมการ เร�ยกวาสมการถดถอยถดถอยค,านวณคาค,านวณคา a = คาคงท�(หร'อจ!ดต-ดบน

แกน y หร'อ b = คาความช-นหร'อ

ส-มประส�ทธ�8 อยางไร ?

หล-กการค,านวณหล-กการค,านวณ ค'อท,าให�ระยะหาง ระหวางจ!ดก-บเส�นตรงน�อยท�(ส!ด ว�ธ�

การน�&เร�ยกวา “ ” ก,าล-งสองน�อยท�(ส!ด(Least Square)

ii bxay

Page 11: สมการถดถอยอย่างง่าย  Simple Linear Regression

ว�ธ�ก,าล-งสองน�อยท�(ส!ดว�ธ�ก,าล-งสองน�อยท�(ส!ด: ค'อการท,าให�ผลรวมก,าล-งสอง ของความคลาดเคล'(อนของแตละคาส-งเกต y ก-บคาท�(

อย บนสมการเส�นตรง y

} ie

Page 12: สมการถดถอยอย่างง่าย  Simple Linear Regression

ว�ธ�ค,านวณว�ธ�ค,านวณ: a, b ท,าได�ด-งน�& xb-ya

n

)x(x

n

)y)(x(yx

b2

i2i

iiii

xx

xy

S

Sb

xงของเบนกำ�ล�งสอส วนเบ��ยง xyงของเบนกำ�ล�งสอส วนเบ��ยง

b

Page 13: สมการถดถอยอย่างง่าย  Simple Linear Regression

ต-วอยางต-วอยาง: จากข�อม ล ระด-บไขม-นใน เล'อดและระด-บความด-นโลห�ต

Systolic

2x xy 2y x y

Page 14: สมการถดถอยอย่างง่าย  Simple Linear Regression

7143.2476

1923y 4286.143

61004

x

3115713.7/)1923(569829

7/)1004)(1923(2887602

b

83548.54

ii x54.83548y 3115713.ˆ

สมการถดถอยค'อสมการถดถอยค'อ

(143.4256)(.3115713)-247.7143a

Page 15: สมการถดถอยอย่างง่าย  Simple Linear Regression

การแปรความหมายจากสมการการแปรความหมายจากสมการถดถอยถดถอย

เม'(อคาไขม-นในเล'อดเปล�(ยนไป เม'(อคาไขม-นในเล'อดเปล�(ยนไป 1 1หนวยท,าให�หนวยท,าให�

คาความด-นโลห�ตส งข1&นเทาก-บ คาความด-นโลห�ตส งข1&นเทาก-บ 3115713. 3115713. หนวยหนวย

ii x54.83548y 3115713.ˆ

Page 16: สมการถดถอยอย่างง่าย  Simple Linear Regression

การประเม�นสมการถดถอยการประเม�นสมการถดถอย พ�จารณาจากคา coefficient of

determination คาของ coeffic ient of determination

ค,านวณจาก

n

1i)Yi(Y

n

1i

2)YiY(2r

ˆ

yy

xx22

SS

br หร'อหร'อ

r2 ม�คา -0 1 r2 ใกล� 1 สมการถดถอยสามารถอธ�บาย การเปล�(ยนแปลงต-วแปรตามได�มาก

Page 17: สมการถดถอยอย่างง่าย  Simple Linear Regression

}}

{ด�เบนอธ�บยไส วนเบ��ยง

)YiY( ˆ

ด�อธ�บยไม ไเบนส วนเบ��ยง

)Yi(Y ˆ

)Yi(Y เบนท��งหมดส วนเบ��ยง

สวนเบ�(ยงเบน สวนเบ�(ยงเบน (( ท-&งหมด ท�(อธ�บายได� ท-&งหมด ท�(อธ�บายได�//อธ�บายไมได�อธ�บายไมได�))

Page 18: สมการถดถอยอย่างง่าย  Simple Linear Regression

ต-วอยางต-วอยาง:: ค,านวณค า coefficient of

determination ด-งน�&

7

1004148994

7

1929569829

3115713.S

Sbr

2

2

2

yy

xx22

8081 r 2

แสดงวาแสดงวา: : สมการถดถอยอธ�บาย ความส-มพ-นธ�ของความด-นโลห�ต

Systolic ก-บระด-บไขม-นในเล'อดได�8081. %

Page 19: สมการถดถอยอย่างง่าย  Simple Linear Regression

bS

Bbt

xx

2y/x

b S

SS

2n

)(SbSS xx

2yy2

y/x

การทดสอบความส-มพ-นธ�เช�งเส�นการทดสอบความส-มพ-นธ�เช�งเส�น ระหวาง ระหวาง 2 2 ต-วแปรต-วแปร

สถ�ต�ใช�ทดสอบได�แก, d.f.=n-2

เม'(อ

n

2)ix(2ixxxS

n

2)iy(2iyyyS

Page 20: สมการถดถอยอย่างง่าย  Simple Linear Regression

การทดสอบสมม!ต�ฐานการทดสอบสมม!ต�ฐาน:: จากต-วอยางการทดสอบ ม�ข-&นตอนด-งน�&

1. 1. ต-&งสมม!ต�ฐานต-&งสมม!ต�ฐานH0: ระด-บไขม-นในเล'อดและระด-บความด-นโลห�ต ไมม�ความส-มพ-นธ�เช�งเส�นตอก-น(B=0)HA: ระด-บไขม-นในเล'อดและระด-บความด-นโลห�ต ม�ความส-มพ-นธ�เช�งเส�นตอก-น(B 0)2. 2. ก,าหนดระด-บน-ยส,าค-ญ ก,าหนดระด-บน-ยส,าค-ญ 0.050.05

Page 21: สมการถดถอยอย่างง่าย  Simple Linear Regression

3. 3. ค,านวณคาทางสถ�ต�ค,านวณคาทางสถ�ต�

bS

Bbt

7

1004148994S

2

yy

7

1929569829S

2

xx

741553.42852-7

57)(41553.428.3115713-64991.71428

S

2

b

589.4.0678983

0-.3115713t

Page 22: สมการถดถอยอย่างง่าย  Simple Linear Regression

4. 4. ต-ดส�นใจต-ดส�นใจ//สร!ปผลสร!ปผล น,าคา t=4.589 และ d.f. = n-2

= 5 เป<ดตาราง t ได� p-value = 0.005

สร!ปได�วาสร!ปได�วา: : ระด-บไขม-นในเล'อดและระด-บความด-น โลห�ตม�ความ

ส-มพ-นธ�เช�งเส�นตอก-น อยางม�น-ยส,าค-ญทางสถ�ต�อยางม�น-ยส,าค-ญทางสถ�ต� (p-value <0.0005)(p-value <0.0005)

Page 23: สมการถดถอยอย่างง่าย  Simple Linear Regression

การค,านวณชวงเช'(อม-(นของ การค,านวณชวงเช'(อม-(นของ B :B :ค,านวณจาก

จากต-วอยางค,านวณ95% ชวงเช'(อม-(นของ B เม'(อ b=.3115713

= = . 1370331 4861096, .

bS2)-n,

2(

tb

).0678983(571.2.3115713

Page 24: สมการถดถอยอย่างง่าย  Simple Linear Regression

การใช�สมการถดถอยในการประมาณการใช�สมการถดถอยในการประมาณคาคาก . ประมาณคาต-วแปรตาม น,าคาX0 ไปแทน

ในสมการ

ต-วอยางต-วอยาง: ถ�า X0 = 200

= 12014975

y

ii bxay

)200(3115713.83548.57y i

Page 25: สมการถดถอยอย่างง่าย  Simple Linear Regression

ชวงเช'(อม-(นของ ท�( ชวงเช'(อม-(นของ ท�( X = X = X0 ค,านวณจากส ตรค,านวณจากส ตร

ต-วอยางต-วอยาง: : ค,านวณ ค,านวณ9595% CI % CI ของ ของ

y

xxS

2)X0(X)

n

1(1y/xS

2)-n,2

α(

ty

200x ท�� y 0 ˆ

741553.4285

2)4286.143(200

7

1(1)191.5689(571.2120.14975

Page 26: สมการถดถอยอย่างง่าย  Simple Linear Regression

การประมาณคาเฉล�(ยของต-วแปรการประมาณคาเฉล�(ยของต-วแปร ตาม ตาม

ท�(คาของต-วแปรท�(คาของต-วแปร X0 ค,านวณโดยค,านวณโดยแทนคาแทนคา X0 ในสมการ

และ ชวงเช'(อม-(นของ และ ชวงเช'(อม-(นของค,านวณจากค,านวณจาก

y/xμ

ii bxay

y/xμ

xxS

2)X0(X

n

1(y/xS

2)-n,2

α(

ty

Page 27: สมการถดถอยอย่างง่าย  Simple Linear Regression

ข�อก,าหนด ข�อก,าหนด (Assumption)(Assumption)1. ท�(แตละคาของ X ต-วแปร Y ม�การแจกแจง แบบปกต�

2. ท�(แตละคาของ Y ต-วแปร X ม�การแจกแจง แบบปกต�

3. ความแปรปรวนของต-วแปรตามY ม�คาเทาก-นท�( แตละคาของ X4. คาเฉล�( ยของต-วแปรตาม Y ท�(

แตละคาของต-วแปร X อย บนเส�นตรงเด�ยวก-น

BXAy/xμ

Page 28: สมการถดถอยอย่างง่าย  Simple Linear Regression

ข�อก,าหนด ข�อก,าหนด (Assumption)(Assumption)-Normality พ�จารณาจาก

residual iiiii bxay;yye ˆˆ

Page 29: สมการถดถอยอย่างง่าย  Simple Linear Regression

. regress sysbp chol

Source | SS df MS Number of obs = 7---------+------------------------------ F( 1, 5) = 21.06 Model | 4033.86954 1 4033.86954 Prob > F = 0.0059Residual | 957.844744 5 191.568949 R-squared = 0.8081---------+------------------------------ Adj R-squared = 0.7697 Total | 4991.71429 6 831.952381 Root MSE = 13.841

------------------------------------------------------------------------------ sysbp | Coef. Std. Err. t P>|t| [95% Conf. Interval]---------+-------------------------------------------------------------------- chol | .3115713 .0678983 4.589 0.006 .1370331 .4861096 _cons | 57.83548 19.37235 2.985 0.031 8.037256 107.6337------------------------------------------------------------------------------