Top Banner
Lineare Regression: Tests Statistik (Biol./Pharm./HST) FS 2014
25

Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

Oct 21, 2019

Download

Documents

dariahiddleston
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

Lineare Regression: Tests

Statistik (Biol./Pharm./HST) – FS 2014

TexPoint fonts used in EMF.

Read the TexPoint manual before you delete this box.: AAAAAAAAAA

Page 2: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

Ersatz: Cooper & Shuttle

● 12-Minuten Test nach Cooper (1968)

● 20m-Shuttle-Test nach Leger (1982)

Page 3: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

𝛽0 = −19.46 𝛽1 = 5.86 𝜎 = 5.4

Methode der kleinsten Quadrate

Page 4: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

y = 45

y = -19.46 + 5.86 * 11

𝛽0 = −19.46 𝛽1 = 5.86 𝜎 = 5.4

• Wie genau stimmen Parameter?

• Wie genau stimmt Vorhersage?

Page 5: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

t-Test in der Linearen Regression: 1/2

1. Modell:

Yi = ¯0 + ¯1xi +Ei; E1; : : : ; En iid N (0; ¾2):

2. Nullhypothese: H0 : ¯1 = 0

Alternative: HA : ¯1 6= 0 (Es wird hier Äublicherweise ein zwei-seitiger

Test durchgefÄuhrt)

3. Teststatistik:

T =beobachtet¡ erwartet

geschÄatzter Standardfehler=

^̄1 ¡ 0

cs.e.( ^̄1):

Dabei ist der geschÄatzte Standardfehler

cs.e.( ^̄1) =qdV ar( ^̄1) =

¾̂pPn

i=1(xi ¡ ¹xn)2:

Verteilung der Teststatistik unter H0: T » tn¡2

Page 6: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

t-Test in der Linearen Regression: 2/2

4. Signi¯kanzniveau: ®

5. Verwerfungsbereich fr die Teststatistik:

K = (¡1;¡tn¡2;1¡®2] [ [tn¡2;1¡®

2;1)

6. Testentscheid: ÄUberprÄufe, ob der beobachtete Wert der Teststatistik im

Verwerfungsbereich liegt.

Page 7: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

Lineare Regression in R

6

Modell: 𝑌𝑖 = 𝛽0 + 𝛽1𝑥𝑖 + 𝐸𝑖 , 𝐸𝑖~𝑁 0, 𝜎2 𝑖. 𝑖. 𝑑

Modell: 𝑌𝑖 = −19.46 + 5.86𝑥𝑖 + 𝐸𝑖 , 𝐸𝑖~𝑁 0, 5.432 𝑖. 𝑖. 𝑑

P-Wert:

Angenommen 𝛽1 = 0;

wie wa. ist Beobachtung

oder etwas extremeres?

Beobachtete Teststatistik

im Test 𝐻0: 𝛽1 = 0 vs.

𝐻𝐴: 𝛽1 ≠ 0

Standardfehler von 𝛽1 (= 𝜎 𝛽1 )

Approx. 95%-VI:

5.86 ± 2 ∗ 0.41

Exaktes 95%-VI:

5.86 ± 1.99 ∗ 0.41

Freiheitsgrade: n – (Anz. 𝛽’s) = 91 – 2 = 89

𝑡89;0.975

Page 8: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)
Page 9: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

approx. 95%-VI: [-29; -10]

approx. 95%-VI: [5.0; 6.7]

Page 10: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

45

Page 11: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

45

95% Vertrauensintervall: [43.8; 46.2]

Für den Erwartungswert von

VO2max bei vmax=11

Page 12: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

45

95% Vorhersageintervall: [34; 56]

Für eine Einzelbeobachtung

von VO2max bei vmax=11

Page 13: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

“Essentially,

all models are

wrong,

but some are

useful.“

George E.P. Box

Page 14: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

Residuenanalyse: Wie gut stimmt das Modell ?

13

𝑌𝑖 = 𝛽0 + 𝛽1𝑥𝑖 + 𝜀𝑖 ; 𝜀𝑖 ~ 𝑁 0, 𝜎2 𝑖𝑖𝑑

• Form des funktionellen Zusammenhangs

• Varianz der Fehler ist konstant

• Fehler sind normalverteilt

Einfache Regression:

Streudiagramm

Multiple Regression:

Tukey-Anscombe Plot

QQ-Plot der

Residuen

Page 15: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

Streudiagramm bei einfacher linearer Regression

14

0.0 0.5 1.0 1.5 2.0 2.5 3.0

24

68

10

12

x

y OK

Page 16: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

Streudiagramm bei einfacher linearer Regression

15

Systematischer Fehler

Krümmung:

𝑦 = 𝑏0 + 𝑏1𝑥 + 𝑏2𝑥2

0.0 0.5 1.0 1.5 2.0 2.5 3.0

05

10

15

20

25

30

x

y

Page 17: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

Streudiagramm bei einfacher linearer Regression

16

Fehlervarianz

nicht konstant

0.0 0.5 1.0 1.5 2.0 2.5 3.0

01

02

03

0

x

y

Page 18: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

Beispiel für guten Tukey-Anscombe Plot

17

Page 19: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

Beispiele für schlechte Tukey-Anscombe Plots

18

Systematischer

Fehler Fehlervarianz nicht konstant

Page 20: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

Residuenanalyse: QQ-Plot

19

S-Form

Krümmung

OK

Gerade

Gerade = “gut”

Krümmung = “schlecht”

Page 21: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

QQ-Plots: Streuung von “guten” QQ-Plots

(𝒏 = 𝟑𝟎, 𝑹𝒊~𝑵 𝟎, 𝟏 )

20

Page 22: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

Falls Residuenplots schlecht

Oft helfen Transformationen von x oder y

Achtung: Vorsicht beim Interpretieren der neuen Parameter

Bsp: log 𝑦 statt 𝑦

Vorher: 𝑌𝑖 = 𝛽0 + 𝛽1𝑥𝑖 + 𝜀𝑖 Wenn x durch x+1 ersetzt wird, ändert sich 𝑌 im Mittel zu

𝑌 + 𝛽1

Nachher:

log 𝑌𝑖 = 𝛽0 + 𝛽1𝑥𝑖 + 𝜀𝑖 ↔ 𝑌𝑖 = exp (𝛽0 + 𝛽1𝑥𝑖 + 𝜀𝑖) Wenn x durch x+1 erstetzt wird, ändert sich 𝑌 “im Mittel” zu

𝑌 ∗ exp (𝛽1)

21

Page 23: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

Bsp: Ohne Log-Transformation

22

OK

log 𝑦

𝑦

Page 24: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

Residuenanalyse: Supermarkt

23

OK OK

Page 25: Lineare Regression: Tests - ETH Zurich · Ersatz: Cooper & Shuttle 12-Minuten Test nach Cooper (1968) 20m-Shuttle-Test nach Leger (1982)

Residuenanalyse: Beep-Test

24

OK OK