Top Banner
Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018
13

Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Mar 01, 2019

Download

Documents

Ngo Ngo
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Korelacja i regresja liniowa

Agnieszka Mensfelt

14 maja 2018

Page 2: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Analiza zależności zmiennych ilościowych

50

100

150

200

120 150 180 210 240wzrost [cm]

wag

a [k

g]

Page 3: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Kowariancja

Kowariancja zmiennych losowych

var(X ) = E [(X − µ)2]

cov(X ,Y ) = E [(X − µx)(Y − µy )]

cov(X ,X ) =?

Estymator kowariancji

sXY =1

n − 1

n∑i=1

(Xi − X )(Yi − Y )

Kowariancja a niezależność zmiennych

E [(X − µx)(Y − µy )] = E [XY − XµY − YµX − µXµY ]

= E [XY ]− E [XµY ]− E [YµX ] + µXµY = E [XY ]− µXµY

Page 4: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Współczynnik korelacji liniowej Pearsona

Korelacja zmiennych losowych

ρ =cov(X ,Y )

σXσY

Estymator współczynnika korelacji

r =

∑ni=1(Xi − X )(Yi − Y )√

(∑n

i=1(Xi − X )2)(∑n

i=1(Yi − Y )2)

Page 5: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Przykład

Page 6: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Przykład

-1 0.8

-0.7 0

Page 7: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Test na istotność współczynnika korelacji

Układ hipotez:H0 : ρ = 0H1 : ρ > / 6= / < 0

Statystyka:

t =r√1− r2

√n − 2 ∼ t(n − 2)

Page 8: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Prosta regresja liniowa

0

2

4

6

0 2 4 6x

y

Page 9: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Prosta regresja liniowa

Y = Y + εY = β0 + β1X + ε

0

2

4

6

0 2 4 6x

y

β0}

{

{ β1

1

Page 10: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Prosta regresja liniowa

Założenia:

Zależność liniowa między X i Y

Wartości zmiennej niezależnej X są ustalone

ε ∼ N(0, σ2)

Page 11: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Metoda najmniejszych kwadratów

Y = b0 + b1X + eY = b0 + b1Xei = yi − yi

0

2

4

6

0 2 4 6x

y{

e2

y2

y2

Page 12: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Metoda najmniejszych kwadratów

Suma kwadratów rezyduów

n∑i=1

e2i =n∑

i=1

(yi − yi )2

=n∑

i=1

(yi − (b1xi + b0))2

Współczynnik kierunkowy i wyraz wolny

b1 =cov(X ,Y )

s2(X )= r

sYsX

b0 = y − b1x

prosta regresji przechodzi przez (x , y)znak(b1) = znak(r)

Page 13: Korelacja i regresja liniowa - cs.put.poznan.pl · Korelacja i regresja liniowa Agnieszka Mensfelt 14 maja 2018. Analiza zależności zmiennych ilościowych 50 100 150 200 ... Współczynnik

Kwartet Anscombe’a

Źródło:https://en.wikipedia.org/wiki/Anscombe%27s_quartet