Prof Dr. Levent ŞENYAY XI - İstatistik II 1 11 REGRESYON VE KORELASYON ANALİZİ 11.1. Doğrusal İlişkiler 11.2. Yalın (basit) Regresyon 11.2.1. En Küçük Kareler Metodu a) Normal Denklemlerin Çözümü b) Determinant metodu c) Orjin Kaydırma 11.2.2. Regresyonun Standart Sapması 11.2.3. Regresyonun Duyarlılığı 11.2.4. Regresyon ile Tahmin 11.2.5. Belirleme Katsayısı 11.3. Korelasyon 11.4. Çoklu Regresyon Modelleri
23
Embed
REGRESYON VE KORELASYON ANALİZİ - DEUkisi.deu.edu.tr/levent.senyay/istatistik II/11 regresyon.pdf · 11.2. YALIN (BASİT) REGRESYON Yalın regresyon ile açıklanmaya çalıılan
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Prof Dr. Levent ŞENYAY XI - İstatistik II
1
11
REGRESYON
VE
KORELASYON
ANALİZİ
11.1. Doğrusal İlişkiler
11.2. Yalın (basit) Regresyon
11.2.1. En Küçük Kareler Metodu
a) Normal Denklemlerin Çözümü
b) Determinant metodu
c) Orjin Kaydırma
11.2.2. Regresyonun Standart Sapması
11.2.3. Regresyonun Duyarlılığı
11.2.4. Regresyon ile Tahmin
11.2.5. Belirleme Katsayısı
11.3. Korelasyon
11.4. Çoklu Regresyon Modelleri
Prof Dr. Levent ŞENYAY XI - İstatistik II
2
11.1. Doğrusal İlişkiler:
2
0 1 2
1,2,...,
( )
i i i iy x x
i n
y f x
şeklinde belirtilen herhangi bir modelde y’ler bağımlı (dependent) ve x’ler ise bağımsız
(independent) değişken olarak adlandırılır. Böyle bir modelde 0 , 1 ve 2 ise
parametrelerdir.Değişkenler arasındaki ilişkiler çok çeşitli olabilir. İlişkileri doğrusal ya da
doğrusal olmamasına göre iki ana başlık altında toplamak yerinde olur. Değişkenler
açısından doğrusal bir ilişkide değişkenler toplamsal halde bulunmalıdır. Aksi, çarpım ya da
bölüm halinde bulunan modellere doğrusal olmayan model denir.Örneğin;
0 1i i iy x veya 0 1 1 2 2i i i iy x x modelleri doğrusaldır.
2
0 1 2i i i iy x x modeli ise değişkenler açısından doğrusal değildir.
Bu ilişkilerden başkaları;
i) Eğrisel ilişki
y = 0 + 1 x2 gibi
ii) Logaritmalı ilişki
y =logx
iii) Katlı ortak doğrusal (multicollinearity) ilişki
y = 0 + 1 x + 2 z
iv) Gecikmiş (lag) ilişki
ty = 0 + 1 xt-1
şeklinde belirlenebilir. Bu doğrusal olmayan modellerin bazıları bir takım transformasyonlar
aracılığı ile doğrusal hale getirilebilir, bazıları ise doğrusal hale getirilemezler.
Böyle bir ilişkide x’ler birer şans değişkeni değildir. Bağımlı değişken y’ler ise birer
şans değişkenidir. Ancak bağımsız değişkenler kendi aralarında da birbirilerinden tamamen
bağımsız olmayabilirler.Örneğin;
y
x1
x2
Prof Dr. Levent ŞENYAY XI - İstatistik II
3
x1 ve x2 direk olarak y ile ilişkili olabilir ve y’yi açıklamayı çalışırlar ancak x1 ve x2
kendi aralarında da bir ilişki içerisinde olabilir. Bu durum aslında istenmeyen bir
haldir.Çünkü y’yi açıklamada x1 ve x2 arasındaki ilişkiden dolayı daha az bilgi verirler .
Bağımsız değişken bazen kesikli de olabilir .Hatta tek bir bağımsız değişken dahi kesikli
olabilir.
11.2. YALIN (BASİT) REGRESYON
Yalın regresyon ile açıklanmaya çalışılan basit doğrusal ilişkidir.ve;
y i = 0 + 1 xi + i
modeli ile belirlenir.Bu modelde i hata terimidir ve bir şans değişkenidir. Sadece y’yi etkiler
ve x ile hiçbir ilgisi yoktur. Bu bilgiler ışığı altında Regresyon’un tanımı:
Değişkenler ararsındaki bağıntının doğasını belirler. Regresyonda yapılan iş bağımsız
değişkenin değişim biçimine uyularak bağımlı değişkeni önceden belirlenmiş bir hata
payı içinde tahminlemektir.
i
xi
x
(Ağırlık)
y(boy)
yi
yi=
0 +1 xi + i
ˆiy
Prof Dr. Levent ŞENYAY XI - İstatistik II
4
y donma
noktası
x
konsantrasyona b c
0
-250
Gerçek ilişki doğrusal olmadığı halde a ve b aralığı içinde ilişki doğrusal bir şekilde
mükemmelce ifade edilebilir ancak aynı doğru ile gibi bir noktayı açıklamaya çalışmak
büyük bir hatadır.
y
üretim
miktarı
yıllar
O
(-) a b
O gibi bir noktanın yorumu hatalı olacaktır.
Prof Dr. Levent ŞENYAY XI - İstatistik II
5
y
x
1 birim
y i = 0 + 1 xi + i
Populasyonla ilgilidir.
Genellikle bilinmez, bulunmaya çalışılır.
0
Prof Dr. Levent ŞENYAY XI - İstatistik II
6
tg = b1
yc
Örnekle ilgilidir.
Üzerinde çalışılan modelin, populasyon modeline yakın olması istenir.
xbby 10ˆ
yi
1btg (eğim)
x ile y arasında
90 ise + 1b pozitif bir ilişki,
90 ise - 1b negatif bir ilişki vardır.
1b = Bağımsız değişken 1 birim değiştiği zaman y bağımlı değişkenindeki değişme
miktarı(eğim)
Regresyonun Özellikleri
i)Bu doğru,bağımlı değişkeni (y nin dağılımını) en iyi temsil eden doğrudur.