Bağımlı Kukla Değişkenler •Bağımlı değişken özünde iki değer alabiliyorsa yani bir özelliğin varlığı ya da yokluğu söz konusu ise bu durumda bağımlı kukla değişkenler söz konusudur. •Bu durumdaki modelleri tahmin etmek için dört yaklaşım vardır: -Doğrusal Olasılık Modeli -Logit Modeli -Probit Modeli -Tobit Modeli Doğrusal Olasılık Modeli Y i = b 1 + b 2 X i +u i (1) Y i = 1Eğer i. Birey istenen özelliğe sahipse(iki durumlu bağımlıdeğişken) 0 Diğer Durumlarda X i = Bağımsız değişken Model, iki durumlu Y bağımlı değişkenini X’in doğrusal fonksiyonu olarak gösterir. Buna doğrusal olasılık modeli denir. Bu modele olasılıklı model denmesinin nedeni Y’nin X için şartlı beklenen değerinin, Y’nin X için şartlı olasılığına eşit olmasıdır E(Y i |X i )=Pr(Y i =1| X i )= b 1 + b 2 X i (2) Basit doğrusal olasılıklı model şöyledir:
28
Embed
Bağımlı Kukla Değişkenler öğr · Bağımlı Kukla Değişkenler •Bağımlı değişken özünde iki değer alabiliyorsa yani bir özelliğin varlığı ya da yokluğu söz
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Bağımlı Kukla Değişkenler
•Bağımlı değişken özünde iki değer alabiliyorsa yani bir özelliğin varlığı ya da yokluğu söz konusu ise bu durumda bağımlı kukla değişkenler söz konusudur.
•Bu durumdaki modelleri tahmin etmek için dört yaklaşım vardır:
-Doğrusal Olasılık Modeli
-Logit Modeli
-Probit Modeli
-Tobit Modeli
Doğrusal Olasılık Modeli
Yi = b1 + b2Xi +ui (1)
Yi= 1Eğer i. Birey istenen özelliğe sahipse(iki durumlu bağımlıdeğişken)
0 Diğer Durumlarda
Xi= Bağımsız değişken
Model, iki durumlu Y bağımlı değişkenini X’in doğrusal fonksiyonu olarak gösterir. Buna doğrusal olasılık modeli denir. Bu modele olasılıklı model denmesinin nedeni Y’nin X için şartlıbeklenen değerinin, Y’nin X için şartlı olasılığına eşit olmasıdır
E(Yi|Xi)=Pr(Yi=1| Xi)= b1 + b2Xi (2)
Basit doğrusal olasılıklı model şöyledir:
Olasılık 0 ile 1 arasında olduğundan aşağıdaki sınırlama daima geçerlidir:
0 ≤ E(Yi |Xi) ≤ 1
E(Yi |Xi)= b1 + b2Xi
2 nolu denklem şöyle ispatlanır:
Bilindiği gibi:
E(ui) = 0
Ayrıca
E(Yi|Xi)=Pr(Yi=1| Xi)= b1 + b2Xi (2)
Doğrusal Olasılık Modeli
Doğrusal Olasılık Modeli
E(Yi |Xi) = ΣYiPi=0.(1-Pi) + 1.(Pi) = Pi
E(Yi |Xi)= b1 + b2Xi = Pi
Beklenen değer tanımına göre
Yi Olasılık
0 1-Pi
1 Pi
Toplam 1
DOM Tahminindeki Sorunlar
ui hata teriminin normal dağılmayışı(binom dağılımlıdır)•Normallik varsayımının sağlanmaması durumunda tahmin ediciler sapmasızlıklarını korurlar.
•Nokta tahminde normallik varsayımı gözardı edilir.
•Örnek hacmi sonsuza giderken EKK tahmincileri çoğunlukla normal dağılıma uyarlar
•DOM ile yapılan istatistiksel çıkarsamalar normallik varsayımıaltındaki EKK sürecine uyarlar.
ui=Yi-b1-b2X (3)Yi=0 için ui=-b1-b2XYi=1 için ui=1-b1-b2X
DOM Tahminindeki Sorunlar
Yi ui İhtimal=P(ui)0 -b1-b2X (1-Pi)1 1-b1-b2X Pi
2 2i 1 2 i 1 2 iVar(u ) ( b b X) (1 P ) (1 b b X) (P )= − − − + − −
i 1 2 1 2Var(u ) (b b X)(1 b b X)= + − −
i i i i iVar(u ) E(Y | X )[1 E(Y | X )] P (1 P )= − = −
ui hata teriminin değişen varyanslı olması:
u ların varyansı farklıdır . u’nun varyansı Y’nin X için şartlıolasılığına bağlıdır. u’nun varyansı X’in değerine bağlıdır ve eşit değildir.
Yi ui İhtimal=P(ui)0 -b1-b2X (1-Pi)1 1-b1-b2X Pi
2 2i 1 2 i 1 2 iVar(u ) ( b b X) (1 P ) (1 b b X) (P )= − − − + − −
i 1 2 1 2Var(u ) (b b X)(1 b b X)= + − −
ui hata teriminin değişen varyanslı olması:
DOM Tahminindeki Sorunlar
0 ≤ E(Yi |Xi) ≤ 1 varsayımının yerine gelmeyişi:
Y tahminlerin 0’dan küçük ya da 1’den büyük çıkmasıdurumunda veri seti az ise 0’dan küçük değerlere “0”, 1’den büyük değerlere “1” değeri verilir. Eğer veri seti büyük ise gözlemler çıkartılabilir.
Belirlilik katsayısının güvenli olmaması:
Belirlilik katsayısı düşük çıktığından model seçiminde belirlilik katsayısı dikkate alınmaz.
Doğrusal Olasılık Modeli
Di = b1 + b2Mi +b3 Si +ui
Di= 1 Eğer i. Kadının bir işi varsa ya da iş arıyorsa
Adjusted R-squared 0.316304 S.D. dependent var 0.498273
S.E. of regression 0.412001 Akaike info criterion 1.159060
Sum squared resid 4.583121 Schwarz criterion 1.299179
Log likelihood -14.38590 F-statistic 7.708257
Durbin-Watson stat 2.550725 Prob(F-statistic) 0.002247
White Heteroskedasticity Test:F-statistic 1.759076 Probability 0.168742Obs*R-squared 6.589061 Probability 0.159265
Dependent Variable: RESID^2Included observations: 30Variable Coefficient Std. Error t-Statistic Prob. C -0.390620 0.700490 -0.557639 0.5821MI -0.410659 0.315325 -1.302336 0.2047MI*SI 0.036202 0.026225 1.380429 0.1797SI 0.132421 0.116635 1.135344 0.2670SI^2 -0.007102 0.004809 -1.476822 0.1522R-squared 0.219635 Mean dependent var 0.15277Adjusted R-squared 0.094777 S.D. dependent var 0.16180S.E. of regression 0.153942 Akaike info criterion -0.75347Sum squared resid 0.592452 Schwarz criterion 0.51994Log likelihood 16.30209 F-statistic 1.75907Durbin-Watson stat 1.963424 Prob(F-statistic) 0.16874
DOM’de Farklı Varyansı Önleme
ui hata teriminin değişen varyanslı olması:•Var(ui) = Pi(1-Pi)
1 2 i i
i i i i
b b X uYv v v v
= + +
i i i i iv E(Y | X )[1 E(Y | X )] P (1 P )= − = −
i i iˆ ˆv Y (1 Y )= −
Ancak burada anakütle değerleri
E(Yi |Xi)= Pi
bilinmediğinden, örnek tahmini ler hesaplanarak iYelde edilir.
DOM’de Farklı Varyansı Önleme
Dependent Variable:
Included observations: 30
Variable Coefficient Std. Error t-Statistic Prob.
-0.184154 0.316834 -0.581231 0.5659
-0.362893 0.135229 -2.683551 0.0123
0.081678 0.022231 3.674022 0.0010
R-squared 0.872710 Mean dependent var 2.190469
Adjusted R-squared 0.863281 S.D. dependent var 2.514662
S.E. of regression 0.929809 Akaike info criterion 2.786965
Sum squared resid 23.34273 Schwarz criterion 2.927085
Log likelihood -38.80448 F-statistic 92.55700
Durbin-Watson stat 2.583787 Prob(F-statistic) 0.000000
i 1 2 i 3 i iD v b v b M v b S v u v= + + +D / v
1/ vM / v
S/ v
UYGULAMA:Cep telefonunun kullanılıp kullanılmamasını ifade eden bağımlı kukla değişken 50 kişiye yapılan anket sonuncunda yaş ve aylık ortalama gelir ile açıklanmıştır.(Y=1, cep telefonuna sahip ise, Y=0 cep telefonuna sahip değilse)
R-squared 0.769835 Mean dependent var 2.679190Adjusted R-squared 0.760041 S.D. dependent var 3.426238S.E. of regression 1.678363 Akaike info criterion 3.931639Sum squared resid 132.3944 Schwarz criterion 4.046361Log likelihood -95.29098 F-statistic 78.60087Durbin-Watson stat 1.419773 Prob(F-statistic) 0.000000
1/ v
Y / v
X / vZ / v
DOM’e Alternatif Model Arama
•DOM ile ilgili sayılan sorunların hepsi bir şekilde aşılabilir
•Ancak, DOM
Pi=E(Y=1|X) olasılığının X’le doğrusal olarak arttığınıvarsayar. Yani X’deki marjinal veya küçük bir artış hep sabittir. Gerçek hayatta ise bu beklenen bir durum değildir.
•DOM ile ilgili sorunlar şu iki özellik sayesinde aşılabilir:
1.Xi arttıkça Pi=E(Y=1|X)’de artar ancak 0 ile 1 aralığının dışına çıkmaması istenir,
2.Pi ile Xi arasındaki ilişkinin doğrusal olmaması istenir.
DOM’e Alternatif Model AramaYukarıdaki özelliği taşıyan modelin şekli aşağıda verilmiştir:
•Bu fonksiyon bağımlı kukla değişkenli regresyon modellerinde kullanılabilir.
Logistik Dağılım Fonksiyonu
i
i
P 1 1.1-P 1
zz
z z
e ee e
−
− −
+= =
+
1 2 ii (b b X )
1P =E(Y=1|X)1 e− +=+
11 iZe−=+
i1 1 11 - P 1
1 1 1
i i
i i i
z z
z z ze e
e e e
− −
− − −
+ −= − = =
+ + +
Bahis ya da olabilirlik oranı
Zi = b1 + b2Xi
Logit Model
•Zi, -∞ ile +∞ arasında değerler alırken Pi’nin aldığı değerler ise 0 ile 1 arasında değişmektedir.
•Zi ile Pi arasındaki ilişki doğrusal değildir.
1 2ln1
ii i
i
PL Z b b XP
⎡ ⎤= = = +⎢ ⎥−⎣ ⎦
Kümülatif logistik fonksiyon
Li fark oranı logaritması olup hem X hem de bi parametrelerine göre doğrusaldır.
Logistik modelde b2 katsayısı, X’deki bir birimlik artışın L’de(yani ev sahibi olma lehine fark oranında ) yapacağı artışı gösterir.
Logit Model
Logit Modelin Özellikleri
Pi=1 ⎥⎦⎤
⎢⎣⎡=⎥⎦
⎤⎢⎣⎡−
=⎥⎦
⎤⎢⎣
⎡− 0
1ln11
1lnP1
Plni
i = +∞
Pi=0 ⎥⎦⎤
⎢⎣⎡=⎥⎦
⎤⎢⎣⎡−
=⎥⎦
⎤⎢⎣
⎡− 1
0ln01
0lnP1
Plni
i= -∞
1. Pi, 0’dan 1’e kadar değer aldığında, Logitte -∞ile +∞ arasında değer alır.
2. Logit, X’e göre doğrusal iken olasılıklara göre değildir.
3. Logit modelin b2 katsayısı şu şekilde yorumlanır: Bağımsız değişkendeki bir birimlik değişme karşısında Logitteki değişmeyi gösterir.
4. Logit model tahmin edildikten sonra, X bağımsız değişkeninin belirli bir değeri için logitin gerçekleşme olasılığı hesaplanabilir.
Logit Modelin EKKY İle Tahmini
1.Adım: olasılıkları hesaplanır.i i iP n N=
2.Adım: fark oranı logaritmaları hesaplanır.i i iL ln(P 1 P )= −
3.Adım: orijinal lojistik modeli tahminlenir.i 1 2 i iL b b X u= + +
i i i iL ln[n (N n )]= −
Farklı varyans durumu söz konusu ise; orijinal lojistik modelin her iki tarafı da ile çarpılarak dönüşümlü lojistik model elde edilir.iv
i 1 2 i iL b b X u= + + i i i iv N P (1 P )= −
Farklı varyans durumu söz konusu ise; orijinal lojistik modelin her iki tarafı da ile çarpılarak dönüşümlü lojistik model elde edilir.
iv
i i 1 i 2 i i i iv L b v b v X v u= + +
Logit Modelin EKKY İle Tahmini
* *1 i 2 i iL b v b X w= + + Dönüşümlü veya Tartılı
EKK Lojistik Modeli
i i i iv N P (1 P )= −
i i iw u v=
Logistik Model Uygulaması300 aileden oluşan küçük bir kasabada ailelerin, yıllık gelirleri (Xi) ve ev sahibi olanların sayısı (ni) aşağıdaki tabloda gösterilmiştir.
inlf kidslt6 kidsge6 age educ exper nwifeincexpersq
Obs: 753
1. inlf =1 işgücüne katılıyorsa2. kidslt6 6 < yaşında küçük çocuk sayısı3. kidsge6 6-18 yaşları arasındaki çocuk sayısı4. age kadının yaşı5. educ eğitim yılı6. exper deneyim7. nwifeinc (ailegeliri – ücret*saat)/10008. expersq deneyimkare
Wooldridge Example 17.1-DOMDependent Variable: INLF
Method: Least Squares Included observations: 753
Variable Coefficient Std. Error t-Statistic Prob.
NWIFEINC -0.003405 0.001448 -2.350840 0.0190
EDUC 0.037995 0.007376 5.151194 0.0000
EXPER 0.039492 0.005673 6.961866 0.0000
EXPERSQ -0.000596 0.000185 -3.226959 0.0013
AGE -0.016091 0.002485 -6.476014 0.0000
KIDSLT6 -0.261810 0.033506 -7.813888 0.0000
KIDSGE6 0.013012 0.013196 0.986077 0.3244
C 0.585519 0.154178 3.797683 0.0002
R-squared 0.264216 Mean dependent var 0.568393
Adjusted R-squared 0.257303 S.D. dependent var 0.495630
S.E. of regression 0.427133 Akaike info criterion 1.147124
Sum squared resid 135.9197 Schwarz criterion 1.196251
Log likelihood -423.8923 F-statistic 38.21795
Durbin-Watson stat 0.493840 Prob(F-statistic) 0.000000
Wooldridge Example 17.1-LOGİTDependent Variable: INLF Method: ML - Binary Logit Included observations: 753
Variable Coefficient Std. Error z-Statistic Prob.
NWIFEINC -0.021345 0.008421 -2.534621 0.0113
EDUC 0.221170 0.043440 5.091443 0.0000
EXPER 0.205870 0.032057 6.422002 0.0000
EXPERSQ -0.003154 0.001016 -3.104093 0.0019
AGE -0.088024 0.014573 -6.040235 0.0000
KIDSLT6 -1.443354 0.203585 -7.089695 0.0000
KIDSGE6 0.060112 0.074790 0.803750 0.4215
C 0.425452 0.860369 0.494500 0.6210
Mean dependent var 0.568393 S.D. dependent var 0.495630
S.E. of regression 0.425963 Akaike info criterion 1.088354
Sum squared resid 135.1762 Schwarz criterion 1.137481
LR statistic (2 df) 13.82685 McFadden R-squared 0.342412
Probability(LR stat) 0.000994
Obs with Dep=0 12 Total obs 30
Obs with Dep=1 18
UYGULAMA: Kasımpatı yaprak bitkilerini öldüren bir ilaçtan 1 Ltsuya konan dozlar (X, Miligram), yaklaşık 50cl.’lik bit grupları(Ni) üzerine sıkılmış ve ölen bit sayısı (ni) aşağıdaki gibi tesbit edilmiştir:
b) X=7.7 miligram doz seviyesinde ölüm ihtimali P’yihesaplayınız.
ii
i
PL ln( ) 2.85 0.525X1 P
= = − +−
ii
i
PL ln( ) 2.85 0.525(7.7) 1.1921 P
= = − + =−
i
i
Pln( ) 1.19251 P
=−
i
i
P 2.831 P
=− iP 0.739=
UYGULAMA: Aşağıda bir okulun eğitimi ile ilgili verileri kullanarak Probit denklemini çıkartınız.
GRADE: Yeni bir tekniğin uygulanması sonucu öğrencilerin elde ettiği başarıPSI: Yeni Öğretme YöntemiGPA: Çocuğun Ortalama DerecesiTUCE: Sınav Öncesi Konu ile ilgili Bilgi SKoru
Dependent Variable: GRADEMethod: ML - Binary ProbitIncluded observations: 32Convergence achieved after 5 iterations
GRADE: Yeni bir tekniğin uygulanması sonucu öğrencilerin elde ettiği başarıPSI: Yeni Öğretme YöntemiGPA: Çocuğun Ortalama DerecesiTUCE: Sınav Öncesi Konu ile ilgili Bilgi Skoru
Dependent Variable: GRADEMethod: ML - Binary LogitSample: 1 32
GRADE: Yeni bir tekniğin uygulanması sonucu öğrencilerin elde ettiği başarıPSI: Yeni Öğretme YöntemiGPA: Çocuğun Ortalama DerecesiTUCE: Sınav Öncesi Konu ile ilgili Bilgi SKoru