Hataların Bağımsızlığı Varsayımı (Otokorelasyon Olmaması Varsayımı) Hataların birbirinden bağımsız olması veya hatalar arasında otokeralasyon olmaması varsayımı bağımlılığa dayanan yöntemlerde önem arz eder. Nasıl korelasyon katsayısı iki değişken arasındaki lineer ilişkiyi gösteriyorsa, otokorelasyon’da aynı şekilde bunu aynı zaman serisi üzerinde bunun uygulanmasıdır. Otokorelasyon hata terimlerinin ardışık değerleri arasında ilişki olması durumudur. Mesela; t zamanındaki gözlem ile t-1 zamandaki gözlem − ile kıyaslarsak aradaki ilişkiyi görebiliriz. Burada t-1 zamandaki gözlem “lagged, gecikmeli” olarak tanımlanır. Benzer şekilde, gözlemi − ve − ilede kıyaslanabilir. Hataların Bağımlı Olmasının Nedenleri Önemli bir açıklayıcı değişkenin modelde olmaması Örnek birim sayısının az olması Seçilen fonksiyonun tipinin uygun olmaması Ekonomik değişkenlerin zaman serileri analizinde birbirini takip eden hataların trend nedeniyle pozitif otokorelasyon göstermesi Bu durumda regresyon analizinde görülen olumsuz etkiler Regresyon katsayılarının minimum olması sağlanamaz. Otokorelasyon durumunda, t test istatistiği değeri büyük çıkar. Böylece anlamsız bir katsayının anlamlı olma olasılığı artar. 2 de yükselir. Dolayısıyla F değeri olduğundan büyük bulunur. Sonuç olarak t ve F testleri güvenilirliğini yitirip yanıltıcı sonuç verirler. * Otokorelasyon, hata teriminin ardışık değerleri arasındaki ilişki; Otoregresyon, bağımlı değişkenin ardışık değerleri arasındaki ilişkidir. Otokorelasyonun Araştırılması için Yöntemler 1. Grafik Yöntem Eğer zaman serisi analizi ise; de hafta, ay, mesvim ve yıl şeklinde zaman birimleri,
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Hataların Bağımsızlığı Varsayımı (Otokorelasyon Olmaması Varsayımı) Hataların birbirinden bağımsız olması veya hatalar arasında otokeralasyon olmaması varsayımı bağımlılığa dayanan yöntemlerde önem arz eder. Nasıl korelasyon katsayısı iki değişken arasındaki lineer ilişkiyi gösteriyorsa, otokorelasyon’da aynı şekilde bunu aynı zaman serisi üzerinde bunun uygulanmasıdır. Otokorelasyon hata terimlerinin ardışık değerleri arasında ilişki olması durumudur. Mesela; t zamanındaki gözlem 𝒚𝒕 ile t-1 zamandaki gözlem 𝒚𝒕−𝟏 ile kıyaslarsak aradaki ilişkiyi görebiliriz. Burada t-1 zamandaki gözlem “lagged, gecikmeli” olarak tanımlanır. Benzer şekilde, 𝒚𝒕 gözlemi 𝒚𝒕−𝟐 ve 𝒚𝒕−𝟑 ilede kıyaslanabilir.
Hataların Bağımlı Olmasının Nedenleri
Önemli bir açıklayıcı değişkenin modelde olmaması
Örnek birim sayısının az olması
Seçilen fonksiyonun tipinin uygun olmaması
Ekonomik değişkenlerin zaman serileri analizinde birbirini takip eden hataların trend nedeniyle pozitif otokorelasyon göstermesi
Bu durumda regresyon analizinde görülen olumsuz etkiler
Regresyon katsayılarının minimum olması sağlanamaz.
Otokorelasyon durumunda, t test istatistiği değeri büyük çıkar. Böylece anlamsız bir katsayının anlamlı olma olasılığı artar. 𝑅2 de yükselir. Dolayısıyla F değeri olduğundan büyük bulunur. Sonuç olarak t ve F testleri güvenilirliğini yitirip yanıltıcı sonuç verirler.
* Otokorelasyon, hata teriminin ardışık değerleri arasındaki ilişki; Otoregresyon, bağımlı değişkenin ardışık değerleri arasındaki ilişkidir.
Otokorelasyonun Araştırılması için Yöntemler 1. Grafik Yöntem
Eğer zaman serisi analizi ise; 𝒙 de hafta, ay, mesvim ve yıl şeklinde zaman birimleri,
Zaman serisi analizi değilse; Bağımsız değişken veya 𝒚′ tahmini değeri dikey eksen ise
standardize hataları 𝒆𝒊 𝑺⁄ gösterir.
A durumu: Standart hataların ortalaması 0 olan normal bir dağılım gösterdiği yani tesadüfi dağıldığı anlaşılır. B durumu: Pozitif büyük hatalar negatif büyük hatalara doğru eğilim gösterdiği için otokorelasyonun pozitif olduğu söylenebilir. C durumu: Negatif büyük hatalar pozitif büyük hatalara doğru hareket ettikleri için otokorelasyonun negatif olduğu söylenebilir. 2. Akış Testi (Run Tests) 1) Parametrik olmayan bu yöntemde önce hipotezler kulur: 𝑯𝟎 : Hatalar anakütlede tesadüfidir. (Birbirinden bağımsızdır) 𝑯𝟏 : Hatalar anakütlede tesadüfi değildir. (Birbirine bağımlıdır) 2) Aşağıdaki formüle göre değerler hesaplanır:
R: Akış sayısı yani hatalarda işaret değişikliği olduğu durum sayısı 𝑛1 : Pozitif işaretli hata sayısı 𝑛2 : Negatif işaretli hata sayısı 3. Daha sonra 𝑛1ve 𝑛2 ≥ 10 ise;
dönüşümü yapılır. 𝑛1ve 𝑛2 < 10 ise; çeşitli 𝑛1 ve 𝑛2’ler için kritik değerlerin verildiği tablolar kullanılarak test aynen gerçekleştirilir. 4. Bulunan 𝒁 değeri, normal dağılım 𝒁∝
𝟐⁄ değeriyle karşılaştırılır:
𝒁 < 𝒁∝
𝟐⁄ ise 𝐻0 kabul anakütlede hatalar bağımsız yani tesadüfidir.
𝒁 > 𝒁∝𝟐⁄ ise 𝐻0 red anakütlede hataların bağımlıdır.
5. Durbin – Watson Testi
En yaygın olarak kullanılan testtir.
Pozitif ve negatif otokorelasyonların araştırılmasına olanak sağlar. Testte kullanılan d istatistiği şöyledir:
Her hata ile bir önceki hata arasında farkın kareleri toplamının modelin hata kareleri toplamına bölünmesi ile elde edilir. d istatistiği açıldığında;
ve 𝒆𝒊 ≅ 𝒆𝒊−𝟏 kabul edildiğinde; 𝒅 = 𝟐 − 𝟐�̂� = 𝟐(𝟏 − �̂�) olarak yazılabilir. burada �̂� 𝒆𝒊 ile 𝒆𝒊−𝟏 arasındaki Pearson korelasyon katsayısı yani otokorelasyon katsayısıdır. �̂� = 0 olduğunda otokorelasyon yok demektir. d=2 olur. �̂� = 1 olduğunda tam pozitif otokorelasyon var demektir. d=0 olur. �̂� = −1 olduğunda tam negatif otokorelasyon var demektir. d=4 olur. d istatistiği 0-4 değerleri arasında bir değer almaktadır. d istatistiği hesaplandıktan sonra otokorelasyon testindeki hipotezler ve kararlar gerçekleştirilir. Çift taraflı otokorelasyon testi: 𝑯𝟎 : 𝝆 = 𝟎 Anakütlede otokorelasyon yok. 𝑯𝟏 : 𝝆 ≠ 𝟎 Anakütlede çift taraflı otokorelasyon var. Negatif otokorelasyon testi: 𝑯𝟎 : 𝝆 = 𝟎 Anakütlede otokorelasyon yok. 𝑯𝟏 : 𝝆 < 𝟎 Anakütlede negatif otokorelasyon var.
Pozitif otokorelasyon testi: 𝑯𝟎 : 𝝆 = 𝟎 Anakütlede otokorelasyon yok. 𝑯𝟏 : 𝝆 > 𝟎 Anakütlede pozitif otokorelasyon var. Karar için örnek birim sayısı n ve k bağımsız değişken sayısı için çift taraflı testler ile tek taraflı testlere ait çeşitli anlamlılık düzeylerindeki d kritik değerleri, Durbin-Watson d istatistiği tablosundan; 𝑑𝐿: 𝑎𝑙𝑡 𝑑𝑒ğ𝑒𝑟 𝑑𝑢: ü𝑠𝑡 𝑑𝑒ğ𝑒𝑟 ile karşılaştırılır. Her üç testte de 𝑑𝐿 < 𝑑 < 𝑑𝑢ise kararsızlık durumu vardır. d değeri arada kalması durumunda otokorelasyon olup olmadığına karar vermek güçleşir. Bunun nedeni otokorelasyon katsayısının sıfırdan ve birden uzak olması tam olrak otokorelasyon var veya yok kararının zorlaşmasıdır. Bu durumda bir kararsızlık aralığı olmayan Von Neumann testi uygulanır.
6. Von Neumann Testi
Zaman serileri için geliştirilmiş bu test n < 15 olduğu durumlarda da uygulanabilen ve kararsızlık aralığı olmayan bir testtir.
Yine Durbin-Watson istatistiğine çok benzemektedir.
d istatistiği ile hesaplanmaktadır. Test istatisiği:
formülde 𝑛′ = 𝑛 − 𝑘 dır. (k analizde değişken sayısı) Durbin-Watson istatistiğine örnek birim sayısı ve değişken sayısının katksıyıla elde edilmektedir. V değeri, Von Neumann tablosundaki çeşitli anlamlılık düzeyleri ve 𝑛′ değerleri için verilen 𝑉 ve 𝑉′ değerleriyle karşılaştırılmaktadır.
𝑉𝛼 ≤ 𝑉 ≤ 𝑉′𝛼 𝐻0 kabul anakütlede otokorelasyon yok
𝑉 > 𝑉′𝛼 𝐻0 anakütlede negatif korelasyon var.
𝑉 < 𝑉𝛼 𝐻0 anakütlede pozitif korelasyon var.
Hataların Bağımlılığı (Otokorelasyon) Durumunda Çözümler
Eksik açıklayıcı değişken varsa modele dahil edilir.
Örnek birim sayısı artırılır.
Fonksiyon tipi değiştirilerek uygun olan fonksiyon seçilir. Bu yöntemlere rağmen otokorelasyon devam ediyorsa otokorelasyon katsayısının tahmin değeri hesaplanır ve modeldeki her değişken 𝒚𝒊 − �̂�𝒚𝒊−𝟏 ve 𝒙𝒊 − �̂�𝒙𝒊−𝟏 dönüşümüyle modele dahil edilir. Bir diğer çözüm otokorelasyon tahmini 𝝆 ≅ 𝟏 olması durumunda uygulanır. Bir önceki çözümde �̂� yerine �̂� = 𝟏 konulur yani her değişkenin bir önceki değerinden farkı 𝒚𝒊 − 𝒚𝒊−𝟏 ve 𝒙𝒊 − 𝒙𝒊−𝟏 alınarak model oluşturulur. Çözüm yolları denendikten sonra Durbin-Watson testi yeniden uygulanarak otokorelasyonun ortadan kalkıp kalkmadığı tekrar araştırılır.
ÖRNEK: 2012 ve 2013 yılları için Mayıs ayından Eylül ayına kadar haftalık bazda ortalama elektrik talebi verisi ve türkiye geneli sıcaklık ortalaması mevcuttur. Artan hava sıcaklığına bağlı olarak elektrik talebinin artış gösterdiği ve klimaların vs. kullanımı nedeniyle aralarında pozitif bir ilişki olduğu bilinmektedir.
Scatter Plot:
Lineer Regresyon Modeli Uygulanırsa
Model Summaryb
Model R R Square
Adjusted R
Square
Std. Error of the
Estimate Durbin-Watson
1 ,906a ,820 ,815 1040,27636 1,162
a. Predictors: (Constant), ortalama sıcaklık
b. Dependent Variable: elektrik talebi
ANOVA
Sum of Squares df Mean Square F Sig.
Regression 1,923E8 1 1,923E8 177,717 ,000
Residual 42204820,986 39 1082174,897
Total 2,345E8 40
The independent variable is ortalama sıcaklık.
Coefficientsa
Model
Unstandardized Coefficients
Standardized
Coefficients
t Sig. B Std. Error Beta
1 (Constant) 18585,522 1228,001 15,135 ,000
ortalama sıcaklık 671,687 50,385 ,906 13,331 ,000
a. Dependent Variable: elektrik talebi
Otokorelasyon Kontrolü: Kalıntılar denklemin standart hatasına bölünür ve bunlar tahmin değerleri ile grafikte gösterilirse: