Top Banner
Prof. Dr. Ömer SATICI Biyoistatistik ders notu Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR İstatistiksel güven aralıkları uygulamalarında normallik (normal dağılıma uygunluk) oldukça önemlidir. Kullanılan parametrik istatistiksel tekniklerin geçerli olabilmesi için populasyon şans değişkeninin normal dağılıma uyması gerekir. Örneğin, Ki-Kare Testleri normal dağılımı da içeren her hangi bir dağılıma uygulanabilir. Bu bölümde dağılımların normallik testinde kullanılabilecek iki parametrik olmayan test tekniği açıklanmıştır. Bu teknikler Kolmogorov- Smirnov K-S veya Lilliefors testi olarak bilinirler. K-S testi daha kolay uygulanmaktadır. K-S Testi K-S Testi hipotezde ileri sürülen dağılımla örnek yığılmalı dağılım fonksiyonunun karşılaştırılması ile yapılır. x X P X F ( ) ( ) Örnek yığılmalı dağılım fonksiyonu S(x), seçilen bir x değerine eşit veya daha küçük olan örnek değerinin oranını tanımlar. S(x) aşağıdaki gibi hesaplanır. Örnek: 10 gözlemli bir çalışmada: 110 89 102 80 93 121 108 97 105 103 olsun Önce gözlem değerleri küçükten büyüğe doğru sıralanır. 80 89 93 97 102 103 105 108 110 121 X=80, toplam gözlem değerinin en küçüğü olduğundan bu değere eşit veya daha küçük değerde olan gözlemlerin oranı ; S(80)=1/10 =0.10 olur. Benzer olarak, 10 değerin 2 si 89’a eşit veya daha küçüktür. (80 ve 89) bunların oranı ise; S(89)=2/10=0.20 olur. Kalanları benzer olarak düzenleyelim. X 80 89 93 97 102 103 105 108 110 121 S(x) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0 Bu gözlem değerlerinin ortalaması µ=100 ve standart sapması σ=10 olan ve normal dağılım gösteren bir yığından çekildiği varsayılırsa, H 0 :Veriler µ=100 ve standart sapması σ=10 olan ve normal dağılım gösteren bir yığından çekildiği söylene bilir mi? H 1 : Hayır veriler normal dağılıştan çekilmemiştir.
14

Prof. Dr. Ömer SATICI Biyoistatistik ders notu · Prof. Dr. Ömer SATICI Biyoistatistik ders notu Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

Aug 15, 2018

Download

Documents

vodang
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Prof. Dr. Ömer SATICI Biyoistatistik ders notu · Prof. Dr. Ömer SATICI Biyoistatistik ders notu Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

Prof. Dr. Ömer SATICI Biyoistatistik ders notu

Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

İstatistiksel güven aralıkları uygulamalarında normallik (normal dağılıma uygunluk) oldukça önemlidir. Kullanılan parametrik istatistiksel tekniklerin geçerli olabilmesi için populasyon şans değişkeninin normal dağılıma uyması gerekir. Örneğin, Ki-Kare Testleri normal dağılımı da içeren her hangi bir dağılıma uygulanabilir. Bu bölümde dağılımların normallik testinde kullanılabilecek iki parametrik olmayan test tekniği açıklanmıştır. Bu teknikler Kolmogorov-Smirnov K-S veya Lilliefors testi olarak bilinirler. K-S testi daha kolay uygulanmaktadır.

K-S Testi

K-S Testi hipotezde ileri sürülen dağılımla örnek yığılmalı dağılım fonksiyonunun karşılaştırılması ile yapılır.

xXPXF ()( )

Örnek yığılmalı dağılım fonksiyonu S(x), seçilen bir x değerine eşit veya daha küçük olan örnek değerinin oranını tanımlar. S(x) aşağıdaki gibi hesaplanır.

Örnek: 10 gözlemli bir çalışmada: 110 89 102 80 93 121 108 97 105 103 olsun

Önce gözlem değerleri küçükten büyüğe doğru sıralanır.

80 89 93 97 102 103 105 108 110 121

X=80, toplam gözlem değerinin en küçüğü olduğundan bu değere eşit veya daha küçük değerde olan gözlemlerin oranı ;

S(80)=1/10 =0.10 olur.

Benzer olarak, 10 değerin 2 si 89’a eşit veya daha küçüktür. (80 ve 89) bunların oranı ise; S(89)=2/10=0.20 olur. Kalanları benzer olarak düzenleyelim.

X 80 89 93 97 102 103 105 108 110 121 S(x) 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1.0

Bu gözlem değerlerinin ortalaması µ=100 ve standart sapması σ=10 olan ve normal dağılım gösteren bir yığından çekildiği varsayılırsa,

H0 :Veriler µ=100 ve standart sapması σ=10 olan ve normal dağılım gösteren bir yığından çekildiği söylene bilir mi?

H 1: Hayır veriler normal dağılıştan çekilmemiştir.

Page 2: Prof. Dr. Ömer SATICI Biyoistatistik ders notu · Prof. Dr. Ömer SATICI Biyoistatistik ders notu Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

Prof. Dr. Ömer SATICI Biyoistatistik ders notu

Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

X için yığılımlı F(X) hesaplanması

)80()80( xPF

0228.0)2(10

10080)80(

ZPxPF olur

Benzer hesaplamalarla xler e karşı gelen ölçümler yapılır.

X F(X)=P(X≤x) 80 P(X≤80)=P(Z≤-2)=0.0228 89 P(X≤89)=P(Z≤-1.1)=0.1357 93 P(X≤93)=P(Z≤-0.7)=0.2420 97 P(X≤97)=P(Z≤-0.3)=0.3821 102 P(X≤102)=P(Z≤0.2)=0.5793 103 P(X≤103)=P(Z≤0.3)=0.6179 105 P(X≤105)=P(Z≤0.5)=0.6915 108 P(X≤108)=P(Z≤0.8)=0.7881 110 P(X≤110)=P(Z≤1.0)=0.8413 121 P(X≤121)=P(Z≤2.1)=0.9821 Eğer H0 : Hipotezi doğru ise, bütün x değerleri için F(X) ve S(X) değerleri benzer olmalıdır. Buna karşın, eğer H0 hipotezi yanlış ise , en azından bazı x değerleri için F(X) ile S(x) arasında büyük farklar olacaktır. F(X) ile S(X) arasındaki farkların en büyüğünün mutlak değeri (D) test istatistiği olarak tanımlanır.

Test istatistiği;

D=max [F(X)-S(X)] olur

D nin hesaplanması için, önce her bir x değeri için F(X) ile S(X) arasındaki fark hesaplanır. Bu farkların en büyük mutlak değere sahip olanı test istatistiği olarak belirlenir. Farklar aşağıda hesaplanmıştır.

X F(X) S(X) F(X)-S(X) [F(X)-S(X)] 80 0.0228 0.10 -0.0772 0.0772 89 0.1357 0.20 -0.0643 0.0643 93 0.242 0.30 -0.0580 0.058 97 0.3821 0.40 -0.0179 0.0179 102 0.5793 0.50 0.093 0.0793=D 103 0.6179 0.60 0.0179 0.0179 105 0.6915 0.70 -0.0085 0.0085 108 0.7881 0.80 -0.0119 0.0119 110 0.8413 0.90 -0.0587 0.0587 121 0.9821 1.00 -0.0179 0.0179

Değerler incelendiğinde en büyük mutlak fark değerinin D=0.0793 olduğu görülür. Eğer, D değeri D >F(X)-S(X) ise H0 hipotezi ret edilir.

Page 3: Prof. Dr. Ömer SATICI Biyoistatistik ders notu · Prof. Dr. Ömer SATICI Biyoistatistik ders notu Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

Prof. Dr. Ömer SATICI Biyoistatistik ders notu

Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

Bu farkın büyüklüğüne karar vermek için ilgili tablo Ek çizelge 10 da verilmiştir. Kritik değerler α=0.05, α=0.10, ve α=0.20 önem seviyelerinde n=1…… 40 a kadar için verilmiştir.

Eğer , örnek hacmi n>40 ise, kritik değer

Α- α=0.20 için n

TH 07.1 , olur.

B- α=0.10 için n

TH 22.1 , olur

C- α=0.050 için n

TH 36.1 , olur

D- α=0.02 için n

TH 52.1 , olur

Ağer,

Sonuç: Yukarıdaki örnek veriler için hesaplanan test istatistiği D= 0.0793 değeri, α=0.05 önem seviyesindeki n=10 değerine karşılık gelen kritik tablo değeri olan 0.409 değeri ile karşılaştırılır. D=0.0793 ≤ 0.409 olduğundan Ho hipotezi kabul edilir.

Yorum: Verilerin µ=100 ve standart sapması σ=10 olan ve normal dağılım gösteren bir yığından çekildiğini söylemek için yeterli destek bulunmaktadır.

Çoğu uygulamada , normallik testi yapılacak populasyonun ortalaması ve varyansı bilinmemektedir. Oysa K-S Testinde, bu parametrelerin bilindiği kabul edilmektedir.

İşte bu Lilliefors Testi K-S testine benzemektedir. Ama , Lilliefors testi Populasyon varyansı ve ortalamasının bilinmediği populasyonların normallik testinin yapılmasına yarar.

Aradaki fark nedir diye sorulursa; F(X) in hesaplanmasında (µ ve σ yerine) örnek ortalaması ve standart sapması s nin kullanıldığını bileceğiz. X, S örnek sonuçları istatistiktir.

Örnek yığılımlı dağılım fonksiyonu S(X) in hesaplanması ve test istatistiği D nin hesaplanması , K-S testindekilerle aynıdır. Hesaplanan D, test istatistiği Lilliefors test tablo sonuçları ile karşılaştırılır. Eğer D> Tablo değeri ise Ho hipotezi ret edilir.

ÖRNEK: Bizim işletmede günlük süt üretimi kakında hipotez testi yapmak üzere rasgele seçilen 15 günlük süt üretim miktarları litre olarak hesaplanmış ve aşağıda verilmiştir.

91 95 93 103 101 105 96 94 101 98 88 102 94 95 92 Bu bulgulara göre, işletmemizin günlük süt üretiminin normal dağılıp dağılmadığını α=0.05 önem seviyesinde test ediniz.

II- LİLLİEFORS TESTİ

Page 4: Prof. Dr. Ömer SATICI Biyoistatistik ders notu · Prof. Dr. Ömer SATICI Biyoistatistik ders notu Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

Prof. Dr. Ömer SATICI Biyoistatistik ders notu

Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

ÇÖZÜM:

Populasyon ortalamsı ve varyansı bilinmediğinden, normallik testi Lilliefors testi ile yapılabilir. Verilerin ortalama ve standart sapma değerlerini hesaplayalım. X=96.47 , s=4.85 olarak bulunur. Testin uygulanması K_S testindeki işlemlerle aynıdır. Veriler sıraya dizilecek,

S(X) , F(X) ve mutlak değeleri tabloda verilmiştir. Hesaplamalardan sonra F(X) ve S(X) farkları ve en büyük mutlak fark değeri bulunacak. D istatistiğ tablo değeri ile karşılaştırılacaktır.

Örnek ve populayon Yığılmalı Olasılık değerleri

X S(X) F(X) 88 1/15=0.067

0401.0)75.1(85.4

47.9688)88(

ZPxxP

91 2/15=0.133 1292.0)13.1(

85.447.9691)91(

ZPxxP

92 3/15=0.200 1788.0)92.0(

85.447.9692)92(

ZPxxP

93 4/15=0.267 2358.0)72.0(

85.447.9693)93(

ZPxxP

94 6/15=0.400 3050.0)51.0(

85.447.9694)94(

ZPxxP

95 8/15=0.533 381.0)30.0(

85.447.9695)95(

ZPxxP

96 9/15=0.600 4602.0)10.0(

85.447.9696)96(

ZPxxP

98 10/15=0.667 6255.0)32.0(

85.447.9698)98(

ZPxxP

101 13/15=0.867 8238.0)93.0(

85.447.96101)101(

ZPxxP

103 14/15=0.933 9115.0)3592.1(

85.447.96103)103(

ZPxxP

105 15/15=1.00 9608.0)76.1(

85.447.96105)105(

ZPxxP

İlgili Teorik tabloda n=15 ve α=0.01 için kritik değer =0.257 olarak bulunuyor.

D=0.1509 ≤0.257 olduğundan, Ho Hipotezi kabul edilir. İşletmemizdeki günlük süt üretiminin verileri NORMAL dağılır diyebiliriz.

Page 5: Prof. Dr. Ömer SATICI Biyoistatistik ders notu · Prof. Dr. Ömer SATICI Biyoistatistik ders notu Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

Prof. Dr. Ömer SATICI Biyoistatistik ders notu

Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

MUTLAK FARKLAR VE LİLLİEFORS TEST İSTATİSTİĞİ

X F(X) S(X) F(X)-S(X) |F(X)-S(X)| 88 0.0401 0.067 -0.0269 0.0269 91 0.1292 0.133 -0.0038 0.0038 92 0.1788 0.200 -0.0212 0.0212 93 0.2358 0.267 -0.0312 0.0312 94 0.3050 0.400 -0.0950 0.095 95 0.3821 0.533 -0.1509 0.1509=D 96 0.4602 0.600 -0.1398 0.1398 98 0.6255 0.667 -0.0415 0.0415 101 0.8238 0.867 -0.0432 0.0432 103 0.9115 0.933 -0.0215 0.0215 105 0.9608 1.00 -0.0392 0.0392

Örnekteki verilere birde SPSS Paket programında Normallik testi uygulayalım. Örnek : 80 89 93 97 102 103 105 108 110 121 olsun. H0 :Veriler µ=100 ve standart sapması σ=10 olan ve normal dağılım gösteren bir yığından çekildiği söylene bilir mi?

H1: Hayır veriler normal dağılıştan çekilmemiştir.

1. Adım

Page 6: Prof. Dr. Ömer SATICI Biyoistatistik ders notu · Prof. Dr. Ömer SATICI Biyoistatistik ders notu Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

Prof. Dr. Ömer SATICI Biyoistatistik ders notu

Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

2. Adım

Page 7: Prof. Dr. Ömer SATICI Biyoistatistik ders notu · Prof. Dr. Ömer SATICI Biyoistatistik ders notu Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

Prof. Dr. Ömer SATICI Biyoistatistik ders notu

Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

3. Adım

4. Adım

Page 8: Prof. Dr. Ömer SATICI Biyoistatistik ders notu · Prof. Dr. Ömer SATICI Biyoistatistik ders notu Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

Prof. Dr. Ömer SATICI Biyoistatistik ders notu

Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

5. Adım

Descriptives

Statistic Std. Error

Gunluk süt üretimi Mean 100,8000 3,67514

95% Confidence Interval for

Mean

Lower Bound 92,4863

Upper Bound 109,1137

5% Trimmed Mean 100,8333

Median 102,5000

Variance 135,067

Std. Deviation 11,62182

Minimum 80,00

Maximum 121,00

Range 41,00

Interquartile Range 16,50

Skewness -,150 ,687

Kurtosis ,293 1,334

Tests of Normality

Kolmogorov-Smirnova Shapiro-Wilk

Statistic df Sig. Statistic df Sig.

Gunluk süt üretimi ,141 10 ,200* ,989 10 ,995

a. Lilliefors Significance Correction

*. This is a lower bound of the true significance.

VERİLERİN NORMAL DAĞILIŞA UYDUĞU GÖRÜLÜYOR

Page 9: Prof. Dr. Ömer SATICI Biyoistatistik ders notu · Prof. Dr. Ömer SATICI Biyoistatistik ders notu Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

Prof. Dr. Ömer SATICI Biyoistatistik ders notu

Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

Page 10: Prof. Dr. Ömer SATICI Biyoistatistik ders notu · Prof. Dr. Ömer SATICI Biyoistatistik ders notu Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

Prof. Dr. Ömer SATICI Biyoistatistik ders notu

Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

Örnek: Kız ve Erkek öğrencilerin Biyoistatistik sınav hata puanları dağılımı verilmiştir

Tablo Kız ve Erkeklerin Puan dağılımı

Hata Puanı 24 28 32 36 40 44 48 52 fK 0 0 0 0 3 2 3 2 fE 1 1 3 2 3 0 0 0 Kız ve Erkek öğrencilein hata puanlarına göre dağılımlarında fark olup olmadığını iki örnek K-S testi ile test ediniz.

SPSS te veriler X= Hata PUANI stununa girilir.. Cinsiyet değişkeni için de Y=Cinsiyet stununa girilir. (Cinsiyet E=1, Cinsiyet K=0) olarak kodlanır . Çözüm K-S Testi için Non Parametri test kısmında 2 Independent Sample seçeneği seçilerek veriler ilgili yerlere atanır.

Page 11: Prof. Dr. Ömer SATICI Biyoistatistik ders notu · Prof. Dr. Ömer SATICI Biyoistatistik ders notu Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

Prof. Dr. Ömer SATICI Biyoistatistik ders notu

Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

Çözüm:

SPSS te veri girişi için

Page 12: Prof. Dr. Ömer SATICI Biyoistatistik ders notu · Prof. Dr. Ömer SATICI Biyoistatistik ders notu Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

Prof. Dr. Ömer SATICI Biyoistatistik ders notu

Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

Çıktılar şöyledir.

Two-Sample Kolmogorov-Smirnov Test

Frequencies

Cinsiyet N

Hata Puani ,00 10

1,00 10

Total 20

Test Statisticsa

Hata Puani

Most Extreme Differences Absolute ,700

Positive ,000

Negative -,700

Kolmogorov-Smirnov Z 1,565

Asymp. Sig. (2-tailed) ,015

a. Grouping Variable: Cinsiyet

Yorum: ERKEK ve KIZ öğrencilerin hata puanları türdeş değildir. Kızların hata puanları

dağılımı, erkeklerin hata puanı dağılımından önemli düzeyde pozitif uçta yer almaktadır.

Kızların hata Puanları , Erkeklerin hata puanlarından daha yüksektir.

Page 13: Prof. Dr. Ömer SATICI Biyoistatistik ders notu · Prof. Dr. Ömer SATICI Biyoistatistik ders notu Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

Prof. Dr. Ömer SATICI Biyoistatistik ders notu

Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

K-S Tek Örnek Testi Örnek çözüm: Hasta kal. Gun Sayısı Birey Sayısı 5 1 6 0 7 2 8 3 9 2 10 1 11 0 12 1 Bireylerin Tifoya yakalanma ve hastanede kalma günlerine göre dağılımlarında veriler normal dağılışa uyuyor mu? K-S testi ile Test ediniz. KAYNAK:

AlimIşık Prof.Dr. İstatistik - II BETA BASIM A.Ş. BAYRAMPAŞA /İSTANBUL 2006

Kazım Özdamar. Paket Programlar ile İstatistiksel veri Analizi KAAN KİTAP EVİ 1999

Page 14: Prof. Dr. Ömer SATICI Biyoistatistik ders notu · Prof. Dr. Ömer SATICI Biyoistatistik ders notu Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

Prof. Dr. Ömer SATICI Biyoistatistik ders notu

Prof.Dr.ÖMER SATICI Dicle Üniversitesi Tıp Fakültesi 28 04 2014 DİYARBAKIR

Yorum: Tifoya yakalananların hastanede kalış günleri Normal dağılışa uyuyor P=0.953