Top Banner
OLASILIK ve İSTATİSTİK II Öğr. Gör. Dr. Berk AYVAZ DERS 2: Ki-Kare Testi 14.03.2014
47

OLASILIK ve İSTATİSTİK II

Feb 24, 2016

Download

Documents

faraji

OLASILIK ve İSTATİSTİK II. DERS 2: Ki-Kare Testi. Öğr . Gör. Dr. Berk AYVAZ. 14.03.2014. OLASILIK ve İSTATİSTİK II. KARL PEARSON (1857 - 1936). Temel ilgi alanı genetiktir. 1892’de “ The Grammar of Science ” adlı kitabı yayınlandı. - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: OLASILIK ve İSTATİSTİK II

OLASILIK ve İSTATİSTİK II

Öğr. Gör. Dr. Berk AYVAZ

DERS 2: Ki-Kare Testi

14.03.2014

Page 2: OLASILIK ve İSTATİSTİK II

• Temel ilgi alanı genetiktir. • 1892’de “The Grammar of Science” adlı kitabı yayınlandı. • İzleyen yıllarda kalıtım ve evrim süreçlerine ilişkin çalışmaları

sırasında istatistikle ilgilendi. • Regresyon ve korelasyon konularındaki önemli katkılarının yanı

sıra, kuramda kendi adıyla anılan ve gözlem değerlerinin olasılık dağılımlarına ilişkin Pearson eğri sistemini ve 1912 yılında da Ki-kare testini geliştirdi.

KARL PEARSON (1857 - 1936)OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

Page 3: OLASILIK ve İSTATİSTİK II

• İstatistikte değişkenler sayısal değişkenler ve sayısal olmayan değişkenler olmak üzere iki grupta sınıflandırılmaktadır.

• Günümüzde yapılan birçok araştırmada sayısal değişkenlerin yanında sayısal olmayan değişkenlerin de dikkate alındığı görülmektedir.

• Örneğin, insanların medeni durumlarıyla seçtikleri meslek grupları arasındaki bir ilişki incelenmek istendiğinde, medeni durumun ve meslek grubunun rakamlarla ifade edilmesi olası değildir.

• Medeni durum “evli”, “bekâr”, “boşanmış” ve “dul” şeklinde gösterilirken meslek grupları da “serbest meslek”, “devlet memurluğu”, “işçi” vb. şeklinde gruplandırılabilir.

Ki-Kare testiOLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

Page 4: OLASILIK ve İSTATİSTİK II

1. İşte sayısal olmayan değişkenler arasındaki herhangi bir ilişkinin var olmadığını ileri sürerek (H0 hipotezi) bu hipotezin red edilip edilemeyeceğinin incelenmesinde uygulanan test Ki-Kare testi’dir.

2. Bir örneklemin gözlemlenmesi sonucunda elde edilen frekans dağılımının binom, Poisson, normal vb. gibi genel bir dağılıma uygun olup olmadığına karar verebilmek için kullanılan test yine Ki-kare testi olacaktır.

3. Diğer yandan iki ya da daha fazla örneklemin aynı evrenden seçilip seçilmedikleri konusunda karar verilirken de ki-kare testinden yararlanılır.

• Bu istatistiksel testin uygulanmasında önce, ki-kare’nin ve serbestlik derecesinin nasıl hesaplanacağının bilinmesi gerekir.

• Bunlar bağımsızlık, homojenlik ve uygunluk testleri için ayrı ayrı gösterilecektir.

Ki-Kare testiOLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

Page 5: OLASILIK ve İSTATİSTİK II

1- Ki-Kare Bağımsızlık Testi OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

• Bu ve benzeri problemlerin çözümlenmesinde ki-kare testi kullanılır. • İki ya da daha fazla sınıflı iki nitel değişken arasında bağımsızlık olup

olmadığını incelemek için, ki-kare bağımsızlık testine başvurmak gerekir. • Bu test yapılırken kontenjans tablosundan yararlanılmaktadır. • Bu tablo, incelenen iki değişken için gözlenen frekansların yazıldığı, yatay

(satırlar) ve düşey (sütunlar) bantlardan oluşan, çift yönlü tablodur.

VakaÜretim sektöründe faaliyet göstermekte olan bir firmada ürün kalitesi ile çalışanların eğitim durumları arasında bir ilişki olduğu düşünülmektedir. Bu tezin incelenmesi için ki-kare testi kullanılır.

Page 6: OLASILIK ve İSTATİSTİK II

1- Ki-Kare Bağımsızlık Testi OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

• Ki-kare bağımsızlık ve homojenlik testlerini yapabilmek üzere hazırlanacak kontenjans tablosunun yapısı aşağıdaki tabloda gösterilmiştir.

2.Değişken Şıkları

1.Değişken Şıkları 1 2 3 …………. j ………….. c Toplam

1 n11 n22 n13 n1j n1c n1

2 n21 n22 n23 n2j n2c n2

3 n31 n32 n33 n3j n3c n3

. . . . . . .

. . . . . . .İ ni1 ni2 ni3 nij nic ni

.

. R nr1 nr2 nr3 nrj nrc nr

Toplam n.1 n.2 n.3 n.j n.c n..= n

• Aralarında bağıntı bulunduğu düşünülen birinci değişkenin r şıkkı (satır), ikinci değişkenin c şıkkı (sütun) varsa R*C Tablosu olarak da isimlendirilen tablo oluşturulur.

• Satır ve sütunların kesiştikleri yerlerde bulunan gözelerde ise ilgili frekanslar kaydedilir.

Page 7: OLASILIK ve İSTATİSTİK II

Örnek 1OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

Televizyon izleyicilerinin öğrenim düzeyleri ve TV programlarından tercih ettikleri türler sorgulanarak, bu iki değişken arasında bir bağıntı bulunup bulunmadığını, başka bir deyişle, iki değişkenin birbirinden bağımsız olup olmadığı, ortaya koymaya çalışılsın. Bu amaçla, 200 kişiyi kapsayan bir örneklem üzerinde yapılan gözlem sonuçları aşağıdaki tablo ile verilmiştir. Tercih edilen TV program türüne ilişkin öğrenim düzeyinin etkili olup olmadığını =0.01 anlamlılık düzeyinde araştırınız.

Page 8: OLASILIK ve İSTATİSTİK II

Çözüm 1OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

• Tabloda yer alan sayılar “gözlenen frekanslardır”. • Tercih edilen TV programı türü üzerinde öğrenim düzeyinin etkisi olup

olmadığını test edebilmek için (bağımsızlık testini yapabilmek için), izlenmesi gereken adımları sırasıyla şu şekildedir:

1. Adım : Hipotezlerin Kurulması• H0: TV izleyicilerinin öğrenim düzeyiyle TV programı, birbirinden bağımsız

değişkenlerdir. Bu iki değişken arasında bir ilişki yoktur.• H1: Öğrenim düzeyiyle TV programı arasında bir ilişki vardır.

2. Adım: İstatistiksel Test • İki sayısal olmayan değişken arasındaki ilişkinin varlığını araştıran bir test olan

(ki-kare) bağımsızlık testi olmalıdır.

Page 9: OLASILIK ve İSTATİSTİK II

Çözüm 1OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

3. Adım : Anlamlılık Düzeyinin Belirlenmesi• = 0.01

4. Adım: H0’ın Red Bölgesinin Belirlenmesi• Bunun için hesaplanan test istatistiği, belli bir anlamlılık düzeyine ve

n = (r–1)*(c–1) serbestlik derecesine göre değerleri tablosundan bulunan “kritik değer” ile karşılaştırılır.

• Örnekte serbestlik derecesi n = (3–1) * (3–1) = 4 olup = 0.01 düzeyinde tablosundan bulunan kritik değer k=13’tur.

• Eğer hesaplanan istatistiğinin değeri tablodan bulunan k kritik değerden büyük çıkarsa H0 red edilecektir.

5. Adım: Test İstatistiğinin Hesaplanması

G= Gözlenen frekanslarıB= Beklenen frekansları

Page 10: OLASILIK ve İSTATİSTİK II

Çözüm 1OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

• Test istatistiğinin hesaplanabilmesi için öncelikle beklenen frekansların hesaplanması gerekmektedir.

• Herhangi bir gözenin beklenen frekansı bulunurken, o gözenin yer aldığı satır toplam frekansıyla sütunun toplam frekansı çarpılıp genel toplam frekansa bölünmektedir.

• Örneğimiz için, beklenen frekansları, ilk gözeden başlamak üzere sırasıyla hesaplayalım:• B11 (birinci satır ve birinci sütunda yer alacak frekans)• B11 = (birinci satır toplamı x birinci sütun toplamı) / (genel toplam)= (80 x 90) / (200) = 36• B12 = (birinci satır toplamı x ikinci sütun toplamı) / (genel toplam)= (80 x 60) / (200) = 24• Beklenen frekanslar ve gözlenen frekanslar kontenjans tablosunda aşağıdaki gibi gösterilir.

ÖĞRENİM DÜZEYİToplamİzlenen TV

program türü İlk Orta Yüksek

G B G B G B Film 50 36 20 24 10 20 80

Eğlence 20 27 30 18 10 15 60Magazin 20 27 10 18 30 15 60Toplam 90 60 50 200

Page 11: OLASILIK ve İSTATİSTİK II

Çözüm 1OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

Test istatistiği:

= (50–36)2/(36) + (20–24)2/(24) + (10–20)2/(20) + (20–27)2/(27) + (30-18)2/(18) + (10–15)2/(15) + (20–27)2/(27) + (10–18)2/(18) + (30–15)2/(15) = 42.93

=42.93

6. Adım: İstatistiksel Karar• İstatistiksel karar verilirken, red bölgesinin tanımı gereği, > olduğunda sıfır hipotezi red edilir, ≤

olduğundaysa sıfır hipotezi reddedilemez.• Sıfır hipotezinin red edilmesi, değişkenlerin birbirinden bağımsız olmadığı (diğer bir ifadeyle,

değişkenler arasında ilişki bulunduğu) anlamını taşır. Buna göre örneğimizde,

= 42.93= 13.28

> olduğundan H0 hipotezi red edilecektir.

• Başka bir anlatımla, TV izleyicilerinin öğrenim düzeyiyle izledikleri program türleri arasında ilişki vardır.

Page 12: OLASILIK ve İSTATİSTİK II

Örnek 2OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

Yapılan bir çalışmada katılımcıların eğitim düzeyleri ve sigara içme alışkanlıkları sorgulanarak, bu iki değişken arasında bir bağıntı bulunup bulunmadığı, diğer bir ifadeyle iki değişkenin birbirinden bağımsız olup olmadığı belirlenmeye çalışılsın. Bu amaçla 300 kişiyi kapsayan bir örneklem üzerinde yapılan gözlem sonuçları aşağıdaki tablo ile verilmiştir.Sigara içme alışkanlığına ilişkin eğitim düzeyinin etkili olup olmadığını = 0.01 anlamlılık düzeyinde araştırınız.

Page 13: OLASILIK ve İSTATİSTİK II

Çözüm 2OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

1. Adım: Hipotezlerin ifade edilmesiH0: Sigara içme alışkanlığı ile eğitim düzeyi birbirinden bağımsız değişkenlerdir. Bu iki değişken arasında bir ilişki (bağıntı) yoktur. H1: Sigara içme alışkanlığı ile eğitim düzeyi arasında bir ilişki (bağıntı) vardır. 2. Adım: İstatistiksel Test İki sayısal olmayan değişken arasındaki ilişkinin varlığını araştıran bir test olan (ki-kare) bağımsızlık testi olmalıdır.

3. Adım: Anlamlılık düzeyinin belirlenmesi = 0.01 olarak belirlenmiştir.

4. Adım: H0’ın Red Bölgesinin BelirlenmesiSerbestlik derecesi v = (2-1)* (3-1) = 2 olup = 0.01 düzeyinde tablosundan bulunan kritik değer = 9.21’dir.

Page 14: OLASILIK ve İSTATİSTİK II

Çözüm 2OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

5. Adım: Test İstatistiğinin HesaplanmasıTest istatistiği

B11 (birinci satır birinci sütunda yer alacak frekans)B11 = (birinci satır toplamı x birinci sütun toplamı) / (genel toplam)= (140 x 90) / (300) = 42B12 = (birinci satır toplamı x ikinci sütun toplamı) / (genel toplam)= (140 x 120) / (300) = 56

Page 15: OLASILIK ve İSTATİSTİK II

Çözüm 2OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

Test istatistiği: = (45 - 42)2 / (55 - 56) 2 / (56) + (40 - 42) 2 / (42) + (45 - 48) 2 / (48) + (65 -64) 2 / (64) + (50 - 48) 2 / (48) = 0.58

6. Adım: İstatistiksel Karar = 0.58 = 9.21 ≤ olduğundan H0 hipotezi red edilemez.

Page 16: OLASILIK ve İSTATİSTİK II

Örnek OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

Bir sağlık idarecisi difteri-boğmaca karma aşısı satın alacaktır. Piyasada ayrı firmalara ait 4 aşı vardır ve idareci en etkin olanını seçmek istemektedir. Bunun için bir araştırma yaparak bütün aşıları uygulamış ve sonuçları şöyle bulmuştur. Aşılar arasında fark var mıdır 0,05 anlam düzeyinde test ediniz.

Aşı Korunan Korunmayan

1 82 41

2 70 24

3 45 20

4 48 42

Page 17: OLASILIK ve İSTATİSTİK II

ÇözümOLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

1. Adım : Hipotezlerin KurulmasıH0: Koruyuculuk yönünden aşılar arasında fark yoktur. H1: Koruyuculuk yönünden aşılar arasında fark vardır. 2. Adım: İstatistiksel Test İki sayısal olmayan değişken arasındaki ilişkinin varlığını araştıran bir test olan (ki-kare) bağımsızlık testi olmalıdır.3. Adım : Anlamlılık Düzeyinin Belirlenmesi = 0.054. Adım: H0’ın Red Bölgesinin Belirlenmesin: (4-1)*(2-1)=30,05 için;

Page 18: OLASILIK ve İSTATİSTİK II

ÇözümOLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

5. Adım: Test İstatistiğinin Hesaplanması

> olduğundan H0 hipotezi red edilecektir.

Page 19: OLASILIK ve İSTATİSTİK II

ÇözümOLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

Şimdi bu farklılığın hangi aşıdan kaynaklandığına bakılmalıdır. Bunun için en büyük değerine sahip olan dördüncü aşı analiz dışı bırakılarak, diğer üç aşı arasında fark olup olmadığına bakılır.

≤ olduğundan H0 hipotezi red edilemez.

Page 20: OLASILIK ve İSTATİSTİK II

Örnek OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

100 deney faresi iki gruba ayrılıyor. Birinci gruptaki 53 deney faresine bakteri ve daha sonra standart dozda anti serum veriliyor. İkinci gruptaki 47 fareye ise yalnız bakteri veriliyor. Belirli bir süre geçtikten sonra 81 fare canlı kalıyor. Bakteri ve anti serum verilen 8 fare ölüyor.%5 anlam düzeyinde farelerin ölümünün anti serum etkisinden bağımsız olup olmadığını araştırınız.

Page 21: OLASILIK ve İSTATİSTİK II

ÇözümOLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

H0: Fare ölümleri anti serum etkisinden bağımsızdır. H1: Fare ölümleri anti serum etkisinden bağımsız değildir.

(tablodan)

≤ olduğundan H0 hipotezi red edilemez. Yorum: Fare ölümlerinin anti serum etkisinden bağımsız olduğu %95 güvenilirlikle söylenebilir.

Page 22: OLASILIK ve İSTATİSTİK II

2- Ki-Kare Homojenlik TestiOLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

• Ki-kare homojenlik testi ana çizgileriyle iki ya da daha fazla bağımsız örneklemin, aynı ana kütleden seçilip seçilmediğinin araştırılmasında kullanılır.

• Testin uygulanması, ki-kare bağımsızlık testinde olduğu gibidir. • Yine nitel değişkenlerle ve aynı örneklem istatistiğiyle çalışır. • Ancak, dikkat edilmelidir ki, bağımsızlık testinde ele alınan değişkenler arasında

bir ilişkinin varlığı araştırılırken, homojenlik testinde iki ya da daha fazla bağımsız örneklemin aynı ana kütleden seçilip seçilmediği araştırılmaktadır.

Page 23: OLASILIK ve İSTATİSTİK II

Örnek 3OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

Bölgesel satış yapan bir üretim işletmesi, 2 yeni ürün geliştirerek piyasaya sürmüştür. Tüketicilerin bu ürünlerle ilgili görüşlerini (beğendikleri, beğenmedikleri ya da ilgisiz kaldıkları) belirlemek amacıyla, birinci ve ikinci ürünlerle ilgili olarak iki rassal örneklem oluşturulmuştur. İlk ürünle ilgili birinci örneklemde 100 tüketiciyle, ikinci ürünle ilgili ikinci örneklemde de 150 tüketiciyle görüşülmüştür. Veriler aşağıdaki tabloda belirtilmiştir. Seçilen örneklemlerin, aynı anakütleye ait olup olmadığını, %5 anlamlılık düzeyinde test ediniz. Tüketici görüşleri; fiyat, kalite, kolay ulaşabilme vb. gibi objektif ölçütlerle ve piyasadaki benzer ürünlerle mukayese sonucu oluşmuştur.

Page 24: OLASILIK ve İSTATİSTİK II

Çözüm 3OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

1. Adım: Hipotezlerin oluşturulması• H0: İki örneklem de aynı anakütleden seçilmiştir.• H1: Örneklemler farklı anakütleden seçilmiştir.2. Adım: İstatistiksel Test• İki örneklemin aynı anakütleden gelip gelmediği test edileceğinden, ilgili

test, ki-kare homojenlik testi olmalıdır.3. Adım: Anlamlılık Düzeyi• = 0.054. Adım: H0’ın ret bölgesinin belirlenmesi• Hesaplanan test istatistiği n = (2-1)*(3-1) = 2 serbestlik derecesi ve =

0.05 anlamlılık düzeyi için ki-kare tablosundan bulunan kritik değer,• = 5.99’dur.

Page 25: OLASILIK ve İSTATİSTİK II

Çözüm 3OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

5. Adım: test istatistiğinin hesaplanması• Hatırlanacağı gibi, test istatistiğinin hesaplanabilmesi için, öncelikle, beklenen

frekansların hesaplanması gerekir. • Homojenlik testinde de her hangi bir gözenin beklenen frekansı, bağımsızlık

testindeki gibi, ilgili gözenin yer aldığı satır toplam frekansıyla sütun toplam frekansı çarpılıp, genel toplam frekansına bölünerek elde edilir.

Test istatistiği: = (60–56)2/(56) + (30–32)2/(32) + (10–12)2/(12) + (80–84)2/(84) + (50-48)2/(48) + (20–18)2/(18) = 1.04 olarak elde edilir.

Page 26: OLASILIK ve İSTATİSTİK II

Çözüm 3OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

6. Adım: İstatistiksel karar• Hatırlanacağı gibi, ≤ ise H0 hipotezi kabul edilir. • Örneğimizde =1.04 ve = 5.99 olduğundan, H0 kabul edilecektir. • İlgili örneklemler aynı anakütleden seçilmiştir.

Page 27: OLASILIK ve İSTATİSTİK II

Örnek 4OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

Bir fabrika; A ve B olmak üzere iki farklı teknik uygulanarak üretilen ürünlerin yıpranma sürelerini (kısa sürede, orta sürede, uzun sürede) belirlemek amacıyla, bu ürünlerle ilgili iki rassal örneklem oluşturmuştur. A tekniğiyle üretilen ürünlerden seçilen örneklemde 60 ürün, B tekniğiyle üretilen ürünlerden seçilen örneklemde ise 80 ürün bulunmaktadır. Veriler aşağıdaki tabloda belirtilmiştir. Seçilen örneklemlerin aynı anakütleye ait olup olmadığını, %5 anlamlılık düzeyinde test ediniz.

Page 28: OLASILIK ve İSTATİSTİK II

Çözüm 4OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

1. Adım: Hipotezlerin oluşturulması• H0: İki örneklem de aynı anakütleden seçilmiştir.

• H1: Örneklemler farklı anakütlelerden seçilmiştir.2. Adım: İstatistiksel test• İki örneklemin aynı anakütleden gelip gelmediği test edileceğinden, ilgili test, ki-kare

homojenlik testi olmalıdır.3. Adım: Anlamlılık Düzeyi• = 0.054. Adım: H0’ın red bölgesinin belirlenmesi• Hesaplanan test istatistiği v = (3-1) (2-1) = 2 serbestlik derecesi ve = 0.05 anlamlılık

düzeyi için ki-kare tablosundan bulunan kritik değer = 5.99’dur.

Page 29: OLASILIK ve İSTATİSTİK II

Çözüm 4OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

5. Adım: test istatistiğinin hesaplanması• Kontenjans tablosu aşağıdaki gibidir:

Test istatistiği: = (30 - 33)2 / (33) + (30 - 27)2 / (27) + (45 - 44)2 / (44) + (35 - 36)2 / (36) + (35 - 33)2 / (33) + (25 - 27)2 /

(27) = 0.9olarak elde edilir. 6. Adım: İstatistiksel Karar• Hatırlanacağı gibi, ≤ ise H0 hipotezi kabul edilir. • = 0.9 ve = 5.99 olduğundan, H0 kabul edilecektir. • Sonuç: İlgili örneklemler aynı anakütleden seçilmiştir.

Page 30: OLASILIK ve İSTATİSTİK II

3- Ki-Kare Uygunluk TestiOLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

• Ki-kare uygunluk testinin esası, n birimlik bir örneklemin anakütleyi iyi temsil edip edemeyeceğini araştırmaktır.

• Bu testte, yine değişkeninin doğası gereği, gözlenen ve beklenen frekanslardan yararlanılır.

Page 31: OLASILIK ve İSTATİSTİK II

Örnek 5OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

Belirli bir bölgede, Z marka margarin kullanan aile oranı, 3/8 olarak öngörülmektedir. Her anketör, rassal olarak seçilen 5 aileyle görüşmek üzere, 200 anketör kullanılarak ilgili bölgede bir anket düzenlenmiş ve anket sonuçları aşağıdaki frekans dağılımıyla verilmiştir:

Elde edilen bu sonuçlar için,

formunda bir binom dağılımı öngörülmektedir. Öngörülen dağılımın, ele alınan problem için, uygun bir model olup olmadığını = 0.05 anlamlılık düzeyi için test ediniz.

Page 32: OLASILIK ve İSTATİSTİK II

Çözüm 5OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

1.Adım: Hipotezlerin OluşturulmasıH0= X rassal değişkeni, n=5 ve p=3/8 parametre değerleriyle binom dağılmıştır.H1= X rassal değişkeni, n=5 ve p=3/8 parametre değerleriyle binom dağılmamıştır.2. Adım: İstatistiksel Test uygunluk testi3. Adım: Anlamlılık Düzeyi= 0.05 4. Adım: H0 Red Bölgesinin Belirlenmesi Serbestlik Derecesi: Sınıf Sayısı - 3 Serbestlik Derecesi: 6-3=3 ve = 0.05 için;= 7,81

Page 33: OLASILIK ve İSTATİSTİK II

Çözüm 5OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

5. Adım: test istatistiğinin hesaplanmasıBeklenen frekansların ilgili sınıfa ilişkin olasılık toplam frekansın çarpımı olduğu hatırlanacak olursa ilgili olasılıklar aşağıdaki fonksiyon yardımıyla hesaplanır.

Beklenen frekansların hesaplamak için bu olasılıklar frekans toplamları ile çarpılır.

Page 34: OLASILIK ve İSTATİSTİK II

Çözüm 5OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

6.Adım: İstatistiksel Karar

≤ H0=KabulYorum: Eldeki frekans dağılımını n=5 ve p=3/8 için Binom dağılmış bir ana kütleden çekilmiş bir örneklemdir.

Page 35: OLASILIK ve İSTATİSTİK II

Örnek 6OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

Bir üniversitede ortak ders olarak tüm fakültelerde verilen İngilizce dersini alan ve başarılı olan öğrencilerden rassal olarak seçilen 150 öğrencinin fakültelere dağılımı aşağıda verilmiştir .Bu verilere göre fakülteler için İngilizce dersi başarısının aynı oranda olup olmadığını = 0.01 anlamlılık düzeyinde araştırınız.

Page 36: OLASILIK ve İSTATİSTİK II

Çözüm 6OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

1. Adım: Hipotezlerin oluşturulması• H0: Tüm fakülteler için İngilizce dersinin başarı oranları aynıdır. (İngilizce başarısında fakülteler

açısından farklılık yoktur)• H1: En az bir fakülte için İngilizce dersinin başarı oranı farklıdır. 2. Adım: İstatistiksel test• uygunluk (iyi uyum) testi 3. Adım: Anlamlılık Düzeyi• = 0.01 4. Adım: H0’ın red bölgesinin belirlenmesi• k sınıf sayısını belirtmek üzere, serbestlik derecesi v = k-1’den; 6 sınıf olduğu için 6 - 1 = 5

olarak belirlenir. 5 serbestlik derecesi ve = 0.01 anlamlılık düzeyi için kritik değeri, tablosundan 15.08 olarak bulunur.

Page 37: OLASILIK ve İSTATİSTİK II

Çözüm 6OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

• 5. Adım: Ki-kare istatistiğinin hesaplanması• Sıfır hipotezinde, tüm fakülteler için İngilizce dersinin başarı oranlarının aynı olduğu ileri sürüldüğü için, altı

farklı fakülte için genel oran 1 / 6 olacaktır. Dolayısıyla her bir fakülte için “beklenen frekans”=(frekans*olasılık)= 150.(1/6) = 25 olur.

• Bunun anlamı, fakülteler arasında başarı oranı açısından farklılık olmadığı ve her fakülteden 25 öğrencinin başarılı olmasının beklenmesidir.

6. Adım: İstatistiksel Karar= 2.8= 15.08 ≤ olduğundan H0 kabul edilecektir. Buna göre bu üniversitenin tüm fakülteleri için İngilizce dersinin başarı oranları arasında önemli bir farklılık yoktur.

Page 38: OLASILIK ve İSTATİSTİK II

ÖrnekOLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

Dairies would like to know whether the sales of milk are distributed uniformly over a year so they can plan for milk production and storage. A uniform distribution means that the frequencies are the same in all categories. In this situation, the producers are attempting to determine whether the amounts of milk sold are the same for each month of the year. They ascertain the number of gallons of milk sold by sampling one large supermarket each month during a year, obtaining the following data. Use .01 to test whether the data fit a uniform distribution.

Page 39: OLASILIK ve İSTATİSTİK II

ÖrnekOLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

STEP 1. The hypotheses follow. H0: The monthly figures for milk sales are uniformly distributed. Ha: The monthly figures for milk sales are not uniformly distributed. STEP 2. The statistical test used is

STEP 3. Alpha is .01. STEP 4. There are 12 categories and a uniform distribution is the expected distribution, so the degrees of freedom are k - 1 = 12 - 1 = 11 For = .01, the critical value is 𝝌𝒌𝟐 = 24.725. An observed chi-square value of more than 24.725 must be obtained to reject the null hypothesis. STEP 5. The data are given in the preceding table. STEP 6. The first step in calculating the test statistic is to determine the expected frequencies. The total for the expected frequencies must equal the total for the observed frequencies (18,447). If the frequencies are uniformly distributed, the same number of gallons of milk is expected to be sold each month. The expected monthly figure is;

The following table shows the observed frequencies, the expected frequencies, and the chi-square calculations for this problem.

Page 40: OLASILIK ve İSTATİSTİK II

ÖrnekOLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

.

STEP 7. The observed 2 value of 74.37 is greater than the critical table value of 𝝌𝒌𝟐 = 24.725, so the decision is to reject the null hypothesis. This problem provides enough evidence to indicate that the distribution of milk sales is not uniform.

Page 41: OLASILIK ve İSTATİSTİK II

ÖrnekOLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

Suppose a teller supervisor believes the distribution of random arrivals at a local bank is Poisson and sets out to test this hypothesis by gathering information. The following data represent a distribution of frequency of arrivals during 1-minute intervals at the bank. Use .05 to test these data in an effort to determine whether they are Poisson distributed.

Page 42: OLASILIK ve İSTATİSTİK II

ÖrnekOLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

STEP 1. The hypotheses follow. H0: The frequency distribution is Poisson. Ha: The frequency distribution is not Poisson. STEP 2. The appropriate statistical test for this problem is

STEP 3. Alpha is .05. STEP 4. The degrees of freedom are k - 2 = 6 - 1 - 1 = 4 because the expected distribution is Poisson. An extra degree of freedom is lost, because the value of lambda must be calculated by using the observed sample data. For = .05, the critical table value is 𝝌𝒌𝟐 = 9.4877. The decision rule is to reject the null hypothesis if the observed chi-square is greater than 𝝌𝒌𝟐 = 9.4877. STEP 5. To determine the expected frequencies, the supervisor must obtain the probability of each category of arrivals and then multiply each by the total of the observed frequencies. These probabilities are obtained by determining lambda and then using the Poisson table. As it is the mean of a Poisson distribution, lambda can be determined from the observed data by computing the mean of the data. In this case, the supervisor computes a weighted average by summing the product of number of arrivals and frequency of those arrivals and dividing that sum by the total number of observed frequencies.

Page 43: OLASILIK ve İSTATİSTİK II

ÖrnekOLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

With this value of lambda and the Poisson distribution table in Appendix A, the supervisor can determine the probabilities of the number of arrivals in each category. The expected probabilities are determined from Table A.3 by looking up the values of x = 0, 1, 2, 3, and 4 in the column under = 2.3, shown in the following table as expected probabilities. The probability for x 5 is determined by summing the probabilities for the values of x = 5, 6, 7, 8, and so on. Using these probabilities and the total of 84 from the observed data, the supervisor computes the expected frequencies by multiplying each expected probability by the total (84).

STEP 6. The supervisor uses these expected frequencies and the observed frequencies to compute the observed value of chi-square.

ACTION: STEP 7. The observed value of 1.74 is not greater than the critical chi-square value of 9.4877, so the supervisor’s decision is to not reject the null hypothesis. In other words, he fails to reject the hypothesis that the distribution of bank arrivals is Poisson. BUSINESS IMPLICATIONS: STEP 8. The supervisor can use the Poisson distribution as the basis for other types of analysis, such as queuing modeling. The following Minitab graph depicts the chi-square distribution, critical value, and computed value.

Page 44: OLASILIK ve İSTATİSTİK II

ÖrnekOLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

With this value of lambda and the Poisson distribution table in Appendix A, the supervisor can determine the probabilities of the number of arrivals in each category. The expected probabilities are determined from Table A.3 by looking up the values of x = 0, 1, 2, 3, and 4 in the column under = 2.3, shown in the following table as expected probabilities. The probability for x 5 is determined by summing the probabilities for the values of x = 5, 6, 7, 8, and so on. Using these probabilities and the total of 84 from the observed data, the supervisor computes the expected frequencies by multiplying each expected probability by the total (84).

STEP 6. The supervisor uses these expected frequencies and the observed frequencies to compute the observed value of chi-square.

ACTION: STEP 7. The observed value of 1.74 is not greater than the critical chi-square value of 9.4877, so the supervisor’s decision is to not reject the null hypothesis. In other words, he fails to reject the hypothesis that the distribution of bank arrivals is Poisson. BUSINESS IMPLICATIONS: STEP 8. The supervisor can use the Poisson distribution as the basis for other types of analysis, such as queuing modeling. The following Minitab graph depicts the chi-square distribution, critical value, and computed value.

Page 45: OLASILIK ve İSTATİSTİK II

Kontenjans KatsayısıOLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

• Ki-kare bağımsızlık testiyle iki değişken arasındaki ilişkinin varlığıyla ilgili karar verilebiliyordu. Oysa ki bazı hâllerde, iki değişken arasındaki ilişkinin kuvveti hakkında da bilgi sahibi olmak istenebilir.

• İşte kontenjans katsayısı R*C Kontenjans Tablolarından (r > 2 ve c > 2) hesaplanan değerinin gösterdiği ilişki düzeyini saptamak amacıyla kullanılan bir katsayıdır.

• İki değişken arasında bir ilişki bulunmuyorsa c = 0 değeri verir. • Buna karşılık iki değişken arasında en üst düzeydeki ilişki katsayısı her zaman 1

çıkmaz, 1’e çok yakın bir değer olur. c ile gösterilen kontenjans katsayısının formülü aşağıdaki gibidir.

Page 46: OLASILIK ve İSTATİSTİK II

Örnek 7OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

Yapılan bir araştırmada, Z ilinde yaşayanların gelir düzeyleri (düşük, orta, yüksek)ile kullandıkları araçların yakıt özellikleri (benzin, dizel, LPG) arasında anlamlı bir ilişki olup olmadığı incelenmek istenmiştir. Bu amaçla rassal olarak seçilen 200 kişiden elde edilen verilerle 0.01 anlamlılık düzeyinde ki-kare bağımsızlık testi yapılarak; değeri 42.93 olarak hesaplanmış ve söz konusu iki değişken arasında anlamlı bir ilişki olduğu sonucuna ulaşılmıştır. Şimdi kontenjans katsayısıyla bu ilişkinin derecesini araştıralım.

Page 47: OLASILIK ve İSTATİSTİK II

Çözüm 7OLASILIK ve İSTATİSTİK II

Dr. Berk AYVAZ İstanbul Ticaret Üniversitesi

• = 42.93 ve n = 200 olduğuna göre,

• Bu durumda, orta düzeyde bir ilişkinin olduğu konusunda

karar verilebilir.