Top Banner
istatist ik
98

istatistik

Feb 16, 2016

Download

Documents

istatistik
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: istatistik

istatistik

Page 2: istatistik

Araştırma ve İstatistik Hakkında Ne Biliyoruz?

Page 3: istatistik

Konu Özeti

• İstatistik Nedir? • Neden İstatistik?• İnsanlar istatistiği ne zamandır

kullanıyorlar? • İstatistikte Bazı Temel Kavramlar• İstatistiksel Verileri Tasnif Etme• Korelasyon• Grafik Analizi

Page 4: istatistik

Herkes biraz istatistik bilmeli!

Page 5: istatistik

• Üniversite Oran(%)• Marmara 75• Balıkesir 85• Gazi 74•Niğde 100

Herkes biraz istatistik bilmeli!

Hangisi Başarılı?

Page 6: istatistik

Üniversite Sınava giren Kazanan Oran(%)•Marmara 60 45 75•Balıkesir 55 47 85•Gazi 62 46 74•Niğde 2 2 100

Herkes biraz istatistik bilmeli!

Hangisi Başarılı?

Page 7: istatistik

Lise Üniversiteye giren öğrenci sayısı

A 120B 90C 62

Herkes biraz istatistik bilmeli!

Hangisi Başarılı?

Page 8: istatistik

Lise Üniversiteye giren öğrenci sayısı

Sınava giren öğrenci sayısı

Oran(%)

B 90 210 42C 62 260 24A 120 630 19

Herkes biraz istatistik bilmeli!

Hangisi Başarılı?

Page 9: istatistik

Firma Kaza / yıl

A 20B 7

Hangi firmanın otobüsleri daha çok kaza yapıyor?

Herkes biraz istatistik bilmeli!

Page 10: istatistik

Firma Yolcu / gün Kaza / yıl Oran(%)A 500 20 4.0B 120 7 5.8

Hangi firmanın otobüsleri daha çok kaza yapıyor?

Herkes biraz istatistik bilmeli!

Page 11: istatistik

İstatistik Nedir?

Page 12: istatistik

İstatistik Nedir?

• İstatistik,İstatistik, belirli amaçlar için veri belirli amaçlar için veri toplama, toplanan verileri tasnif etme, toplama, toplanan verileri tasnif etme, çözümleme ve yorumlama bilimidir.çözümleme ve yorumlama bilimidir.

• İstatistik sayısal verileri değerlendiren İstatistik sayısal verileri değerlendiren bir bilim dalıbir bilim dalı

Page 13: istatistik

Neden İstatistik?

Page 14: istatistik

Neden İstatistik?İstatistik,İstatistik,

• Ne kadar?Ne kadar?• Ne zaman?Ne zaman?• Nerede?Nerede?• Nasıl?Nasıl?• Kaç tane?Kaç tane?• Hangi oranda?Hangi oranda?

Sorularına yanıt ararSorularına yanıt arar

Page 15: istatistik

İstatistik, çevremizde olup bitenleri sayılarla ifade etmede yardımcı

olur.

Page 16: istatistik

İnsanlar İstatistiği Ne zamandır Kullanıyorlar?

• 1445 - zar atma, şans oyunları1445 - zar atma, şans oyunları• 17.Yüzyıl ortaları, istatistik ilk kez ders 17.Yüzyıl ortaları, istatistik ilk kez ders

kitaplarına girdikitaplarına girdi

Page 17: istatistik

İstatistikte Bazı Temel Kavramlar

Page 18: istatistik

İstatistikte Bazı Temel kavramlar

• EvrenEvren– Gözlem alanına giren obje ya da Gözlem alanına giren obje ya da

bireylerin tümübireylerin tümü• ÖrneklemÖrneklem

– Bir evrenden seçilmiş daha küçük Bir evrenden seçilmiş daha küçük sayıdaki obje ya da bireylerin sayıdaki obje ya da bireylerin oluşturduğu grupoluşturduğu grup

Page 19: istatistik

İstatistikte Bazı Temel kavramlar• DeğişkenDeğişken

– Her gözleme göre farklı değerler alabilen Her gözleme göre farklı değerler alabilen objelere, özelliklere ya da durumlara denirobjelere, özelliklere ya da durumlara denir

• Değişkenler nicel ya da nitel olabilir.Değişkenler nicel ya da nitel olabilir.• Nitel verilerNitel veriler• Sayısal verilerSayısal veriler-kesikli sayısal veriler (maç kazanma syısı)-kesikli sayısal veriler (maç kazanma syısı)-sürekli sayısal veriler (boy, kilo)-sürekli sayısal veriler (boy, kilo)• Nitelik ve sayısal veriler arasındaki ilişki (boy Nitelik ve sayısal veriler arasındaki ilişki (boy

sınıflandırması)sınıflandırması)

Page 20: istatistik

İstatistikte Bazı Temel kavramlar

• ÖlçmeÖlçme– objelere ya da bireylere belirli bir değere objelere ya da bireylere belirli bir değere

sahip oluş derecelerini belirtmek için sahip oluş derecelerini belirtmek için sembolik değerler verme işlemidir.sembolik değerler verme işlemidir.

– Değişkenler hakkında bilgi edinmek için Değişkenler hakkında bilgi edinmek için yapılıryapılır

• ÖlçümÖlçüm– Ölçme sonucunda elde edilen değerÖlçme sonucunda elde edilen değer

Page 21: istatistik

İstatistikte Bazı Temel kavramlar

• Anlamlı rakamAnlamlı rakam

X=2.8

0 1 2 3 4 5 6

X=5.0

5 cm = 5,0cm

Page 22: istatistik

İstatistikte Bazı Temel kavramlar

• Sayıları yuvarlamaSayıları yuvarlama

5,387123 = 5,39 = 5,4 = 55,387123 = 5,39 = 5,4 = 5

Page 23: istatistik

22.04.23 23

Verilerin Sınıflandırılması

• 2,4,4,4,6,6,8,10,12,16,18• En büyük değerden en küçük değer

çıkarılarak veri aralığı tespit edilir. İstenen sınıf sayısına bölünerek

• 2-18=16/8=2 veri aralığı 2 dir. • 2-4• 5-7• 8-10

Page 24: istatistik

22.04.23 24

Frekans tablosu hazırlama

BÖLGE

35 22.7 22.7 22.759 38.3 38.3 61.013 8.4 8.4 69.514 9.1 9.1 78.618 11.7 11.7 90.37 4.5 4.5 94.88 5.2 5.2 100.0

154 100.0 100.0

akdenizegeic anadolumarmarakaradenizdogu anadoluguneydogu anadoluTotal

ValidFrequency Percent Valid Percent

CumulativePercent

Page 25: istatistik

Merkezi Eğilim Ölçüleri

Page 26: istatistik

İstatistikte Bazı Temel kavramlar

• Aritmetik OrtalamaAritmetik Ortalama• Aralık (range)Aralık (range)• SapmaSapma• Standart sapma Standart sapma • Ölçümlerin dağılımı ve standart Ölçümlerin dağılımı ve standart

sapma ile ilişkisisapma ile ilişkisi

Page 27: istatistik

İstatistikte Bazı Temel kavramlar

RangeDeğişken

Page 28: istatistik

İstatistikte Bazı Temel kavramlar

d1

Aritmetik ortalama

Sapma

d2

X= değerlerin toplamı/değer sayısı

Page 29: istatistik

22.04.23 29

Ağırlıklı ortalama

• İki eşit gurubun ortalamalarının ortalamasıdır.

• Geometrik ortalama

Page 30: istatistik

Standart sapma: • Bir dizi ölçümün gösterdiği değişimin en

güvenilir ölçüsüdür.

• Dağılım fazlaysa standart sapma büyük, dağılım dar alanda ise küçüktür.

• Standart Sapma istatistiksel analizde büyük önemi olan bir dağılma ölçüsüdür. "Kareli Ortalama Sapma" adı da verilen bu ölçü "değişkenlerin aritmetik ortalamadan sapmalarının kareli ortalaması"dır

Page 31: istatistik

Standart sapma: • Standart sapma /bütün elemanların

ortalamadan olan farklarının karelerinin toplamanının eleman sayısına bölümünün kareköküdür. şöyleki : 10,20,30 için ortalama 20 dir.

[ (10-20)nin karesi + (20-20)nin karesi + (30-20)nin karesi ] / 3(yani eleman sayisi)

ve yukarıdaki ifadenin karekökü..

ortalama değer

Page 32: istatistik

22.04.23 32

Ortanca (medyan)

• 50. yüzdeliğe ortanca denir. Denek sayısı tek sayılı değer ise n+1/2

• Çift ise n/2 nci ile n+2/2 nci değeri /2 dir.• Veriler büyükten küçüğe doğru sıralanır ortadaki

iki değerin aritmetik ortalaması alınır • 5,5,6,6,7,9,9, 7+1/2 • 5,5,6,6,7,9,9,10 8/2=4, 8+2/4=5• 6+7=13/2=6,5

Page 33: istatistik

22.04.23 33

Tepe değer (mod)

• Dağılımda en fazla tekrarlanan değerdir. • Frekansı en fazla olan sınıfın değeridir. • 5,5,6,6,6,7,9,9,10

Page 34: istatistik

Ölçme Sonucunun Gösterilmesi

X = 5,8 ± 0,25

X = 58 ± 0,2

X = 58.3 ± 2

Yanlış Gösterim

X = 58.3 ± 0.2 Doğru Gösterim

Page 35: istatistik

İstatistiksel Verileri Tasnif Etme

Page 36: istatistik

İstatistiksel Verileri Tasnif Etme

• İstatistiksel verileri anlamlı hale İstatistiksel verileri anlamlı hale getirmenin 5 ayrı yolu:getirmenin 5 ayrı yolu:

1. Sözel ifadelerle açıklama2. Tablolar halinde düzenleme3. Grafikle gösterme4. Verileri değerlendirerek istatistiksel ölçüler

bulma5. Bu yöntemlerde birkaçını birlikte uygulama

Page 37: istatistik

İstatistiksel Verileri Tasnif Etme

Verileri sözel ifadelerle açıklama

Page 38: istatistik

Verileri tablolar halinde düzenleme– Frekans tablosu

Denekler ağırlık( kg)

1 52,52 68,03 75,84 89,7

İstatistiksel Verileri Tasnif Etme

Page 39: istatistik

Verileri tablolar halinde düzenleme– Frekans tablosu

Puan Frekans Yüzde 50-60 1 2561-70 1 2571-80 1 2581-90 1 25

İstatistiksel Verileri Tasnif Etme

Page 40: istatistik

Verilerin grafikle gösterilmesi– Çizgi grafiği– Çubuk grafik (Histogram)– Pasta grafiği

İstatistiksel Verileri Tasnif Etme

Page 41: istatistik

Çizgi grafiği

İstatistiksel Verileri Tasnif Etme

Frek

ans

Puan

24681012

30 40 50 60 70 80 9040

Page 42: istatistik

Çubuk Grafik

İstatistiksel Verileri Tasnif Etme

Frek

ans

Puan

345678

30 40 50 60 70 80 9040

Page 43: istatistik

Çubuk Grafik

İstatistiksel Verileri Tasnif Etme

0

5

10

15

20

25

2000 2001 2002

TÜRKÇESOSYALMATEMATİKFEN

Çöz

ülen

net

sor

u sa

yısı

Yıllar

Page 44: istatistik

Pasta grafiği

İstatistiksel Verileri Tasnif Etme

36%

64%

Genel lise Meslek lisesi

Pasta grafiği, bir bütünün parçalarını karşılaştırmada kullanılır

Page 45: istatistik

2003 Üniversiteye yerleşme2003 Üniversiteye yerleşme

60%19%

10%

11%

YerleşemeyenAçık ÖğrÖnlisansLisans

İstatistiksel Verileri Tasnif Etme

Page 46: istatistik

Doğru Grafik Seçme

35%

65%

Genel Lise Meslek Lisesi

3565

0

50

100

Gen

elLi

se

Mes

lek

Lise

si

AB Ülkelerinde Genel Lise Meslek Lisesi Oranları

İkisi de olabilir. Birincisi daha uygun

Page 47: istatistik

Doğru Grafik Seçme

4,6

9,4

8,3

6,5

DünyaAvrupa 15'lerDoğu AvrupaTürkiye

6,5

8,39,4

4,6

0

2

4

6

8

10

Dün

ya

Avr

upa

15'le

r

Doğ

uA

vrup

a

Türk

iye

Ülkelere Göre Eğitim Yaşı

Doğru Yanlış

Page 48: istatistik

Doğru Grafik Seçme

Yıllara göre okul yaşı

2,7 3,23,8

4,8

6,8

0

2

4

6

8

1975 1980 1985 1990 2000

2,7

3,2

3,84,8

6,8

19751980198519902000

Doğru Yanlış

Page 49: istatistik

22.04.23 49

ödev

• Bir gurup sporcunun ağırlık değerleri aşağıda verilmiştir.

• 55,56,60,65,65,67,68,70,75,77,80,82,84,86,88,90,92,95,97,100 n=20

Page 50: istatistik

İstatistiksel verileri açıklamada daima en etkili olanı kullanılmalıdır

Page 51: istatistik

Türkiye, kızların okullaşma oranında İran ve Mısır’dan da sonra geliyor

69 70

45

0

20

40

60

80

İran Mısır Türkiye

Kızların okullaşma oranı ve Türkiye

Page 52: istatistik

22.04.23 52

İki gurubun sınıflandırması

• Sporcuların kuvvet değerleri• Erkek: 10,10,20,20,20,30,30,30,50,40• Bayan: 5,5,10,20,20,20,30,30,40,40,

Page 53: istatistik

22.04.23 53

Veri sınıflandırması Erkek: 10,10,20,20,20,30,30,30,50,40

Bayan: 5,5,10,20,20,20,30,30,40,40 Veri aralıkları Bayan

F %ErkekF %

5-1011-1516-2021-2526-3031-3536-4041-4546-50

Page 54: istatistik

22.04.23 54

Basit tablolaştırma

Değişkenler N X ss min maxErkek 10 26,00 12,64 10 50

Bayan 10 22,00 12,95 5 40

Page 55: istatistik

22.04.23 55

yada

Değişkenler N X ± SS(kg) Min (kg) Max(kg)Erkek 10 26,00 ±12,64 10 50

Bayan 10 22,00 ±12,95 5 40

Page 56: istatistik

22.04.23 56

Grafik seçenekleri

kuvvet değerleri

20

21

22

23

24

25

26

27

erkek bayan

Seri 1

Page 57: istatistik

NORMAL DAĞILIM NEDIR

– İstatistik analiz yapılırken, dağılımın özelliği çok önemlidir.

– Çünkü farklı dağılım gösteren verilere uygulanacak tanımlayıcı ve analitik istatistik yöntemleri de farklıdır.

– Parametrik testlerin uygulanabilmesi için, dağılımın normal ya da normale yakın olması gerekir.

Page 58: istatistik

• Standart sapması• Frekans eğrisi çan şeklinde olan simetrik

dağılımdır. • Normal dağılım simetrik olduğu için,

normal dağılım gösteren değişkenlerin ortalama, ortanca ve modları eşittir

Normal dağılım,

Page 59: istatistik
Page 60: istatistik

• Dağılım şekli ölçütleri :  Çarpıklık –1 ve +1 arasında yer alır.

• Denekler ortalamadan daha büyük değerlerde toplanıyorsa, negatif basık ya da soldan basık,

• Küçük değerlerde toplanıyorsa pozitif basık ya da sağdan basık dağılımdan söz edilir.

Page 61: istatistik

Dağılım özelliğinin önemi nedir

• Parametrik testlerin tümünün uygulanabilmesi için gereken varsayımların başında verilerin dağılımının normal olması gelir. Normal dağılımdan gelmeyen ölçümler kullanıldığında, gerçekte olduğundan daha küçük bir p değeri ya da daha dar bir güven aralığı hesaplanır.

• Bu durumda, doğru bir hipotezi reddetme olasılığı artar. Yani, iki grup arasında fark olmadığı halde fark varmış gibi sonuç elde edilebilir

Page 62: istatistik

NORMAL DAĞILIMIN KRİTERLERİ

• Dağılımın normal olup olmadığı grafik ve istatistik analiz yöntemleri ile anlaşılır.

• Histogram, dal ve yaprak grafiği ve normal olasılık grafiği çizilerek dağılımın normal olup olmadığı hakkında fikir edinilebilir.

Page 63: istatistik

• Ama bu izlenimin istatistik yöntemlerle de test edilmesi gerekir. Shapiro-Wilks (n<30) ve Lilliefors (n>30) kolmagorw simirnov. Yada shefi testleri bu amaçla sıklıkla kullanılan testlerdir. Bu testlerde p değeri <0.05 ise dağılımın normal olmadığı sonucuna varılır.

Page 64: istatistik

• Örneklem büyüklüğü arttıkça, deneklerin dağılımı ve ortalamanın örneklem dağılımı normal dağılıma yaklaşır.

• Genellikle bir örneklemde 30 ya da daha fazla sayıda denek varsa, evren normal dağılım göstermiyorsa bile, ortalamanın örneklem dağılımının normal olduğu varsayılabilir

Page 65: istatistik

Verilerin normal dağılmadığı durumlarda iki işlem yapılabilir :

1.      Verilere dönüşüm uygulayarak, onların normal dağılıma uymalarını sağlamak.

2.      Varolan verilere parametrik olmayan bir test uygulamak

Page 66: istatistik

KESTİRİM

• Bilimsel çalışmaların amacı, örneklem değerinden evren değerlerinin kestirilmesidir. Evren parametrelerinin kestirilmesi için ya güven aralığı ve sınırları ya da hipotez testleri kullanılır

Page 67: istatistik

• Güven aralığı ve güven sınırları : Belirli bir olasılıkla, bilinmeyen evren değerini içeren değerler aralığıdır.

• Sıklıkla %95, bazen de %90 ve %99 güven sınırları kullanılmaktadır.

Page 68: istatistik

Hipotez testleri :

• Farklılık olmadığının varsayıldığı hipoteze, yokluk hipotezi, farksızlık hipotezi, sıfır hipotezi, başlangıç hipotezi adı verilir ve Ho ile gösterilir.

• H1 ile gösterilen alternatif hipotez  adı verilen hipotez ise, Ho hipotezinin tam tersidir.

Page 69: istatistik

P değeri ve yanılma düzeyi  :

• Ho hipotezinin reddedilmesi için hesaplanan olasılığın %5 ya da daha az olması genellikle kabul edilen sınırdır; yani Ho hipotezinin doğruluğu için hesaplanan olasılık %5 ya da daha küçükse, bu hipotezin kabul edilemeyeceği yargısına varılır

Page 70: istatistik

• Parametrik ve nonparametrik testler : Istatistiksel analiz yapılmadan önce, verilerin kategorik (nominal, ordinal) ya da sürekli (aralıklı, oransal) olup olmadığına bakılmalıdır.

• Kategorik verilerde parametrik olmayan isatistikler kullanılırken, sürekli verilerde ise parametrik istatistikler kullanılır

Page 71: istatistik

22.04.23 71

Testler

Parametrik Parametrik olmayan

İki ortalama arasındaki farkın anlamlılık testi t. test

Mann-Witney U testi

Tek yönlü varyans analizi (f testi) Kruskal-Wallis varyans analizi

İki eş arasındaki farkın anlamlılık testi (t test)

Wilcoxon eşleştirilmiş iki örnek testi

Tekrarlı ölçümlerde varyans analizi (f testi)

4 gözlü Ki-Kare testi

Bağımlı örneklerde iki yüzde rasındaki farkın anlamlılk testi ( z testi)

Bağımlı örneklerde ki-kare testi (McNemer testi)

Page 72: istatistik

22.04.23 72

Bağımlı gurup- bağımsız gurup kavramı

• Bağımlı gurup: bir gözlem (denek) üzerinde birden çok gözlem yapıldığında guruplar bağımlı olur

• Bağımsız gurup: bir gurupta bulunan gözlem (birey ) diğer gurpta bulunmuyorsa gurup bağımsız olur.

Page 73: istatistik

22.04.23 73

TESTLER

Page 74: istatistik

22.04.23 74

BAĞIMSIZ İKİ GURUBUN KARŞILAŞTIRILMASI

• İki ortalama arasındaki farkın anlamlılık testi• T. Testi • Gerekli koşullar1.Karşılaştırılacak iki gurup vardır2. Guruplar birbirinden bağımsızdır3. Veriler sürekli veri gurubundadır4: evren dağılımları normal dağılım gösterir5. Evren varyansları eşitti.

Page 75: istatistik

22.04.23 75

Mann-Witney U testi

• İki ortalama arasındaki farkın anlamlılık testinin nonparametrik karşılığıdır.

• Parametrik koşulları sağlanmadığı durumda kullanılır

Page 76: istatistik

22.04.23 76

Bağımsız ikiden çok gurubun karşılaştırılması

• Tek yönlü varyans analizi • İkiden çok bağımsız gurup olduğunda ve

parametrik koşullar sağlandığında uygulanır.

• Nanparametdrik karşılığı Kruscal-Wallis varyans analizidir.

Page 77: istatistik

22.04.23 77

Varyans analizinde farkın kaynaklandığı gurubu belirleme

• Varyans analizinde guruplar arasındaki farkın hangi gurup yada guruplardan kaynaklandığını belirlemede

• 1. duncan yöntemi• Tukey HSD yöntemi• Dunnet yöntemi• Student nevman-Keuls Yöntemi kullanılır

Page 78: istatistik

22.04.23 78

BAĞIMLI İKİ GURUBUN KARŞILAŞTIRILMASI

• İKİ EŞ ARASINDAKİ FARKIN ANLAMLILIK TESTİ

SAYFA 149………….

Page 79: istatistik

Korelasyon

Page 80: istatistik

• Korelasyon:Korelasyon: iki değişken arasında iki değişken arasında bağıntı olup olmadığını araştırmabağıntı olup olmadığını araştırma

• Korelasyon katsayısı – r -

• Regrasyon analizi: bağıntının türünü : bağıntının türünü bulma bulma

Korelasyon

Page 81: istatistik

Korelasyon

Matematik Notları

Fizi

k N

otla

Page 82: istatistik

Korelasyon

Kişi başına gelir

Ort

alam

a öm

ür

Page 83: istatistik

Korelasyon kararı için bir-kaç veri yeter mi?

Ülke nüfusu

Ort

alam

a öm

ür

Page 84: istatistik

Korelasyon kararı için bir-kaç veri yeter mi?

Ülke nüfusu

Ort

alam

a öm

ür

Page 85: istatistik

Korelasyon var mı?

Matematik Notları

Res

im N

otla

Page 86: istatistik

Korelasyon var mı?

Frekans r*5 0,878

10 0,63215 0,51420 0,44430 0,36140 0,312

Korelasyon katsayısı r = 1 ise bağıntı var, r = 0 ise yok.

Page 87: istatistik

Grafik Analizi

Page 88: istatistik

• Basit korelasyon işlemlerinde kullanılır.Basit korelasyon işlemlerinde kullanılır.

• Grafik çizimi işlem sırası:Grafik çizimi işlem sırası:– Eksenlerin belirlenmesi

– Uygun ölçek seçimi

– Verilerin yerleştirilmesi

– Lineer grafik elde edilmesi

– Eğim bulunması

Grafik Analizi

Page 89: istatistik

Eksenlerin belirlenmesi

Serbest değişken (birim)

Bağ

lı de

ğişk

en(b

irim

)

Page 90: istatistik

Ölçek Seçimi

Hacim

Küt

le

Her iki ölçek uygun değil

Page 91: istatistik

Ölçek Seçimi

Hacim

Küt

le

Y ölçeği uygun değil

Page 92: istatistik

Ölçek Seçimi

X ölçeği uygun değil

Hacim

Küt

le

Page 93: istatistik

Ölçek Seçimi

Hacim

Küt

le

Uygun ölçek seçimi

Page 94: istatistik

Doğru çizimi

Hacim

Küt

le Doğru çizim

Yanlış çizim

Page 95: istatistik

Doğru çizimi

Hacim

Küt

leYanlış ç

izim

Yanlış çizim

Doğru çizim

Page 96: istatistik

Eğim Bulunması

Zaman

Hız

Eğim= Hız/zaman = Tan!

Dikkat!

Page 97: istatistik

Kaynaklar

• Fiziksel Ölçmeler ve Değerlendirmesi, İ.Eşme• İstatistik Yöntemler ve Uygulaması, H.Arıcı

Page 98: istatistik

Teşekkürler