Top Banner
MÜH 100 MÜH 100 İSTATİSTİK İSTATİSTİK Yrd. Doç. Dr. Veysel Gazi Yrd. Doç. Dr. Veysel Gazi TOBB Ekonomi ve Teknoloji TOBB Ekonomi ve Teknoloji Üniversitesi Üniversitesi Elektrik-Elektronik Mühendisliği Elektrik-Elektronik Mühendisliği Bölümü Bölümü
33

Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Feb 04, 2017

Download

Documents

trinhdang
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Page 1: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

MÜH 100MÜH 100

İSTATİSTİKİSTATİSTİK

Yrd. Doç. Dr. Veysel GaziYrd. Doç. Dr. Veysel GaziTOBB Ekonomi ve Teknoloji ÜniversitesiTOBB Ekonomi ve Teknoloji ÜniversitesiElektrik-Elektronik Mühendisliği BölümüElektrik-Elektronik Mühendisliği Bölümü

Page 2: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

AMAÇAMAÇ

• KitleKitle ve ve örneklemörneklem arasındaki farkı öğrenmekarasındaki farkı öğrenmek• Betimsel istatistiğiBetimsel istatistiği kullanmayı öğrenmek kullanmayı öğrenmek

(veri sıralaması, merkezsel eğilim ölçüleri, (veri sıralaması, merkezsel eğilim ölçüleri, dağılım ölçüleri, vs.)dağılım ölçüleri, vs.)

• HistogramHistogram çizme ve okumayı öğrenmekçizme ve okumayı öğrenmek• Normal dağılımıNormal dağılımı ve ve standart normal dağılımıstandart normal dağılımı

tanımlamaktanımlamak• Olasılık hesabı içinOlasılık hesabı için Z-tablolarıZ-tabloları kullanmakkullanmak

Page 3: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

İstatistikİstatistik• İstatistik olasılık kuramının yöntemlerine bağlı İstatistik olasılık kuramının yöntemlerine bağlı

bir daldır bir daldır - - betimsel (descriptive) istatistikbetimsel (descriptive) istatistik: : veri veri toplamak, toplamak,

düzenlemek, özetlemek, sunmak ve incelemekdüzenlemek, özetlemek, sunmak ve incelemek- tümevarımsal istatistik (statistical inference)tümevarımsal istatistik (statistical inference)::

- verilere dayanarak verilere dayanarak sonuçlar çıkarmaksonuçlar çıkarmak- sonuçlara dayanarak sonuçlara dayanarak kararlar almakkararlar almak

• mühendisler tarafından çok kullanılır mühendisler tarafından çok kullanılır ((meselamesela kalite kontrol içinkalite kontrol için))

Page 4: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Kitle ve ÖrneklemKitle ve Örneklem• Kitle (Kitle (PopulationPopulation)) – – üzerinde çalışılan tüm üzerinde çalışılan tüm

gruba yada istatistiksel sonuçların gruba yada istatistiksel sonuçların genişletileceği gruba kitle denirgenişletileceği gruba kitle denir – örnek:örnek: bütün sınıf, tüm ülke insanları, tüm kanser bütün sınıf, tüm ülke insanları, tüm kanser

hastalarıhastaları• Örneklem (Örneklem (SampleSample)) – – kitlenin bir alt kitlenin bir alt

kümesidirkümesidir– örnek: bir takım, rasgele seçilen bazı insanlarörnek: bir takım, rasgele seçilen bazı insanlar

• Bütün kitle hakkında sonuçlara varabilmek için Bütün kitle hakkında sonuçlara varabilmek için genelde örneklem kullanılırgenelde örneklem kullanılır..

Page 5: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Neden örneklem Neden örneklem kullanılır?kullanılır?• Kitle çok büyük olabilirKitle çok büyük olabilir

– dünyadaki tüm insanlardünyadaki tüm insanlar, , uzaydaki tüm yıldızlaruzaydaki tüm yıldızlar..• Kitleye ulaşmak imkansız olabilirKitleye ulaşmak imkansız olabilir

– tarih öncesi insanlarıtarih öncesi insanları• Kitleyi incelemek tehlikeli olabilirKitleyi incelemek tehlikeli olabilir

– araba enkazları/kazalarıaraba enkazları/kazaları, , patlamalarpatlamalar• Kitleyi ölçmek zor olabilirKitleyi ölçmek zor olabilir

– atomatomların alt parçacıklarıların alt parçacıkları• Ölçüm örneği kullanılmaz hale getiriyor olabilirÖlçüm örneği kullanılmaz hale getiriyor olabilir

– vidanın dayanma gücüvidanın dayanma gücü

Page 6: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Örnek:Örnek: • Sağındaki ve solundaki kişilerin Sağındaki ve solundaki kişilerin

yaşlarının ve kendi yaşının yaşlarının ve kendi yaşının ortalamasını alarak sınıf yaş ortalamasını alarak sınıf yaş ortalamasını tahmin et.ortalamasını tahmin et.

• Aldığın Aldığın 3 kişilik örneklem3 kişilik örneklem hangi hangi şartlarda sınıfı temsil etmez?şartlarda sınıfı temsil etmez?

Page 7: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Merkezsel Eğilim ÖlçüleriMerkezsel Eğilim Ölçüleri• Bir kitleyi (yada bir örneklemi) tek bir sayı ile Bir kitleyi (yada bir örneklemi) tek bir sayı ile

tanımlamak/betimlemek istersek ne tanımlamak/betimlemek istersek ne kullanırızkullanırız??

– Ortalama (Ortalama (MeanMean)) – aritmeti– aritmetik ortalamak ortalama – Mod (Mod (ModeMode)) – – en çok tekrarlanan (en sık en çok tekrarlanan (en sık

görülen) değergörülen) değer..– Ortanca/Medyan (Ortanca/Medyan (MedianMedian)) – – veri veri

kümesinin kümesinin ““ortaorta” ” değerideğeri..

Page 8: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Ortalama nedir?Ortalama nedir?

• Ortalama Ortalama verilerin toplamının veri verilerin toplamının veri sayısına bölümüdürsayısına bölümüdür..

Page 9: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Kitle OrtalamasıKitle Ortalaması

• μμ = kitle ortalamasıkitle ortalaması• xxii == verilerveriler

• NN == kitledeki tüm gözlemlerin sayısıkitledeki tüm gözlemlerin sayısı

N

iixN 1

1

Page 10: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Örneklem OrtalamasıÖrneklem Ortalaması

n

iixn

x1

1

• = = örneklem ortalamasıörneklem ortalaması• xxii == verilerveriler

• nn == örneklemdeki gözlemlerin sayısıörneklemdeki gözlemlerin sayısı

x

Page 11: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Ağırlıklı OrtalamaAğırlıklı Ortalama

k

iii

k

ii wnxw

nOA

11

burada ve1..

• Ağırlıkları w1,w2, …,wk, olan x1,x2, …, xk, verilerinin ağırlıklı ortalaması:

Page 12: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

ÖrnekÖrnekDersDers KredKred

iiNotNot Ağ. NotAğ. Not

Fiz 101Fiz 101 44 AA (4.0)AA (4.0) 16.016.0Kim 101Kim 101 44 BB (3.0)BB (3.0) 12.012.0Müh Müh 100100

22 BA (3.5)BA (3.5) 7.07.0

Mat 101Mat 101 44 CB (2.5)CB (2.5) 10.010.0Türk Türk 101101

22 CC (2.0)CC (2.0) 4.04.0

İng 101İng 101 22 DD DD (1.0)(1.0)

2.02.0

MAK MAK 101101

33 DC DC (1.5)(1.5)

4.54.5

ToplamToplam 2121 55.555.5

64.221

5.55.. OA

• Yandaki tabloda verilen ders ve notlar için ağırlıklı ortalama:

Page 13: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Mod Nedir?Mod Nedir?• modmod – – kesikli verilerde (yada kesikli aralıklara kesikli verilerde (yada kesikli aralıklara

gruplanmış verilerde) gruplanmış verilerde) en fazlaen fazla görülen değergörülen değer..

0

5

10

15

20

25

30

35

EE MAK BİL

Seri 1

Örnek: Örnek: MÜH100 MÜH100 dersini alan dersini alan öğrencilerin öğrencilerin çoğu EEM çoğu EEM bölümündenbölümünden..

Page 14: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Ortanca nedir?Ortanca nedir?• Ortanca (medyan)Ortanca (medyan) – – veriler sıralanmış olmalıveriler sıralanmış olmalı

– tek sayıda gözlem var ise ortanca orta tek sayıda gözlem var ise ortanca orta değerdirdeğerdir

– çift sayıda gözlem var ise ortanca iki orta çift sayıda gözlem var ise ortanca iki orta değerin ortalamasıdırdeğerin ortalamasıdır

• Verilerde Verilerde sapan değerlersapan değerler var ise var ise ortanca verileri ortalamadan daha iyi ortanca verileri ortalamadan daha iyi betimler.betimler. – Örnek: Şu an bu odadaki kişilerin yaş Örnek: Şu an bu odadaki kişilerin yaş

ortalamasıortalaması..

Page 15: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Dağılım ÖlçüleriDağılım Ölçüleri

• Verilerin merkeze göre dağılımı Verilerin merkeze göre dağılımı tanımlayan ölçülertanımlayan ölçüler– değişim aralığıdeğişim aralığı– ortalama mutlak sapmaortalama mutlak sapma– standart sapmastandart sapma – varyansvaryans

Page 16: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Değişim Aralığı Nedir?Değişim Aralığı Nedir?

• Değişim Aralığı (Değişim Aralığı (RangeRange)) – – en en büyük ve en küçük değerler büyük ve en küçük değerler arasındaki farkarasındaki fark..– Örnek: A üniversitesinin B bölümünün Örnek: A üniversitesinin B bölümünün

tavan puanı 361 ve taban puanı 349 isetavan puanı 361 ve taban puanı 349 ise.. •En düşük (En düşük (MinimumMinimum)) = = 349 puan349 puan •En yüksek (En yüksek (MaMaksksimumimum)) = = 361 puan361 puan•Değişim aralığı Değişim aralığı = = 361-349 = 12 puan361-349 = 12 puan

Page 17: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Ortalama Mutlak SapmaOrtalama Mutlak Sapma• Herhangi bir verinin ortalamadan sapmasıHerhangi bir verinin ortalamadan sapması

• Tüm sapmaların toplamı sıfırdırTüm sapmaların toplamı sıfırdır• Ortalama Mutlak Sapma (OMS)Ortalama Mutlak Sapma (OMS)

xxdxd iiii yada

||1 yada ||111

xxn

OMSxN

OMSn

ii

N

ii

Page 18: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Standart SapmaStandart Sapma•Kitle için

2

1

)(1

N

iixN

2

1

)()1(

1 xxn

sn

ii

Sapma

Varyans = 2

Varyans = s2

• Örneklem için

Page 19: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Standart SapmaStandart Sapma

•Verilerin dağılımı hakkında Verilerin dağılımı hakkında önemli bilgi vermektedirönemli bilgi vermektedir..

•Matematiksel analiz için OMS’den Matematiksel analiz için OMS’den daha uygun.daha uygun.

Page 20: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

ve s Farkıve s Farkı

•s (örneklem varyansı) s (örneklem varyansı) ‘nın (kitle ‘nın (kitle varyansının) bir tahminidir.varyansının) bir tahminidir.

•s’nin hesaplanmasında s’nin hesaplanmasında n-1n-1 kullanılır kullanılır ve bu daha iyi sonuç verir.ve bu daha iyi sonuç verir.

•Eğer Eğer nn büyük ise büyük ise nn ve ve n-1n-1 kullanımı kullanımı arasındaki fark önemsizdirarasındaki fark önemsizdir..

Page 21: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Önemli bir özellikÖnemli bir özellik

• Standart sapmayı Standart sapmayı Gauss Gauss 1700’lerde 1700’lerde yıldızların ölçülen konumlarındaki yıldızların ölçülen konumlarındaki gözlenen hataları açıklamak için icat gözlenen hataları açıklamak için icat etmişetmiş..

• Bugün ise kalite kontrolden finansal Bugün ise kalite kontrolden finansal risklerin ölçülmesi/hesaplanması’na risklerin ölçülmesi/hesaplanması’na kadar birçok yerde kullanılıyorkadar birçok yerde kullanılıyor..

Page 22: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Verilerin DüzenlenmesiVerilerin Düzenlenmesi• Bir gözlemde yada deneyde elde edilen verilere Bir gözlemde yada deneyde elde edilen verilere

ham veri (raw data)ham veri (raw data) denir. denir.• Veriler genelde incelemeden önce Veriler genelde incelemeden önce büyükten büyükten

küçüğe (yada tersi) sıralanır (sort edilir).küçüğe (yada tersi) sıralanır (sort edilir).• Sıralanmış veriler Sıralanmış veriler sınıflandırılırsınıflandırılır..• Sınıflar tüm verileri kapsayacak ve her veri sadece Sınıflar tüm verileri kapsayacak ve her veri sadece

bir sınıfa dahil olacak şekilde tanımlanır.bir sınıfa dahil olacak şekilde tanımlanır.• Her sınıftaki eleman sayısına Her sınıftaki eleman sayısına sınıf frekansısınıf frekansı denir. denir. • Veriler Veriler histogram histogram kullanarak grafiksel olarak kullanarak grafiksel olarak

gösterilebilir. gösterilebilir.

Page 23: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

ÖrnekÖrnek• Müh 100 dersinin notları aşağıdaki gibi olsunMüh 100 dersinin notları aşağıdaki gibi olsun50 54 54 60 55 73 74 5462 64 63 47 57 62 54 5862 50 62 59 47 74 51 5549 67 60 48 46 71 57 5952 65 49 46 69 53 66 7570 51 50 57 60 47 51 5358 57 56 69 53 59 47 4663 48 48 61 68 56 58 6460 37 49 66 62 51 59 5053 69 74 48 50 64 64 6053 65 65

Page 24: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

ÖrnekÖrnek• Notlar büyükten küçüğe sıralanır.Notlar büyükten küçüğe sıralanır.

– En yüksek not (maksimum) = 75En yüksek not (maksimum) = 75– En düşük not (minimum) = 37En düşük not (minimum) = 37– Not değişim aralığı = 75 – 37 = 38Not değişim aralığı = 75 – 37 = 38– Ortalama = 58’dir.Ortalama = 58’dir.– Ortanca 83 veri olduğundan 42’ci değerdir ve 57’dir.Ortanca 83 veri olduğundan 42’ci değerdir ve 57’dir.

• Sıralanmış notlar 9 sınıfa ayrılırSıralanmış notlar 9 sınıfa ayrılır– Sınıflar 35-39, 40-44,45-49,…,75-79’dırSınıflar 35-39, 40-44,45-49,…,75-79’dır– En fazla not 50-54 sınıfındadır – bu sınıf En fazla not 50-54 sınıfındadır – bu sınıf mod mod

sınıfıdırsınıfıdır..

Page 25: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

ÖrnekÖrnek

02468

101214161820

Seri 1

• Her sınıfın frekansına göre histogram çizersek.

Page 26: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Veri DağılımlarıVeri Dağılımları• Verinin Verinin ““şeklişekli” ” frekans histogramı ile frekans histogramı ile

anlaşılıranlaşılır..• Frekans histogramlarında genelde Frekans histogramlarında genelde oransal oransal

frekansfrekans (OF = sınıf frekansı/toplam (OF = sınıf frekansı/toplam frekans) kullanılır.frekans) kullanılır.

• Çoğunlukla veriler Çoğunlukla veriler ““çan-eğrisiçan-eğrisi” ” şeklinde bir şeklinde bir dağılım gösterirler ve bu tür dağılıma dağılım gösterirler ve bu tür dağılıma “normal” d“normal” dağılım (distribution)ağılım (distribution) denir denir..

• Gauss Gauss yıldızların konum hatalarının yıldızların konum hatalarının “normal” “normal” dağılım gösterdiğini gözledidağılım gösterdiğini gözledi..

Page 27: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Normal DağılımNormal Dağılım• NNormal dormal dağılım bazen ağılım bazen “Gauss” “Gauss”

dağılımı olarak da adlandırılırdağılımı olarak da adlandırılır..

22 /21

21OF

xe ortalama

x

OFOransal (Relative)Frekans

Page 28: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Standart Normal DağılımStandart Normal Dağılım

içiniçin / xz

2

21

21OF

ze

0.0

0.1

0.2

0.3

0.4

0.5

-4.0 -3.0 -2.0 -1.0 0.0 1.0 2.0 3.0 4.0

Alan = 1.00

Page 29: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Bilinmesi Gereken Bazı Bilinmesi Gereken Bazı ŞeylerŞeyler• z=-1 ve z=1 (x=-z=-1 ve z=1 (x=- ve x= ve x= arasındaki arasındaki

alan 0.6827’dır.alan 0.6827’dır.• z=-2 ve z=2 (x=-2z=-2 ve z=2 (x=-2 ve x=2 ve x=2 arasındaki arasındaki

alan 0.9545’dır.alan 0.9545’dır.• z=-3 ve z=3 (x=-3z=-3 ve z=3 (x=-3 ve x=3 ve x=3 arasındaki arasındaki

alan 0.9973’dır.alan 0.9973’dır.• z=-4 ve z=4 (x=-4z=-4 ve z=4 (x=-4 ve x=4 ve x=4 arasındaki arasındaki

alan pratik olarak 1.0’dır.alan pratik olarak 1.0’dır.

Page 30: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Bilinmesi Gereken Bazı Bilinmesi Gereken Bazı ŞeylerŞeyler• Normal eğrisinde orta değer alanı Normal eğrisinde orta değer alanı

%%5050’lik iki eşit bölgeye ayırır’lik iki eşit bölgeye ayırır..• NNormal dormal dağılımağılım eğrisi toplam eğrisi toplam 1.001.00

alana sahiptiralana sahiptir..• ““z-Tablz-Tablolarıoları” standar” standartt normal d normal dağılım ağılım

eğrisinin altındaki alanı gösterir ve z-eğrisinin altındaki alanı gösterir ve z-eksenindeki herhangi iki nokta eksenindeki herhangi iki nokta arasındaki alanı hesaplamak için arasındaki alanı hesaplamak için kullanılabilirkullanılabilir..

Page 31: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

Z-Tabloları Kullanarak Z-Tabloları Kullanarak Olasılık HesabıOlasılık Hesabı• ÖrnekÖrnek: : Kitabınızdaki Ek-C’deki Z-tablosunu Kitabınızdaki Ek-C’deki Z-tablosunu

kullanarak kullanarak z= -1.0 z= -1.0 veve z= 2.0 z= 2.05 arasındaki 5 arasındaki alanı bulunuz.alanı bulunuz.– TTablablodan:odan: z = 1.0 z = 1.0 için alan için alan = 0.3413 = 0.3413– SiSimetrmetriden dolayıiden dolayı z = -1.0, z = -1.0, için de alan için de alan = 0.3413 = 0.3413– TTablablodan:odan: z= 2.0 z= 2.05 için5 için, a, allaann = 0.47 = 0.479898– ToToplam alanplam alan = 0.3413 + 0.47 = 0.3413 + 0.479898 = 0.8 = 0.8211211 – ““KuyruklarınKuyrukların” ” alanıalanı = 1.0 - 0.8 = 1.0 - 0.821211 = 0.11 = 0.1789789

Page 32: Temel Kavramlar (sunu, kaynak:Yrd.Doç.Dr. Veysel Gazi)

ÖzetÖzet• Merkezsel ÖlçülerMerkezsel Ölçüler

– ortalamaortalama– modmod– ortancaortanca

• Dağılım ÖlçüleriDağılım Ölçüleri – değişim aralığıdeğişim aralığı– varvaryansyans– standarstandart sapmat sapma

• Normal DNormal Dağılımıağılımı