1
Bölüm 3
Tanımlayıcı İstatistikler
2
Tanımlayıcı İstatistikler
• Bir veri setini tanımak veya birden fazla veri setini
karşılaştırmak için kullanılan ve ayrıca örnek
verilerinden hareket ile frekans dağılışlarını sayısal
olarak özetleyen değerlere tanımlayıcı istatistikler
denir.
• Analizlerde kullanılan veri tiplerine (basit,
gruplanmış, sınıflanmış) göre hesaplamalarda
kullanılacak formüller değişmektedir.
3
Tanımlayıcı İstatistikler
Yer Ölçüleri
1)Aritmetik ort.
2)Geometrik ort.
3)Harmonik ort.
4)Mod
5)Medyan
6)Kartiller
Değişkenlik Ölçüleri
1) Range
(Değişim Aralığı)
2) Ort. Mutlak sapma
3) Varyans
4) Standart Sapma
5) Değişkenlik(Varyasyon)
Katsayısı
Çarpıklık Ölçüleri
1)Pearson Asimetri Ölçüsü
2)Bowley Asimetri Ölçüsü
Basıklık
Ölçüleri
4
Yer Ölçüleri
• Yer ölçüsünü belirlemek amacıyla veri
analizini yapacak kişi, öncelikle veri seti
için hangi ölçüyü kullanması gerektiğine
karar vermelidir.
5
Tanım
Merkezi Eğilim Ölçüsü
Veri setinin orta noktası veya merkezinin değeridir.
6
Yer Ölçüleri
Hesaplama tüm verilerin
kullanıldığı ölçüler
-Aritmetik Ort.
-Ağırlıklı Arit. Ort.
-Geometrik Ort.
-Harmonik Ort.
Hesaplama tüm verilerin
kullanılmadığı ölçüler
-Mod
-Medyan
-Kartil
7
1) Aritmetik Ortalama
• Üzerinde inceleme yapılan veri setindeki elemanların toplanıp incelenen eleman sayısına bölünmesiyle elde edilen yer ölçüsüne aritmetik ortalama denir.
• Örnek:
– Sınav notlarının ortalaması,
– Yaz aylarında m2’ye düşen ortalama yağış miktarı
8
Örnek Ortalaması ve Anakütle Ortalaması
µ, “mü” şeklinde telaffuz edilir ve anakütle
ortalamasıdır
x = n
x , x-bar şeklinde telaffuz edilir ve örneklemin ortala
masıdır.
x
N µ =
x
9
Bir Denge Noktası Olarak
Ortalama
• 1, 14, 19, 31, 50 sayılarının ortalaması =23 tür.
Şekil sayıları bir çizgi üzerinde yerleştirilmiş eşit
küçük ağırlıklar şeklinde gösterir.1,14,19,31,50
• Aritmetik ortalama denge noktasıdır.
1 14 19 31 50
10
Eğer çizgiyi üzerinde ağırlıklar olan bir tahta
olarak düşünürsek, tahtayı dengede tutmak için
’nün bulunduğu yerden denge noktası
koymalıyız. Bu aritmetik denge noktasının özelliği;
her bir sayı için xi- ‘yü hesaplarsak pozitif ve
negatif sayılar dengede kalır çünkü toplamları 0
olur.
Herhangi bir veri seti için,
0)( ix
olur.
i
x uzaklığı
i
x
i
x
Örnek: İzmir ilinde ilköğretim ikinci sınıfta okuyan
öğrenciler üzerinde yapılan bir araştırmada rasgele
8 öğrenci seçilmiş ve ailenizde kaç çocuk vardır
sorusuna aşağıdaki gibi cevap vermişlerdir. Ailelerin
çocuk sayılarının ortalamasını hesaplayınız.
1,3,2,1,4,5,6,2
n = 8 i = 1,2,…,8
1 1 1 2 2 3 4 5 63
8
n
i
i
x
xn
Basit Veriler için Aritmetik Ortalama Örneği
Gruplanmış Veriler İçin
Aritmetik Ortalama
nfk
ii
1
k
ii
k
iii
f
fxx
1
1
f : frekans
k: grup sayısı
i = 1,2,3,……….,k
Örnek: Bir otomobil bayisinde 80 gün boyunca yapılan inceleme sonucunda satılan arabaların adetlerine göre dağılımı yandaki tabloda verilmiştir. Buna göre bir gün içinde satılan ortalama araba sayısını hesaplayınız.
1
1
0 12 70 42 32 30 1862,33
80 80
k
i i
ik
i
i
x f
x
f
Araba
(xi)
Gün (fi) xi.fi
0 5 0
1 12 12
2 35 70
3 14 42
4 8 32
5 6 30
∑fi=80
14
Sınıflanmış Veriler İçin Aritmetik
Ortalama
nfk
ii
1
k
ii
k
iii
f
fmx
1
1
f : frekans
k : sınıf sayısı
i = 1,2,3,……….,k
m : sınıf orta noktası
• Sınıflanmış verilerde her bir sınıf içindeki değerlerin neler
olduğu bilinmediğinden dolayı ve yalnızca her bir sınıfın
frekans değerleri bilindiğinden dolayı sınıfı temsil etmek
üzere sınıf orta noktaları hesaplamada kullanılır.
• Kullanılan formül gruplanmış veriler için kullanılan
formüle benzerdir.
Örnek: Bir sınıftaki öğrencilerin boyları hakkında bir araştırma
yapılmaktadır. Bu amaçla 50 öğrencinin boyları ölçülerek
kaydedilmiştir.Öğrencilerin boylarının aritmetik ortalamasını
hesaplayınız.
Sınıflar fi mi mifi
150-157’den az 5 153,5 767,5 157-164’den az 7 160,5 1123,5
164-171’den az 14 167,5 2345 171-178’den az 9 174,5 1570,5 178-185’den az 8 181,5 1452 185-192’den az 4 188,5 754 192-199’dan az 3 195,5 586,5
Toplam 50 8599
1
1
153,5(5) 160,5(7) ... 195,5(3) 8599171,98 .
50 50
k
i i
i
k
i
i
m f
x cm
f
16
Aritmetik Ortalama
0.1 xnxnxxxx
Aritmetik ortalamadan sapmaların toplamı sıfırdır.
min.22 xx
3. Örnek değerlerinde meydana gelen değişim çok küçük de olsa aritmetik
ortalama bu değişimden etkilenir. Verilerin tümünün bir fonksiyonudur.
17
Aritmetik Ortalama
4. Örnek gözlemlerin tümü a gibi bir sabit ile çarpılırsa bu yeni veri setinin
aritmetik ortalaması da eski veri setinin aritmetik ortalamasının a ile çarpımı
kadar değişir.
5. Örnek gözlemlerin tümü a gibi bir sabit ile toplanırsa bu yeni veri setinin
aritmetik ortalaması da eski veri setinin aritmetik ortalamasının a ile toplamı
kadar değişir.
6. Aritmetik ortalama tüm verileri hesaplama fonksiyonu içinde kullanması
nedeni ile güçlü bir istatistiktir.
7. Aritmetik ortalama verilerdeki uç değerlerden etkilenmesi ise bu
istatistiğin zayıf yönünü oluşturur.
18
Ağırlıklı Aritmetik Ortalama
Veri setindeki gözlemlerin belirli bir kritere göre
ağırlıklandırılması durumunda veri setinin ortalamasının
hesaplanması için kullanılan ortalamadır.
i i
w
i
w xx
w
19
Ağırlıklı Aritmetik Ortalama
• Gözlemler belli bir kritere göre
ağırlıklandırılmış ise ağırlıklı aritmetik
ortalama kullanılır. Ağırlıklı aritmetik
ortalama kullanılırken tüm gözlemlerin
ağırlıkları eşit ise aritmetik ortalama ile
aynı sonucu verir.
• İktisadi ve İdari Bilimler Fakültesi İşletme
Bölümü’ndeki birinci sınıf öğrencisinin güz
döneminde aldığı dersler, başarı notları, başarı
notlarının katsayıları ve kredi değerleri aşağıda
verilmiştir:
Öğrencinin dönem not ortalamasını katsayı
cinsinden hesaplayınız.
20
21
22
2) Geometrik Ortalama
• Bir veri setinde bulunan n adet elemanın çarpımının n nci dereceden kökünün alınmasıyla elde edilen yer ölçüsüdür.
nnxxxG ....21
• Geometrik ortalamanın formülüne bakıldığında hesaplama zorluğu olduğundan dolayı logaritma ifadesi kullanılır. Genellikle basit veriler için kullanışlı olup negatif sayılar için kullanışlı değildir.
n
x
GLog
n
i
i 1
log
n
i
ixn
antiG1
log1
log
Geometrik Ortalama’nın
Kullanım Alanları
• Ortalama oranları,
• Değişim Oranları,
• Logaritmik dağılış gösteren veri setleri,
için kullanışlıdır.
Örnek: fiyat indeksleri, faiz formülleri.
24
Geometrik Ortalama
3. Uç değerlerden aritmetik ortalama kadar
etkilenmez.
xG 2.
olmalıl0.1
ix
Örnek: Abac şirketinin yıldan-yıla olan fuel deki
tüketim harcamalarının değişimi yüzde -5, 10, 20, 40,
ve 60. büyüme faktörlerinin geometrik ortalamasını
kullanarak harcamalardaki ortalama yıllık yüzde
değişim belirlenir. Büyüme faktörleri için yüzde
değişim dönüştürme ile elde edilenler;
0.95 1.10 1.20 1.40 1.60
51 2
5
.... (0,95)(1,10)(1,20)(1,40)(1,60)
2.80896 1,229
nnG x x x
1
log0,022276 0,041393 0,079181 0,146128 0,204120
5
0,4485460,08971
5
n
i
i
x
Log Gn
Log G
G = anti log 0,27045 = 100,08971 ≈ 1,229
27
3) Harmonik Ortalama
• Bir veri setinde bulunan n adet elemanın çarpma işlemine göre terslerinin ortalamasının tersinin alınmasıyla elde edilen yer ölçüsüdür. Genellikle basit veriler için kullanışlıdır.
nnxxx
n
n
xxx
H1
....111
....11
1
2121
n
x
H
n
i i
1
1
1
28
Harmonik Ortalama’nın Kullanım Alanları
Zaman verileri için kullanışlıdır.
Örnek: Zaman birimi başına hız, para birimi başına satın alınan birim sayısı.
Belirli koşullar ve fiyat tipleri için zaman verilerinin
ortalamalarının hesaplanmasında kullanılan bir yer
ölçüsüdür.
Zamana bağlı hız, fiyat verimlilik gibi oransal olarak
ifade edilebilen verilerin ortalamasın alınmasında da
kullanılabilir.
NOT: ARİTMETİK ORT. > GEOMETRİK ORT. > HARMONİK ORT.
29
Örnek: Bir tekstil fabrikasında çalışan dört kişinin bir
pantolonu ütüleme süreleri aşağıda verilmiştir. Buna göre
bu fabrikada bir pantolon ortalama kaç dakikada ütülenir?
İşçi 1: 10 dk. İşçi 2: 6 dk. İşçi 3: 4 dk. İşçi 4 : 5 dk.
240
43
4
10
1
6
1
5
1
4
11
1 1
n
x
H
n
i i
.58,543
240dkH
• Örnek: A ve B gibi iki şehir arasında 100km lik bir yol vardır.
Bir otomobilli yolun ilk yarısını 30 km/saat hızla gidiyor. Diğer
yarısını 40 km/saat hızla gidiyor. Hız ortalaması nedir?
30
• Bir hızlı tren gittiği
mesafesinin ilk üçte
birinde 300km/s, ikinci
üçte birinde 450 km/s ve
son üçte birinde 360 km/s
hız yapmıştır. Buna göre
aracın ortalama hızı ne
olmuştur.
31
32
4) Mod
• Bir veri setinde en çok gözlenen ( en çok tekrar eden ) değere veya frekansı en fazla olan şans değişkeni değerine mod adı verilir.
• Veri setinin modu olmayacağı gibi birden fazla da modu olabilir.
• Mod genellikle kesikli şans değişkenli için oluşturulan gruplanmış verilerde aritmetik ortalama yerine kullanılabilir.
33
Mod
• Mod, büyük veri setlerinde verinin daha çok nerede
toplandığını bulmak için kullanılır. Örneğin erkek
kıyafetleri satan bir perakendeci, potansiyel
müşterilerini belirlemek için gömlek kol uzunluğu ve
gömlek yaka ölçüsüyle ilgilenebilir.
34
1) 5,40 1,10 0,42 0,73 0,48 1,10
2) 27 27 27 55 55 55 88 88 99
3) 1 2 3 6 7 8 9 10
Örnekler
Modu 1,10
1 den fazla moda
sahip , 27 ve 55
Modu yok
35
Gruplanmış Veriler İçin Mod
Basit verilerde bulunduğu gibi hesaplanır.
Örnek: Bir gömlek bayisinde 80 gün boyunca yapılan inceleme sonucunda satılan gömleklerin adetlerine göre dağılımı yandaki tabloda verilmiştir. Buna göre gömlek satışları için mod değeri nedir?
Gömlek
bedeni(xi)
Satış adedi (fi)
0 5
1 12
2 35
3 14
4 8
5 6
En yüksek frekansa sahip olan gözlem değeri 2
olduğundan dolayı gömlek satışları için mod değeri 2’dir.
36
Sınıflanmış Veriler İçin Mod
• Sınıflanmış verilerde mod değeri hesaplanırken ilk olarak
mod sınıfı belirlenir.
• Mod sınıfı frekansı en yüksek olan sınıftır.
• Mod sınıfı belirlendikten sonra bu sınıf içerisinde yer alan
modun tam değeri sınıf frekansı ve kendine komşu olan
sınıf frekansları dikkate alınarak hesaplanır.
37
iL .21
1mod
= Mod Sınıfı Aralığının Alt Sınırı
1 = Mod Sınıfı Frekansı - Kendinden Bir Önceki
Sınıf Frekansı
2 = Mod Sınıfı Frekansı – Kendinden Bir Sonraki
Sınıf Frekansı
i = Mod Sınıfının Sınıf Aralığı
Mod =
ModL
Örnek: Bir sınıftaki öğrencilerin boyları hakkında bir araştırma
yapılmaktadır. Bu amaçla 50 öğrencinin boyları ölçülerek
kaydedilmiştir.Öğrencilerin boylarının mod değerini hesaplayınız.
Sınıflar fi
150-157’den az 5 157-164’den az 7
164-171’den az 14 171-178’den az 9 178-185’den az 8 185-192’den az 4 192-199’dan az 3
Toplam 50
Mod sınıfı
Frekansı en yüksek olan sınıf mod sınıfı olarak
belirlenir.
Mod sınıfı belirlendikten sonra formülde ilgili
değerler yerine koyularak mod değeri hesaplanır.
1mod
1 2
(14 7)164 7 168,08 .
(14 7) (14 9)
Mod L i
cm
40
5) Medyan
• Bir veri setini büyükten küçüğe veya küçükten büyüğe sıraladığımızda tam orta noktadan veri setini iki eşit parçaya ayıran değere medyan adı verilir.
• Veri setinde aşırı uçlu elemanlar olduğunda aritmetik ortalamaya göre daha güvenilirdir.
• Medyan, veri setindeki tüm elemanlardan etkilenmez.
41
Basit Veriler İçin Medyan
2
1n
12
n
• Veri Setinin Hacmi Tek Sayı İse;
nci gözlem değeri medyandır.
• Veri Setinin Hacmi Çift Sayı İse;
ve nci gözlem değerinin aritmetik
ortalaması medyandır.
2
n
42
5.40 1.10 0.42 0.73 0.48 1.10 0.66
0.42 0.48 0.66 0.73 1.10 1.10 5.40
Tam ortadaki değer medyandır.
MEDYAN 0.73
5.40 1.10 0.42 0.73 0.48 1.10
0.42 0.48 0.73 1.10 1.10 5.40
0.73 + 1.10
2
Medyan bu iki noktanın arasına düşmektedir
MEDYAN 0.915
43
Gruplanmış Veriler İçin Medyan
• Gruplanmış verilerde medyan değeri hesaplanırken
veri setinin tam orta noktasının hangi gruba ait
olduğunu belirlemek için birikimli frekans sütunu
oluşturulur.
• Sıra numarası belirlendikten sonra o sıra numarasına
ait grup medyan değeri olarak ifade edilir.
Örnek: Bir gömlek bayisinin satış mağazasında bir
gün içinde satılan gömleklerin dağılımı aşağıda
verilmiştir. Buna göre veri seti için medyan değerini
hesaplayınız. Gömlek
bedeni Satış adedi Birikimli Frekans ( ∑f )
0 5 5
1 12 17
2 35 52
3 14 66
4 8 74
5 6 80
• n/2 ve (n/2)+1 nci gözlem değerlerine karşılık gelen değerler
(40 ve 41 nci sıra ) 2 olduğundan dolayı medyan değeri 2’dir.
•Frekans dağılımı aşağıdaki gibi olsaydı (n+1)/2 nci
elemana (40 ncı elemana) karşılık gelen değer
8 olacağından dolayı veri setinin medyanı 3 olarak
hesaplanacaktı.
Gömlek
bedeni
Satış adedi Birikimli Frekans ( ∑f )
0 5 5
1 12 17
2 22 39
3 32 61
4 14 75
5 4 79
46
Sınıflanmış Veriler İçin Medyan
• Sınıflanmış verilerde medyan değeri hesaplanırken ilk
olarak medyan sınıfı belirlenir.
• Medyan sınıfı birikimli frekanslar dikkate alındığında
toplam frekansın yarısını içinde bulunduran sınıftır.
• Medyan sınıfı belirlendikten sonra medyan sınıfından bir
önceki sınıfın birikimli frekansı ve medyan sınıfı frekansı
dikkate alınarak hesaplanır.
47
if
ff
LMedyanmed
l
i
med.2
Lmed : Medyan sınıfının alt sınırı
fl : Medyan sınıfından bir önceki sınıfın birikimli
frekansı
fmed : Medyan sınıfının frekansı
Örnek: Bir sınıftaki öğrencilerin boyları hakkında bir araştırma
yapılmaktadır. Bu amaçla 50 öğrencinin boyları ölçülerek
kaydedilmiştir.Öğrencilerin boylarının mod değerini hesaplayınız.
Sınıflar fi ∑fi
150-157’den az 5 5 157-164’den az 7 12
164-171’den az 14 26 171-178’den az 9 35 178-185’den az 8 43 185-192’den az 4 47 192-199’dan az 3 50
Toplam 50
Medyan sınıfı
2 .
25 12164 .7 170,5
14
il
med
med
ff
Medyan L if
cm
Toplam 50 adet gözlem olduğundan dolayı, birikimli
frekans sütununda 50/2 =25 nci gözlemin
bulunduğu sınıf medyan sınıfı olarak belirlenir.
50
Merkezi
Ölçüm
Tanım Nasıl
Kullanılıyor
Varlığı Her
değer
Dikkate
Alınırmı?
Uç
Değerlerden
Etkilenirmi?
Avantajları ve
Dezavantajları
Ortalama
n
xx
En Bilinen
‘ortalama’
Her zaman
vardır.
Evet
Evet
Birçok
istatistiksel
metodla iyi
çalışır.
Medyan
Orta değer
Sıklıkla
Kullanılır
Her zaman
vardır.
Hayır
Hayır
Birkaç uç değer
varsa genellikle
iyi bir tercihtir
Mod En sık tekrar eden
veri değeri
Ara sıra
kullanılır
Olmayabilir
ya da
birden fazla
olabilir.
Hayır
Hayır
Nominal
düzeyde veriler
için uygundur
Veriler mod etrafında simetrik oldukları zaman, mod, medyan ve artimetik ortalama
birbirlerine eşit olur.
Eğer örneklem aynı anakütleden çekilmişse, aritmetik ortalama diğer ölçülere göre
daha güvenilirdir
51
6) Kartiller •Bir veri setini büyükten küçüğe veya küçükten büyüğe sıraladığımızda dört eşit parçaya ayıran üç değere kartiller adı verilir.
•İlk % 25’lik kısmı içinde bulunduran 1. Kartil (Q1), % 50’lik kısmı içinde bulunduran 2. Kartil (Q2), % 75’lik kısmı içinde bulunduran 3. Kartil (Q2), olarak adlandırılır.
•%50’lik kısmı içinde bulunduran 2. Kartil (Q2) aynı zamanda veri setinin medyanıdır.
%25 %25
%25 %25
Q1 Q2 Q3
52
Basit Veriler İçin Kartiller
4
1n
• 1.Kartil Q1
nci gözlem değeri,
• 3.Kartil Q3
nci gözlem değeri,
3( 1)
4
n
53
Örnek: İstatistik I dersini alan 10 öğrencinin vize
notları aşağıdaki gibi sıralanmıştır. Buna göre vize
notları için Q1 ve Q3 değerlerini hesaplayınız.
30,42,56,61,68,79,82,88,90,98
(n+1)/4 ‘ncü verinin sıra numarası (10+1)/4 = 2,75’dir.
Q1= 42 + 0,75 .(56 - 42) = 52,5 ,
3(n+1)/4 ‘ncü verinin sıra numarası 3(10+1)/4 =
8,25’dir.
Q3= 88 + 0,25.(90 - 88) = 88,5 ‘dir.
Veri seti aşağıdaki gibi verilseydi,
30,42,56,61,68,79,82,88,90,98
(n+1)/4 ‘ncü verinin sıra numarası (9+1)/4 = 2,5’dir.
Q1= 42 + 0, 5 .(56 - 42) = 49 ,
3(n+1)/4 ‘ncü verinin sıra numarası 3(9+1)/4 = 7,5’dir.
Q3= 82 + 0, 5.(88 - 82) = 85 ,
olarak hesaplanacaktı.
55
Gruplanmış Veriler İçin Kartiller
• Gruplanmış verilerde kartiller hesaplanırken veri
setinin ilk çeyrek ve son çeyrek kısmını tam olarak
ifade etmek amacıyla birikimli frekans sütünü
oluşturulur.
• Gruplanmış verilerde örnek hacminin tek veya çift
olduğuna bakılmaksızın
n/4 ncü eleman 1.Kartil (Q1),
3n/4 ncü eleman ise 3.Kartil (Q3),
olarak ifade edilir.
Örnek: Bir gömlek bayisinin bedenlerine göre satış adetleri
aşağıda verilmiştir. Buna göre veri seti için Q1 ve Q3 nedir?
Gömlek
bedeni
Satış adedi Birikimli Frekans ( ∑f )
0 5 5
1 12 17
2 35 52
3 14 66
4 8 74
5 6 80
• n/4 ncü ( 20 nci ) sıra numarasına karşılık gelen gözlem 2
olduğundan; 1.kartil 2, 3n/4 ncü ( 20 nci ) sıra numarasına
karşılık gelen gözlem 3 olduğundan; 3.kartil 3’dür.
57
Sınıflanmış Veriler İçin Kartiller
• Sınıflanmış verilerde kartiller hesaplanırken ilk olarak
birikimli frekans sütunu oluşturularak kartil sınıfları
belirlenir.
• Kartil sınıfları belirlenirken gruplanmış verilerde olduğu
gibi n/4 ve (3n)/4 ncü sıralardaki elemanların hangi sınıflara
ait iseler o sınıflar kartil sınıfları olur.
• Kartil sınıfları belirlendikten sonra bu sınıflardan bir
önceki sınıfın birikimli frekansı ve mevcut sınıf frekansı
dikkate alınarak kartil değerleri hesaplanır.
58
if
ff
LMedyanQQ
l
i
Q .2
2
22
if
ff
LQQ
l
i
Q.4
3
3
33
if
ff
LQQ
l
i
Q .4
1
11
1. Kartil
3. Kartil
2. Kartil
59
1 1
1
4 .
12,5 12164 .7 164,58
6
il
Q
Q
ff
Q L if
cm
Q1 sınıfı
Q3 sınıfı
Sınıflar fi ∑fi
150-157’den az 5 5 157-164’den az 7 12 164-171’den az 14 26 171-178’den az 9 35 178-185’den az 8 43 185-192’den az 4 47 192-199’dan az 3 50
Toplam 50
Örnek: Bir sınıftaki öğrencilerin boyları hakkında bir araştırma
yapılmaktadır. Bu amaçla 50 öğrencinin boyları ölçülerek
kaydedilmiştir.Öğrencilerin boylarının birinci ve üçüncü kartillerini
hesaplayınız.
7