Top Banner
İstatistik Dr. Cahit Karakuş
159

Lider Davranış Geliştirmeckk.com.tr/ders/olasilik/Sunum İstatistik.pdf · İstatistik, daha etkili kararlar almaya yardımcı olmak için verilerin toplanması, düzenlenmesi,

Dec 29, 2019

Download

Documents

dariahiddleston
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
  • İstatistik

    Dr. Cahit Karakuş

  • İstatistik

    • İstatistikte Temel Kavramlar

    • İstatistiksel formüller

    • Deneysel verilerin istatistiksel analizi

    • Standart sapma

    • Çarpıklık ve Basıklık Ölçüleri

    • Hata, Belirsizlik

    • Regresyon ve korelasyon analizi

  • İSTATİSTİK

    İstatistik, daha etkili kararlar almaya yardımcı olmak için

    verilerin toplanması, düzenlenmesi, çözümlenmesi, analiz

    edilmesi ve yorumlanması bilimidir.

    İstatistik, çevremizde olup bitenleri sayısal değerler ile

    yorumlamamıza yardım eder.

  • İSTATİSTİĞİN İŞLEM AŞAMALARI

    • Verilerin toplanması

    • Toplanan verilerin işlenip düzenlenmesi

    • Düzenlenen verilerin tablo veya grafikler şeklinde gösterilmesi

    • İstatistiki analiz yöntemleri ile yorumlama, tahmin ve karar aşaması

  • VERİLERİN DERLENMESİ

    • Veri kaynakları

    • Gözlem

    • Ölçümler

    • Anket

    • Algılama

  • 6

    İSTATİSTİKSEL YÖNTEMLER

    TANIMLAYICI İSTATİSTİKLER

    YORUMLAYICI İSTATİSTİKLER

  • 7

    İstatistiksel Yöntemler

    • Tanımlayıcı İstatistikler

    –Verilerin toplanması,tanımlanması ve temel analizler

    • Yorumlayıcı - Çıkarımsal İstatistikler

    –Örnekten elde edilen istatistikler kullanılarak, bilinmeyen

    parametreler hakkında tahminde bulunma, karar verme.

  • İstatistik temel kavramlar

    1. Ortalama

    Aritmetik Ortalama

    Geometrik Ortalama

    Harmonik Ortalama

    Medyan

    Mod

    2. Olasılık

    Ortak Olasılık

    Marjinal Olasılık

    Koşullu Olasılık

    3. Faktöriyel

    4. Permütasyon Tekrarsız Permütasyon

    Tekrarlı Permütasyon

    5.Kombinasyon Tekrarsız Kombinasyon:

    Tekrarlı Kombinasyon:

    6. Aralık (Range)

    7. Varyans

    8. Standart Sapma

  • İstatistiğin çeşitleri

    • Betimsel İstatistik: Kitledeki birimlerin hepsinden ilgili değişken bakımından bilgi derlenmişken, kitlenin özetlenmesinde (betimlenmesinde) kullanılan teknik ve

    yöntemler “Betimleyici (tanımlayıcı) istatistik” olarak nitelendirilir.

    • Çıkarsamalı İstatistik: Kitleden belirli bir teknikle elde edilen bir örnek kümenin belirlenmesiyle kitle hakkında tahminler yapmada kullanılan teknik ve yöntemler

    “çıkarsamalı (tümevarımsal) istatistik” olarak nitelendirilir.

  • Summary of Types of Variables

  • Değişkenler ve veri tipleri (variables and data types)

    1. NİTELİKSEL (Kategorik)

    1. İsimsel (Nominal)

    2. Sıralı (Ordinal)

    3. Uzman Tanımlı Skor/Puan (Expert Specific Score Data)

    2. NİCELİKSEL (Numeric)

    1. Ölçek Tanımlı Skor/Puan (Scale Specific Score Data)

    2. Aralıklı (Interval)

    3. Orantılı (Proportional/Ratio Scale)

    3. GÖRÜNTÜ/İMGE (Oluşum, Lezyon, Resim, Ürün, Tasarım, Model Data)

    4. DÖNÜŞTÜRÜLMÜŞ VERİ (Transformed Data)

  • Bilimselliğin Ölçütleri

    (a)Gözlenebilirlik

    (b)Ölçülebilirlik

    (c) İletilebilirlik

    (d) Tekrarlanabilirlik

    (e) Sağdanabilirlik

  • Ölçeklendirme

    • Tepe değeri

    • Yatay aralık ölçüsü

    • Belirli bir aralığı büyütme

  • 14

    Measurement Scales

    1. Nominal ölçek, yalnızca isimle tanımlanan sırasız bir kategori grubudur. Nominal ölçümler yalnızca iki şeyin aynı mı yoksa farklı mı olduğunu belirlemenize izin verir.

    2. Sıralı bir ölçek, sıralı bir kategori grubudur. Sıralı ölçümler, iki şey arasındaki farkın yönünü belirtir.

    3. Aralık ölçeği eşit boyutlu kategorilerin sıralı bir dizisidir. Aralık ölçümleri, bir farkın yönünü ve büyüklüğünü belirtir. Sıfır noktası aralık ölçeğinde keyfi olarak bulunur.

    4. Oran ölçeği, sıfır değerinin hiçbirinin değişkeni göstermediği aralık ölçeğidir. Oran ölçümleri, farklılıkların yönünü ve büyüklüğünü tanımlar ve ölçümlerin oran karşılaştırmalarına izin verir.

  • İstatistiksel verileri anlamlı hale getirme

    1. Sözel ifadelerle açıklama

    2. Tablolar halinde düzenleme

    3. Grafikle gösterme

    4. Verileri değerlendirerek istatistiksel ölçüler bulma

    5. Bu yöntemlerde birkaçını birlikte uygulama

  • İstatistikte Kavramlar

  • İstatistikte kavramlar

    • Evren – Gözlem alanına giren obje ya da bireylerin tümü

    • Örneklem – Bir evrenden seçilmiş daha küçük sayıdaki obje ya da bireylerin oluşturduğu grup

    • Değişken – Her gözleme göre farklı değerler alabilen objelere, özelliklere ya da durumlara

    denir Değişkenler nicel ya da nitel olabilir. Nitel veriler, Sayısal veriler -kesikli sayısal veriler (maç kazanma syısı) -sürekli sayısal veriler (boy, kilo)

    • Ölçme – objelere ya da bireylere belirli bir değere sahip oluş derecelerini belirtmek için

    sembolik değerler verme işlemidir.

    – Değişkenler hakkında bilgi edinmek için yapılır

    • Ölçüm – Ölçme sonucunda elde edilen değer

  • İstatistikte kavramlar

    • Anlamlı rakam

    X=2.8

    0 1 2 3 4 5 6

    X=5.0

  • 19

    Verilerin Sınıflandırılması

    • 2,4,4,4,6,6,8,10,12,16,18

    • En büyük değerden en küçük değer çıkarılarak veri aralığı tespit edilir. İstenen sınıf sayısına bölünerek

    • 18-2=16

    • 16/8=2 veri aralığı 2 dir.

  • • 4521000. sayısının anlamlı basamak sayısı yedidir. Çünkü 4521000 sayısının tam olarak ölçüldüğü, noktadan sonra da bir değerin gelebileceğini göstermektedir.

    • Sayıların yuvarlanması;

    52.6502 52.7, 3.457 3.46 , 0.34648 0.346

    73.135 73.14 , 48.724 48.72

    5,387123 = 5,39 = 5,4 = 5

    Verilerde anlamlı basamaklar

  • • Toplama ve Çıkarma: Toplamın hassasiyeti en düşük anlamlı basamağa göre alınır.

    • 32.7 +3.62+10.008=46.328

    Verilerde anlamlı basamaklar

    • Çarpma ve Bölme: Sonuç, en az anlamlı rakam içeren sayınınkine eşit anlamlı rakam içerecek şekilde yuvarlanır.

    Anlamlı basamak 3 Anlamlı basamak 5 Anlamlı basamak 3

    46.3

  • Percentages and Proportions

    • What % of social science majors is male? – of (whole) = all social science majors

    • 97 + 132 = 229

    – is (part) = male social science majors • 97

    – (97/229) * 100 = (.4236) * 100 = 42.36%

    – 42.36% of social science majors are male

  • ORAN-ORANTI

    Oran: a ve b reel sayılarının en az biri sıfırdan farklı olmak üzere, ye a’ nın b’ ye oranı denir.

    Kesrin payı sıfır olabilir fakat paydası sıfır olamaz.

    Oranın payı ya da paydası sıfır olabilir.

    Oranlanan çoklukların birimleri aynı tür ya da aynı olmalıdır.

    Oranın sonucu birimsizdir.

    Orantı: En az iki oranın eşitliğine orantı denir.

  • Doğru Orantılı Çokluklar: Orantılı iki çokluktan biri artarken diğeri de aynı oranda artıyorsa ya da biri azalırken diğeri de aynı oranda azalıyorsa bu iki çokluk doğru orantılıdır denir.

    x ile y doğru orantılı ve k pozitif bir doğru orantı sabiti olmak üzere, y = k . x ifadesine doğru orantının denklemi denir. Bu denklemin grafiği aşağıdaki gibidir.

    Ters Orantılı Çokluklar:Orantılı iki çokluktan biri artarken diğeri aynı oranda azalıyorsa ya da biri azalırken diğeri aynı oranda artıyorsa bu iki çokluk ters orantılıdır denir. x ile y ters orantılı ve k pozitif bir ters orantı sabiti olmak üzere, ifadesine ters orantının denklemi denir.

  • Ratios

    • In a class of 23 females and 19 males, the ratio of males to females is:

    – 19/23 = 0.83

    – For every female, there are 0.83 males.

    • In the same class, the ratio of females to males is:

    – 23/19 = 1.21

    – For every male, there are 1.21 females.

  • Rates

    • Birth rate is the number of births divided by the population size times 1000 per year.

    • If a town of 2300 had 17 births last year, the birth rate is:

    – (17/2300) * 1000 = (.00739) * 1000 = 7.39

    – The town had 7.39 births for every 1000 residents.

  • Percentage Change

    • Measures the relative increase or decrease in a variable over time.

  • Percentage Change: Example

    • In 1990, a state had a murder rate of 7.3.

    • By 2000, the rate had increased to 10.7.

    • What was the relative change?

    – (10.7 – 7.3 / 7.3) * 100 = (3.4 / 7.3) * 100 = 46.58%

    • The rate increased by 46.58%.

  • Frequency Distribution Table

    Class Freq. %

    18-19 11 55

    20-21 5 25

    22-23 2 10

    24-25 1 5

    26-27 1 5

    20 100

  • İstatistiksel formüller

  • Veri Gruplama

  • Veri Betimleme

  • Veri Betimleme

  • Veri Betimleme

  • Sayma Kuralları

  • Olasılık

  • Olasılık dağılımları

  • Deneysel verilerin istatistiksel

    analizi

  • • Ölçme sonuçlarına bakarak, bazı kararlar verebilmek ve anlam çıkarabilmek için ölçme sonuçları üzerinde istatistik işlemlerinin yapılması gerekmektedir.

  • MERKEZİ EĞİLİM

    ÖLÇÜLERİ

  • TEPE DEĞERİNİN ÖZELLİKLERİ

    • Hesaplanması ve anlaşılması kolaydır

    • Dağılımdaki aşırı değerlerden etkilenmez

    • Grafik üzerinde hiç işlem yapmadan, gözlenebilen tek ölçüdür.

    • Bazı dağılışlarda tepe değeri bulunmayabilir, bazılarında da birden fazla tepe değeri bulunabilir. İki tepe değeri bulunan dağılışlara bimodal dağılış adı verilir.

  • • Aritmetik ortalama, değerler toplamının değer sayısına bölümü şeklinde tanımlanır. Bu tanıma göre aritmetik ortalama şöyle formüle edilir.

    • Frekanslar söz konusu olduğunda, sınıflandırılmış seriler için,

    Aritmetik Ortalama

    1 2 3 nX X X ....... XXn

    n

    ii 1

    X

    n

    1 1 2 2 n n

    1 2 n

    f X f X ........ f XX

    f f .......... f

    n

    i ii 1

    n

    ii 1

    f X

    f

  • Ortalama (Aritmetik Ortalama, 𝑥 ): tekrarlanan ölçümlerin toplamının ölçüm sayısına bölünmesiyle elde edilen değerdir.

    𝑥 = 𝑥𝑖

    𝑁𝑖=1

    𝑁

    𝑥𝑖: Tekrarlanan N tane ölçümün her birindeki x değeri.

    N : Tekrar sayısı

  • Aritmetik ortalamanın özellikleri 1 - Aritmetik ortalama hassas bir ortalama olup serideki aşırı değerlerden etkilenir ve aşırı değere

    doğru kayma gösterir.

    2 - Serinin gözlem sayısı ile aritmetik ortalaması çarpılırsa serinin toplam değeri elde edilir.

    3- Serideki gözlem değerlerinin aritmetik ortalamadan sapmaları toplamı sıfır olur.

    4- Serideki değerlerin aritmetik ortalamadan sapmalarının kareleri toplamı minimum olur.

    5- Aritmetik ortalama özellikle normal dağılıma yakın serilerin ortalaması için elverişlidir.

    6- Bir serinin değerleri, diğer iki serinin değerleri toplamından oluşuyorsa bu serinin aritmetik ortalaması da diğer iki serinin aritmetik ortalamaları toplamına eşit olur. X =Y +Z

  • Aritmetik Ortalamalar Hakkında Özellikler

    • Aritmetik ortalamalar değeri hesaplanırken bütün gözlem değeri hesaplamaya dahil edilir.

    • Bir veri grubu dizi olarak adlandırılır ve sadece tek bir aritmetik ortalaması vardır.

    • Aritmetik ortalama çok farklı değerlerce etkilenir ve büyük sapma gösterir. • Aritmetik ortalama değerinden her bir gözlem değerinin farklar toplamı

    sıfırdır. Bir seriye ait gözlem değerleri şöyle olduğu saptanmıştır: 3, 8, ve 4. Aritmetik Ortalama= 5. Σ(X − X) =[(3−5)+(8−5)+(4−5)]= 0

  • Örnek: Bir sınava giren toplam öğrenci sayısı 7 olsun. • Bu 7 öğrencinin sınavdan aldıkları notlar ise 100 üzerinden 60, 35, 28,

    77, 81, 72 ve 74 olsun. • Bu sınav sonucundaki aritmetik ortalamayı hesaplananilir. • Aritmetik ortalama = (60+35+28+77+81+72+74) / 7 = 61’dir. Toplam puanların puan sayısına (öğrenci sayısına )bölünmesi ile aritmetik ortalama bulunur.Aritmetik ortalamanın hesaplanmasında, puan dağılımındaki her puan hesaplamaya dahil edildiğinden, diğer merkezi eğilim ölçülerine göre aritmetik ortalama daha çok tercih edilen bir istatistiktir. Aritmetik ortalama bütün değerlerin ağırlığını eşit kabul ettiğinden dağılımı her zaman en iyi şekilde temsil etmeyebilir. Ayrıca aritmetik ortalama, veri kümesindeki aşırı değerlerden çok kolay etkilenir.

  • • Aritmetik ortalamaları aynı olan iki dağılım aynı yaygınlıkta olmayabilir.

    • Örneğin; 10,22,34 değerlerini alan 3 kişilik bir dağılımda aritmetik ortalama 66/3=22’dir.21,23,22 değerlerini alan başka bir 3 kişilik dağılımda aritmetik ortalama yine 66/3=22’dir.

    • İki dağılımın aritmetik ortalaması 22 olduğu halde birinci dağılımda değerler (1 ve 3’üncü değerler) aritmetik ortalamadan çok uzakta iken ikinci dağılımdaki değerler ortalamaya çok yakındır.

    • Bir dağılımda değerler aritmetik ortalamadan uzaklaştıkça dağılımın yaygınlığı artar.

  • Frekans serisi aritmetik ortalama örneği

    i i

    i

    f X 1564X 15,64

    f 100

    Xi fi fi.Xi

    10 2 20

    11 3 33

    12 5 60

    13 8 104

    14 14 196

    15 18 270

    16 15 240

    17 12 204

    18 10 180

    19 6 114

    20 4 80

    21 3 63

    100 1564

  • Ağırlıklı Ortalama • Puanların ortalamaya katkı oranlarının farklı olması gerektiği durumlarda

    aritmetik ortalama yerine ağırlıklı ortalama hesaplanabilir.

    • Bir data serisine ait gözlem degerleri X1, X2, ..., Xn, ve bu seriye ait agırlıklar ise w1, w2, ...,wn, olsun. Her bir gözlem degerinin agırlıkları dikkate alınarak hesaplanacak ortalama degerine Ağırlıklı Ortalama denir.

    • Ağırlıklı ortalama; veri kümesindeki bütün değerlerin aynı ağırlığa (öneme) sahip olmadıkları durumlarda kullanılır.

    • 1’den n’e kadar olan bir veri kümesinde X’ler veri değerleri ve W’lar her bir X için bir ağırlık fonksiyonu olarak kabul edilirse; ağırlıklı ortalama formülü şöyle oluşur:

  • 53

    • Ağırlıklı ortalama eğitimde yaygın olarak kredili ders sistemindeki ortalamaların hesaplanmasında kullanılmaktadır. Örnek: İktisat, İşletme, Hukuk ve İngilizce derslerini alan bir öğrencinin ders kredisi / ders notu çizelgesi şöyledir:

    • O halde ağırlıklı ortalaması;

    (4x75)+(3x70)+(2x60)+(2x90)=73.63

    11

    Ders Kredisi Ders Notu

    İktisat 4 75

    İşletme 3 70

    Hukuk 2 60

    İngilizce 2 90

  • Örnek

    Ders Kredi Not Ağ. Not

    Fiz 101 4 AA (4.0) 16.0

    Kim 101 4 BB (3.0) 12.0

    Müh 100 2 BA (3.5) 7.0

    Mat 101 4 CB (2.5) 10.0

    Türk 101 2 CC (2.0) 4.0

    İng 101 2 DD (1.0) 2.0

    MAK 101 3 DC (1.5) 4.5

    Toplam 21 55.5

    64.221

    5.55.. OA

    • Yandaki tabloda verilen ders ve notlar için ağırlıklı ortalama:

  • Geometrik ortalama

    • Geometric Ortalama genellikle ortalama yüzdelik değişim, endekslerin oluşumunda ve mukayeseli hesapların hesaplamasında kullanılmakta.

    • Geometric mean (GM) toplam gözlem değeri (n) kadar iken bütün gözlem değerlerin çarpımının n. mertebeden karekökü alınarak hesaplanır.

  • Geometrik ortalama

    • Bir diğer önemli kullanım alanı satış rakamlarındaki yüzdelik artış, üretim,business veya ekonomik serilere ait dataların iki nokta arasında değerlere ait yorumlarda kullanılır.

    • Amerikan Üniversitelerine 1992 yılında kayıt yaptıran toplam bayan öğrenci sayısı 755,000 iken 2002 yılında bu rakam 835,000 olduğu tespit edilmiştir. 1992-2002 yılları arasındaki yüzdelik artış nedir?

  • Ortanca değer (Medyan): Büyüklüğe göre sıralanmış bir veri takımındaki orta

    değerdir.

    Mod: Ölçülen değerler içerisinde en fazla tekrar eden değer.

    Yayılma: Bir veri takımındaki en büyük ve en küçük değer arasındaki fark.

    Doğruluk: Bir analizin tekrar deneyleri sonucunda hesaplanan ortalama değer

    (𝑥 )ile, bu analizin doğru kabul edilen ‘’µ’’ değerinin karşılaştırılmasıdır

    (𝑥 − µ).

    Mutlak ve bağıl olarak verilir.

    İstatistiksel analiz Medyan, Mod, Yayılma, Doğruluk

  • Mod=Tepe Değeri

    • Tepe değeri dağılımda en fazla tekrarlanan değerdir.

    Örnek:

    9 kişinin yaşları

    12, 13, 11, 12, 14, 29, 12, 13, 11 olsun.

    Buna göre en çok tekrarlanan 12 olduğu için tepe değeri 12’dir.

  • • Her gözlemin tekrar sayısı aynı ise o veri setinde tepe değeri yoktur.

    • En yüksek sayıya sahip tek bir değerin olduğu dağılımlara tek tepeli dağılım, en yüksek sayıya sahip iki değerin olduğu dağılımlara iki tepeli dağılım denir. Bu durum ikiden fazla değerde ortaya çıkarsa çok tepeli dağılım adını alır.

    • Tepe değeri, aritmetik ortama ve ortancaya göre daha az kullanılan bir ortalama ölçüsüdür.

  • • Örneğin, bir şeyin doğru kabul edilen değeri µ= % 0,54 ve tekrar deneylerinden elde edilen ortalama değeri 𝑥 = %0,49 ise

    Mutlak doğruluk= % 0,49-% 0,54= -% 0,05

    Bağıl doğruluk= (-% 0,05)/( % 0,54)= -% 0,09

    Mutlak doğruluk, Bağıl doğruluk

  • Medyan(Ortanca) • Büyüklük sırasına göre düzenlenmiş puanlar dizisinin tam ortasına düşen puandır.

    • Ortanca hesaplanırken mutlaka verilerin sıraya konulmuş olması gerekmektedir.

    • Ölçülen değerler küçükten büyüğe ya da büyükten küçüğe doğru dizildiği zaman grubun, dizinin tam ortasındaki ,yani yüzde ellinci puan veya ölçümüdür.

    • Denek sayısı çiftse, ortadaki iki deneğin ortalamaları alınır.

    • Aşırı değerlerden etkilenmez.

    • Verilerde sapan değerler var ise ortanca verileri ortalamadan daha iyi betimler. – Örnek: Şu an bu sınıftaki kişilerin yaş ortalaması.

  • Örnek: 9 kişinin yaşları küçükten büyüğe doğru sıralandığında

    11, 12, 11, 12, 12 , 13, 13, 14, 29

    Gözlem sayısı tektir. Ortanca =(9+1)/2=5. değer

    Ortanca

    Bir veri grubu küçükten büyüğe sıralandığında, terim sayısı tek ise

    ortadaki sayı, çift ise ortadaki iki sayının toplamının yarısıdır.

  • Denek sayısı 10 ve yaşlar aşağıdaki gibi olsaydı

    12, 13, 11, 12, 14, 29, 12, 13, 15 11

    Yaşlar sıraya dizildiğinde

    11 11 12 12 12 13 13 14 15 29

    Denek sayısı çift olduğundan

    (n/2)=5. ve (n+2)/2=6. değerlerin

    ortalamasıdır.

    Ortanca

    Ortanca = 12 + 13

    2 = 12.5

    Denek sayısı çift olduğunda

  • Bu nedenle dağılımda aşırı gözlemlerin bulunduğu durumlarda, ortalama ölçüsü olarak ortancanın kullanılması daha doğrudur.

    Ortanca, dağılımın

    orta noktası hakkında bilgi verir.

    ve aşırı değerlerden etkilenmez.

  • Medyanın avantajları:

    • Hesaplanması ve anlaşılması kolaydır.

    • Uç değerlerden etkilenmez

    • Her dağılımda bir tane ortanca vardır.

  • Medyanın Dezavantajları:

    • Standart sapması ortalamanın standart sapmasından büyüktür.

    • Büyük veri yığınlarında bilgisayar kullanmadan hesaplanması zordur.

    • Ortanca, ölçüm sayısına eklenecek herhangi bir değerden hemen etkilenir ve değişir.

  • Mod(Tepe değeri)

    • Bir veri grubunda en çok tekrarlanan,yani frekansı en yüksek olan puandır. • Tepe değer verilerin en çok hangi değer etrafında toplandığı hakkında bilgi

    verir. • Mod en kararsız ölçüdür. • Eğer puan dizisinde her puan aynı frekansa sahipse o puan dizisinin modu

    yoktur. • Bir seride birden fazla mod olabilir. Bu durumda değişken çok modlu olarak

    nitelendirilir.

  • • Mod pratik olarak ,bir seride en çok rastlanan, en çok tekrarlanan terim olarak tanımlanabilir. Eğer serinin histogramı çizilirse, en yüksek sütunun değeri serinin modudur.Bu sebepten mod’a tepe değeri de denir.

    • Tıpta nadir kullanılan bir merkezi eğilim ölçütüdür.

  • Bazı dizilerde “tek mod” vardır. • 20,30,40,50,50,50,60; Dizinin modu:50 Bazı dizilerde mod olabilecek değerler ard arda geldiğinde bunların ortalaması alınarak moda ulaşılır. • 20,30,40,40,50,50,60 Dizinin modu:45 Bazı dizilerde birden fazla mod vardır. • 20,20,30,40,40,40,50,60,60,60,70,70 Dizinin modları:40 ve 60 • 20,30,30,40,50,50,60,60 Dizinin modları:30 ve 55 • 20,30,30,40,40,50,60,60,70,70,80,80 Dizinin modları:35 ve 70 Bazı dizilerde mod yoktur. • 20,20,20,30,30,30 • 20,30,40,50,60,70 • 20,20,20,20,30,30,30,30 • 0,0,0,100,100,100 Puanlar frekans sayıları açısından farklılaşma göstermediklerinden dizide mod bulunamaz. Aynı zamanda puanlar farklılaşma göstermediğinde de mod aranmaz. • 20,20,20,20,20,20

  • MERKEZİ DEĞİŞİM

    ÖLÇÜLERİ

  • Merkezi Dağılım (Değişim )Ölçüleri

    • Merkeze yığılma ölçüleri, üzerinde ölçme yapılan grubu tanımamıza yardım eder. Ne var ki merkezi yığılma ölçüleri bir grubu tam olarak tanıtmaz. Bu ölçülere ek olarak puanların değişiklik (dağılım)ölçülerinin de bilinmesine gerek vardır.

    • Merkezi dağılım ölçüleri, verilerin yığılma gösterilen noktadan ne kadar uzakta olduklarını, nasıl bir dağılım gösterdiklerini belirleyen istatistiklerdir.

    • Başlıca dağılım ölçüleri puan genişliği(ranj), standart sapma ve varyansdır.

  • Yayılım Ölçüleri

    Farklı grupların merkezi eğilim ölçütleri aynı olduğu halde, gruplar birbirlerinden çok farklı olabilir. Bu nedenle merkezi eğilim ölçütleri yanında, yayılma ölçütleri de çok önemlidir.

    • Puanlar arsındaki farklılaşma miktarını gösterir.(homojen-heterojen)

    • Standart sapma en hassas yayılım ölçüsüdür.

    • Herhangi birinin 0 olması durumunda diğer yayılım ölçüleri de 0 olur.

    • Bütün notlar aynı olduğunda, bütün yayılım ölçüleri 0 olur.

  • 78

    Dağılım Aralığı (Range)

    • Bir dizideki en büyük değer (Xmax) ile en küçük değer (Xmin) arasındaki farktır.

    • DA= (Xmax) - (Xmin) biçiminde hesaplanır.

    • 71-68-75-44-75-81-75-94-56-75-69

    veri setinin dağılım aralığı nedir?

    • DA=94-44=50’dir.

  • • Kesinlik: Bir analizde elde edilen verilerin birbirine yakınlığıdır. Deneysel

    verilerin kesinliği;

    Standart sapma Bağıl standart sapma Varyans Yayılma Sapma Ortalama sapma Bağıl ortalama sapma

    gibi değerlerle belirlenir.

    İstatistiksel analiz

  • ? Doğruluk = Kesinlik

  • • Standart sapma: Analizle bulunan sonuçların ortalama değer etrafında dağılımını ifade eder. Bu değer ne kadar küçükse analizin kesinliği o kadar yüksektir. Ancak, bu doğruluğun yüksek olduğu anlamına gelmez. En çok kullanılan standart sapma türleri;

    1. Gerçek standart sapma (𝜎)

    2. Numune standart sapması (s)

    3. Birleşik standart sapma (sbirleşik)

    İstatistiksel analiz

  • • Gerçek standart sapma;

    𝜎 = 𝑥𝑖−𝜇

    2

    𝑁

    • Numune standart sapması (s)

    s= 𝑥𝑖−𝑥

    2

    𝑁−1

    İstatistiksel analiz

  • • Birleşik standart sapma:

    sbirleşik= 𝑥𝑖−x 1

    2+ 𝑥𝑖−x 22+ ……..+ 𝑥𝑖−x k

    2

    𝑁−𝑘

    • x 1, x 2, x k : Her bir analizcinin analiz sonuçları ortalaması

    • k: Analizci sayısı

    İstatistiksel analiz

  • Örnek soru

    Bir gölde bir türden tutulan çok sayıda balıktan rastgele kuralına göre 5 tanesi numune olarak alınmış, kurutulduktan sonra bunlarda atomik absorpsiyon spektroskopisi (AAS) yöntemiyle 5 analizci tarafından civa tayini yapılmıştır. Bu tayinlerde bulunan sonuçlar aşağıda verilmiştir. Buna göre balıklarda AAS ile civa tayini metodunun birleşik standart sapmasını hesaplayınız.

  • • Varyans: Standart sapmanın karesidir. Bilimsel çalışmalarda kesinliğin ölçümü olarak genellikle varyans tercih edilir.

    s2= 𝑥𝑖−𝑥

    2

    𝑁−1

    • Sapma: Sonuçlardan her birinin ortalama değerden farkıdır (d).

    d= 𝑥𝑖 − 𝑥

  • • Ortalama sapma: Sapmaların toplamının analiz sayısına bölünmesiyle bulunan değerdir.

    𝑑 =𝑥1 − 𝑥 + 𝑥2 − 𝑥 + ⋯ 𝑥𝑁 − 𝑥

    𝑁

    • Bağıl ortalama sapma: Ortalama sapmanın ortalama değere (𝑥 ) bölünmesiyle bulunur.

  • Standart Sapma

    Bir veri grubunda verilerin aritmetik ortalamadan ne kadar uzaklaştığının ölçüsüdür.

    Puanların ortalamadan olan farklarının, kareleri toplamının ortalamasının, kareköküne eşittir.

    1

    )( 2

    n

    XXS

    Örnek: 78,89,56,36,48,92,59,60

    S=19.8

  • 92

    • 2, 4, 4, 4, 5, 5, 7, 9 değerlerine sahip bir örneklemi ele alalım. • Ortalama {(2+4+4+4+5+5+7+9)/8} = 5 • Her bir değer ile ortalama arasındaki farkın karesini alınır, ve bu kareler toplanıp

    gözlem sayısına bönüp kare kökü alımdığında standart sapma bulunur. • (9+1+1+1+0+0+4+16)/8 = 4 ve 4’ün de kare kökü 2’dir. • Aritmetik ortalamadan sapmaların kareleri alınıp toplanırsa elde edilen sonuca

    variyans denir. Standart sapma formülündeki karekök kaldırıldığında variyans hesaplanır.

    Örneğin: Bir basit yığın için kilogram birimi ile veri (4, 8, 12) olsun. Aritmetik ortalama 8 olur ve verilerin ortalamadan sapmaları (−4, 0 , 4) olur. Kare toplamlarının ortalaması olan varyans

    [(4-8)2+(8-8)2+(12-8)2]/3 = 32/3 = 10,666 olur ve kilogram kare birimi ile verilir. Standart sapma 10,66’nın karekökü olup 3,26 değerindedir ve kilogram birimi ile ölçülür.

  • Standart sapma ve varyans :

    • Tüm değerlerin dağılımı ile bilgi verirler. Tüm değerler eşitse, her ikisi de sıfıra eşittir.

    • Değerler arasında farklar arttıkça standart sapma (S) ve varyans büyür.

    • Standart sapma değişken değerlerinin ortalamanın etrafındaki yayılmasını temsil eden bir yayılma ölçütüdür. Yani, denekler arasında ne kadar yaygınlık olduğunu ifade eder.

    • S’ nın karesine varyans adı verilir.

    • Merkezi eğilim ölçütü olarak ortalama kullanıldığında, yayılma ölçütü olarak da standart sapma kullanılır.

  • • Standart sapma, bir merkezi dağılım ölçüsü olarak puanların merkezi yığılma ölçüsünden uzaklıklarının bir ortalama değeri anlamını taşımaktadır.

    • Bir dizideki ölçümlerin birbirinden farkı arttıkça standart sapma büyür; ölçümler birbirine yaklaştıkça da küçülür.

    • Başka bir deyişle, dizideki ölçümlerin dağıldığı alan genişledikçe standart sapma büyür, dağılım alanı küçülüp daraldıkça da küçülür.

    • Standart sapma küçüldükçe dizi grubundaki homojenlik(benzerlik) artar.

  • • Standart sapma dağılım ölçüleri arasında en çok kullanılmakta olanıdır. Standart sapmanın da bir ortalama olduğunu hatırlatmak gerekir.(Ortalamadan olan farkların ortalaması)

    • Dağılımın yaygınlığını gösteren ölçümlerin en önemlisi varyansdır. Eğer varyans küçükse sayılar birbirine yakın, büyükse daha uzaktır.

    • Standart sapma büyüdükçe dağılım yaygınlaşır.

    • Genel olarak, standart sapmanın küçük olması; ortalamadan sapmaların ve riskin az olduğunun, büyük olması ise; ortalamadan sapmaların, riskin çok olduğunun ve oynaklığın göstergesidir.

  • 96

    • Standart sapma, eğitimde başarıyı belirlemede ortalamalar ile birlikte yaygın bir şekilde kullanılmaktadır. Eğer bir sınavda grup ortalamaları eşit ise standart sapması daha küçük olan grup daha başarılıdır. Standart sapması küçük olan gruplarda öğrencilerin öğrenme düzeyleri daha birbirine yakın iken, standart sapması büyük olan gruplarda öğrenme düzeyleri arasında daha belirgin farklar mevcuttur.

    • Bir dağılımda değerler aritmetik ortalamadan uzaklaştıkça dağılımın yaygınlığı artar. • Standart sapmanın küçüklüğü; ortalamaya yakınlığı, büyüklüğü ise; ortalamaya uzaklığı

    ifade eder.

  • Aritmetik ortalamaya bağlı olarak

    verilen kararlar

    Standart sapmaya bağlı olarak verilen

    kararlar

    Grubun başarı düzeyi nedir?

    Grubun mutlak başarı düzeyi nedir?

    Öğrencilerin ortalama başarı düzeyi nedir?

    Öğrencilerin öğrenme düzeyi nedir?

    Başarılı ve başarısız sınıf (grup)

    hangisidir?

    Öğrencileri arasında farklılaşma var mı? ya

    da öğrencilerin öğrenme düzeyleri benzer

    mi?

    Grup ya da dağılım homojen mi, heterojen

    mi?

    Grup aritmetik ortalamaya ne kadar

    uzaktır? Ya da yakındır?

  • VARYASYON KATSAYISI

    (DEĞİŞİM KATSAYISI)

    Standart sapma dağılımın yaygınlığını gösteren bir ölçüdür.

    Ancak standart sapma ile dağılım hakkında çok fazla bir şey söylemek olanaksızdır.

    Örneğin; bir dağılımın standart sapması 6 ise bu değer büyük müdür, yoksa küçük müdür?

  • • Bir karar verebilmek için VARYASYON KATSAYISINI hesaplamak gerekir. • Varyasyon katsayısı; standart sapmanın ortalamaya göre yüzde kaçlık bir

    değişim gösterdiğini belirtir. S V = --------- x 100 X Örnek : Ortalaması 31.7 ve standart sapması 8.37 olan bir dağılımın

    varyasyon katsayısı, V = (8.37 / 31.7) x 100 = % 26.4 Bu dağılımdaki değerler ortalamaya göre %26.4’lük bir değişim

    göstermektedir.

  • Standart Sapma ve Aritmetik Ortalama Arasındaki İlişki

    Aritmetik ortalama ile standart sapmanın arası büyürse,

    Heterojen yapı oluşur ve grup başarısı düşer.

    Aritmetik ortalama ile standart sapmanın arası küçülürse,

    Homojen yapı oluşur ve grup başarısı artar.

    Bir puan dağılımında puanlar arası fark (ranj) büyüdükçe,

    Standart sapmada büyür.

    Bir testten elde edilen puanların standart sapması büyüdükçe,

    Testin güvenirliği artar (Standart hata formülünü inceleyiniz)

    rSS xxe 1Se= Ölçmenin standart hatası Sx= Test puanlarının standart sapması rx = Testin güvenirliği

  • Çarpıklık ve Basıklık Ölçüleri

  • Skewness - Çarpıklık

    • Normal dağılım gibi simetrik dağılımlar için çarpıklık yoktur

    • Çarpıklık= 0

    • Bununla birlikte, bazı dağılımlar için yüksek (düşük) değerler düşük (yüksek) değerlerden daha yaygın olabilir. Bu durumda dağılım çarpıktır.

  • Kurtosis - Basıklık

    • Kurtoz dağılımın zirvesini gösterir

  • Çarpıklık ve Basıklık Ölçüleri

    Çarpıklık(Skewness)

    • Çarpıklık, normal dağılışta simetrikliğin bozulma derecesidir. Dağılış sağa uzun kuyruklu ise pozitif çarpık veya sağa çarpık, dağılış sola uzun kuyruklu ise negatif çarpık vaya sola çarpık olarak adlandırılır.

    Basıklık(Kurtosis)

    • Normal dağılış eğrisinin sivrilik veya yayvanlık derecesi basıklık olarak adlandırılır.

  • Dağılım şekli ölçütleri

    • Ortalama=ortanca=mod ise dağılım normal dağılımdır.

    • Çarpıklık (skewness): Mod

  • Grafiklerin Yorumlanması(Aritmetik ortalama,mod,medyan ilişkisi)

    • Uygulanan bir testin aritmetik ortalaması, modu,medyanı ve standart sapması bulunduktan sonra bunun nasıl bir dağılım gösterdiğini ortaya koymak gerekir. Grafiklerin yorumlanması ile grubun başarı durumu hakkında bilgi edinilebilir.

  • Normal(simetrik)Dağılım

    • Başarı açısından normal düzeyde olan bir sınıfın grafiğidir.Normal dağılım eğrisi genelde çan biçiminde olur.

    • Aritmetik ortalama, mod ve medyan değerleri aynıysa bu dağılım simetriklik gösterir.

  • 1. Simetrik dağılışlarda bu üç değer birbirine

    eşittir.

    (A.O. = Medyan = Mod)

  • DAĞILIM EĞRİLERİ

    Normal

    Sivri

    Basık

  • MERKEZİ EĞİLİM ÖLÇÜLERİ

    A.O

    rtal

    ama

    Ort

    anca

    Normal dağılım

    0 100 50

  • 2. Sola çarpık dağılışlarda aritmetik ortalama ortancadan,

    ortanca ise tepe değerinden daha küçüktür.

    (A.O. Medyan Mod)

  • MERKEZİ EĞİLİM ÖLÇÜLERİ

    A.O

    rtal

    ama

    Ort

    anca

    Sola çarpık dağılım

    100 50 0

  • Sola Çarpık(kayışlı)dağılım

    • Başarı yüksektir.

    • Öğretim yeterlidir.

    • Sorular ve test kolaydır.

    • Puanların çoğu dağılımın sağında toplanmıştır.

    • Öğrenciler hedef davranışları kazanmışlardır.

  • 3.Sağa çarpık dağılışlarda aritmetik ortalama

    ortancadan, ortanca ise tepe değerinden daha

    büyüktür.

    (A.O. Medyan Mod)

  • MERKEZİ EĞİLİM ÖLÇÜLERİ

    A.O

    rtal

    ama

    Ort

    anca

    Sağa çarpık dağılım

    100 50 0

  • Sağa Çarpık(Kayışlı) dağılım

    • Başarı düşüktür.

    • Öğretme yetersizdir.

    • Test zordur.

    • Puanların çoğu sol tarafa yığılmıştır.

    • Öğrenme düzeyi düşüktür.

    • Öğrenciler hedef-davranışları kazamamışlardır.

  • Chapter 8 132

    Process Control

  • Chapter 8 133

    Process Capability

  • HATA

    BELİRSİZLİK

    EKSİK DATA

  • HATA TİPLERİ

    1. Sistematik (Önlenebilen)Hata

    • Alet hataları

    • Metod hataları

    • Kişisel hatalar

    2. Rastgele (Önlenemeyen)Hatalar

  • SİSTEMATİK (ÖNLENEBİLİR) HATALAR

    • Alet Hataları;

    Analizde kullanılan cihaz ve kapların iyi tasarlanmaması ve ayarlanmamasından ve güç kaynaklarındaki kararsızlıklardan meydana gelir. Örneğin titrimetride çok kullanılan pipet, büret ve ölçü balonlarının hacimleri, genellikle üzerinde yazılı olanlardan çok farklı olur.

    HATA TİPLERİ

  • • Metod Hataları;

    Reaktiflerin ve analizin dayandığı reaksiyonların ideal olmayan kimyasal ve fiziksel davranışları bu tip hataya neden olur.

    • Kişisel Hatalar;

    Analizi yapan kişiden kaynaklanan hatalardır. Örneğin, bir çökeleğin analizci tarafından fazla veya eksik yıkanması, daha yüksek ya da düşük sıcaklıkta yıkanması, okuma hatası vb.

    HATA TİPLERİ

  • RASTGELE (ÖNLENEMEZ) HATALAR

    • Meydana gelmeleri önlenemeyen çok küçük hatalardır.

    • Analizi yapan kişinin tecrübesine bağlı olmaksızın gerçekleşebilir. Bu nedenle analizle bulunan her değer az da olsa mutlak hatalıdır.

    • Rastgele hatalar, analizciden kaynaklanabileceği gibi araç gereç ve çevre şartlarından da gelebilir.

    • Eğer hatanın gerçek değeri bilinmiyorsa , sistematik hatayı

    belirleyemeyiz, bunun yerine her deneysel değişken için alabileceği değer aralığını belirlemek için standart sapmasını ya da GÜVEN ARALIĞINI tespit ederiz.

    HATA TİPLERİ

  • • Hassasiyet, güven aralığı

  • Regresyon ve korelasyon analizi

  • Ders 11 - 141

    Basit doğrusal regresyondaki basit kelimesi iki değişken arasındaki ilişkiyi açıklamak için kullanılmasından, doğrusal kelimesi ise kurulan modelin parametreleri açısından doğrusal bir model olmasındandır.

    İki değişken arasındaki en basit ilişki, bir doğru ile açıklanabilen ilişkidir.

    x

    y Genel olarak bir doğrunun matematik gösterimi:

    Y=0+ 1X şeklindedir. Burada 1 ,

    eğimdir ve X’teki 1 birimlik değişmenin Y’de yaptığı değişikliği gösterir.

    0 ise X’in değeri 0 olduğunda Y’nin almış olduğu değerdir ve Y ekseninin kesme noktası olarak isimlendirilir.

  • Ders 11 - 142

    Bir fabrikada taşıma işleri için kullanılan tırların yaşı ile bakım harcamaları arasındaki ilişkiyi ele alalım. Verilerin grafiği çizildiğinde tam olarak düz bir doğrunun üzerinde olmadıkları, fakat tırlar eskidikçe bakım harcamalarının da arttığı görülmektedir. Burada bağımsız değişken yaş, bağımlı değişken ise bakım harcamalarıdır, çünkü yaş değiştikçe bakım harcamaları değişiklik göstermektedir. Pratiklik olması açısından yaş ve bakım harcaması arasındaki ilişkinin bir doğru şeklinde olduğunu varsayarsak, bu modelin matematik gösterimi:

    eXY 10 Bakım harcaması

    yaş

    Hata terimi

    yaş (yıl)bakım

    harcaması

    2.0 2500

    4.5 9200

    4.5 4950

    4.0 4400

    5.0 7900

    5.5 10500

    5.0 9700

    0.5 1950

    6.0 8000

    1.0 2025

    1.0 3700

    3.0 6800

    yaş-bakım harcaması grafiği

    0100020003000400050006000700080009000

    100001100012000

    0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0

    yaş

    bakı

    m h

    arca

    mas

    ı

  • Ders 11 - 143

    yaş-bakım harcaması grafiği

    0100020003000400050006000700080009000

    100001100012000

    0.0 1.0 2.0 3.0 4.0 5.0 6.0 7.0

    yaş

    bakı

    m h

    arca

    mas

    ı

    e hata terimi, traktörler için yapılan harcamanın, ilişkiyi açıklayan doğrudan ne kadar saptığını gösterir.

    Tırların yaşı ile yapılan bakım harcamaları arasındaki gerçek ilişkiyi belirleyen model henüz belirlenmiş değildir. Bunun için modelde bulunan parametrelerin (0 ve 1) bilinmesi gerekir.

    0 ve 1 birer parametre olduklarından, gerçek değerlerinin bulunması için taşıma işinde kullanılan tüm tırların (populasyonun) bakım harcamaları ve yaşlarının bilinmesi gerekmektedir. Bu da çoğu zaman imkansız olduğundan elimizdeki örneği kullanarak parametreleri tahminleriz veya başka bir ifade şekliyle grafikteki noktalara en iyi uyan bir doğruyu buluruz.

  • Ders 11 - 144

    EN KÜÇÜK KARELER (EKK) YÖNTEMİ İLE BİR DOĞRUNUN UYUMU

    Gözlemleri en iyi açıklayan doğrunun belirlenmesi için çeşitli yöntemler ileri sürülebilir fakat günümüzde en çok kullanılan yöntem “En Küçük Kareler” adı verilen yöntemdir. Bu yöntem gözlemlerin belirlenen doğrudan uzaklıklarının (hata terimlerinin) karelerinin toplamının en küçük yapılmasına dayanır.

    eXY 10 modelinde hata terimi:

    XYe 10 olarak yazılabilir. Bu ifadenin karesi alınıp tüm gözlemler için toplanırsa:

    2

    1

    10

    1

    2

    n

    i

    n

    i

    i XYe

    İfadesi elde edilir. EKK yöntemine göre bu ifadeyi minimize eden b0 ve b1 değerleri 0 ve 1 ‘in tahmincileri olur.

  • Ders 11 - 145

    2

    1

    10

    1

    2

    n

    i

    n

    i

    i XYe

    İfadesini minimize eden parametre tahmincilerinin değerlerini bulabilmek için eşitliğin 0 ve 1 ‘e göre türevleri alınıp 0’a eşitlenir.

    2

    1

    10

    01

    2

    0

    n

    i

    n

    i

    i XYe

    n

    i

    XY1

    102

    2

    1

    10

    11

    2

    1

    n

    i

    n

    i

    i XYe

    n

    i

    XYX1

    102

    Her iki denklemi de 0’a eşitlersek;

    0

    02

    1

    10

    1

    10

    n

    i

    n

    i

    XbbY

    XbbY

    0.

    0..2

    1

    10

    1

    10

    n

    i

    n

    i

    XbbYX

    XbbYX

    0‘a göre türev alınırsa; 1‘e göre türev alınırsa;

  • Ders 11 - 146

    0

    02

    1

    10

    1

    10

    n

    i

    n

    i

    XbbY

    XbbY

    0.

    0..2

    1

    10

    1

    10

    n

    i

    n

    i

    XbbYX

    XbbYX

    Parantezleri açarsak;

    0. 10 XbbnY 02

    10 XbXbXY

    Bu denklemlere doğrunun NORMAL DENKLEMLERİ denir. Normal denklemler alt alta yazılıp birlikte çözüldüklerinde b0 ve b1 tahmincileri bulunur.

    XbbnY 10.

    2

    10 XbXbXY n

    XX

    n

    YXXY

    b2

    2

    1)(

    )).((

    XbYb 10

    şeklindeki formüller yardımıyla da tahminciler bulunabilir.

  • Ders 11 - 147

    Böylece veri noktalarımızdan geçen en iyi doğru denklemi:

    XbbY 10ˆ

    Gerçek Y’nin tahmincisi

    Traktör örneğimiz için gereken hesaplamaları yapıp normal denklemleri oluşturalım:

    XbbnY 10.2

    10 XbXbXY

    72725 = 12b0+42b1

    311525= 42b0 +188b1

    254537.5 =42b0 +147b1

    311525 = 42b0 + 188b1 - -56988 = -41b1

    yaş (yıl)

    (x)

    bakım

    harcaması

    (y)

    x y xy

    2.0 2500 4 6250000 5000

    4.5 9200 20.25 84640000 41400

    4.5 4950 20.25 24502500 22275

    4.0 5500 16 30250000 22000

    5.0 7900 25 62410000 39500

    5.5 10500 30.25 110250000 57750

    5.0 9700 25 94090000 48500

    0.5 1950 0.25 3802500 975

    6.0 8000 36 64000000 48000

    1.0 2025 1 4100625 2025

    1.0 3700 1 13690000 3700

    3.0 6800 9 46240000 20400

    toplam 42.0 72725.0 188.0 544225625.0 311525.0

    ortalama 3.5 6060.4

    b1=1390

    35*(72725 = 12b0+42b1)

    311525= 42b0 +188b1

  • Ders 11 - 148

    72725 =12b0 +42b1

    72725 =12b0 +42*1390

    b0 = 1195

    Doğrunun denklemi:

    XY 13901195ˆ

    Hesaplanan bu denklem kullanılarak yaşını bildiğimiz bir traktör için yapılacak ortalama bakım masrafını tahmin edebiliriz. Örneğin x=4 yaşındaki bir traktör için bakım masrafları:

    6755)4)(1390(1195ˆ

    13901195ˆ

    Y

    XY

    olarak bulunur.

    Tahmincileri elde etmek için normal denklemler yerine formüller kullanılırsa da aynı sonuçlar elde edilir.

  • Ders 11 - 149

    REGRESYON DENKLEMİNİN İNCELENMESİ

    Regresyon denklemini incelerken genellikle bizi en çok ilgilendiren soru incelediğimiz iki değişken arasında gerçekten bir ilişki olup olmadığı sorusudur. Bu soru aslında basit doğrusal regresyonda 1 ‘in değerinin 0 olup olmadığının araştırılmasıdır. Bu araştırmayı yaparken istatistiksel testle kullanmak gerektiğinden hata terimi ve parametre tahmincilerinin dağılışları hakkında bazı varsayımlarda bulunmak gerekir.

    Hata terimi e’ler, ortalaması 0 ve varyansı olan birbirinden bağımsız normal dağılışlar gösterirler.

    E(e)=0 Var(e)= s2

    - Tahminin Standart Hatası ve Varyansı

    Tahminin standart hatası s, noktaların regresyon doğrusu etrafındaki dağılımlarının ortalama bir ölçüsünü verir.

    2

    2

    kn

    es

    kn

    es

    2

  • Ders 11 - 150

    Korelasyon Katsayısı

    Korelasyon katsayısı, regresyon modeli ile bulunan tahmini Y değerlerinin, gerçek değerlere uygunluğunu ölçmede kullanılır.

    – Korelasyon katsayısı -1 ile 1 arasında değişir.

    – Katsayının -1 çıkması, iki değişken arasında ters yönlü tam bir ilişkinin olduğunu, 1 çıkması ise doğru yönlü tam bir ilişkinin olduğunu ifade eder.

    – Katsayının -1’e doğru yaklaşması ,değişkenler arasında ters yönlü kuvvetli bir ilişkiyi gösterirken, 1’e yaklaşması değişkenler arasında doğru yönlü kuvvetli bir ilişkiyi ifade eder.

    – Korelasyon katsayısının işareti, regresyon doğru veya eğrisine ait eğim katsayısının işaretidir.

    – Korelasyon katsayısının karesi, belirleme katsayısını determinasyon katsayısını) verir.

  • Ders 11 - 151

    Sınırlı sayıda veri üzerinden hesaplanan korelasyon katsayısı bir istatistiktir ve r ile gösterilir.Bu istatistiğin anakütle parametresi olarak karşılığı ’dur.

    Korelasyon katsayısı için genel formül;

    2

    2

    )(

    )ˆ(

    YY

    YYr

    ))(( 22 yx

    xyryada

    n

    YXXYxy

    ))((

    n

    XXx

    2

    22)(

    n

    YYy

    2

    22)(

    Bu formülde;

  • Ders 11 - 152

    Bütün bu değerler n katsayısı ile çarpılırsa sonuç değişmez ve korelasyon katsayısı;

    2222 )()(

    ))((

    YYnXXn

    YXXYnr

    ÖRNEK Bir süper market yöneticisi tesadüfi olarak seçilen bir saatlik sürelerde kasaya gelen müşteri sayısını ve ödedikleri toplam para miktarını aşağıdaki gibi kaydetmiştir. Müşteri Sayısı 25 20 50 35 40 Ödenen Para 12.5 10.4 25.3 20.2 24.1 (10000 TL)

  • Ders 11 - 153

    Müşteri sayısını bağımsız (X), kasalara ödenen para miktarını bağımlı değişken olarak kabul ederek, doğrusal korelasyon katsayısı;

    2222 )()(

    ))((

    YYnXXn

    YXXYnr

    formülü ile kolayca hesaplanabilir.

    X Y XY X2 Y2

    25 12.5 312.5 625 156.2

    20 10.4 208 400 108.1

    50 25.3 1265 2500 640.09

    35 20.2 707 1225 408.04

    40 24.1 964 1600 580.81

    170 92.5 3456.5 6350 1893.3 Toplam

  • Ders 11 - 154

    9669.0

    )5.92()3.1893(51706350(5

    )5.92(170)5.3456(5

    22

    r

  • Korelasyon (Bağıntı) Parametre Tayini, Karelerin En Küçüğü Yöntemi

  • Korelasyon Katsayısı • Değişkenler arasındaki ilişkinin kuvvetini nicelendirmek üzere

    kullanılan istatistik: KORELASYON KATSAYISI

    • Dikkat: Neden sonuç ilişkisiyle karıştırmayın. X artarken Y artıyorsa bu x’deki artış y’de artışa neden oluyor demek değildir.

  • Kovaryans

    İki değişken arasındaki doğrusal (lineer) bağımlılığın ölçüsü x ile y

    arasındaki kovaryansdır.

    Eğer x ve y bağımsızsa cov(x,y) = 0

    Eğer cov(x,y) = 0 ise bu x ve y’nin bağımsız olduğuna veya x ve y

    arasında lineer olmayan bir bağıntı olduğuna işarettir. Excel’de cov(x,y) = kovaryans(dizi1;dizi2) fonksiyonu ile hesaplanabilir.

    N

    yxyx

    yixi

    ))((),cov(

    Yığındaki birim sayısı

    X ve Y için yığın ortalamaları

  • Korelasyon (Bağıntı) Katsayısı • Kovaryans değişkenlerin birimine bağlı olduğundan büyük ya da küçük olması

    ilişkinin kuvvetli veya zayıf olması hakkında bir fikir vermez.

    • Birimsiz kovaryans = Korelasyon katsayısı

    • Birimsiz hale getirmek için kovaryans x ve y’nin standard sapmasına bölünür.

    yx

    yixi

    N

    yxyxp

    ))((),( p = [-1,1]

  • Kaynakça

    • İstatiksel formüller ve tablolar, Başkent Üniversitesi İktisadi ve İdari İlimler Fakültesi, Mart 2005, Ankara.

    • İstatistik, Anadolu Üniversitesi, Açık öğretim yayınları.

    • İstatistik ve Olasılık, Doç. Dr. İrfan Yolcubal, Kocaeli Üniversitesi, Jeoloji Müh. Bölümü

    • Statistics Toolbox, for use with matlab.

    • İstatistik ders notu, Fevzi Apaydın, www.fevziapaydin.com/FileUpload/ds279354/File/istatistik_ders_notu.pdf

    http://www.fevziapaydin.com/FileUpload/ds279354/File/istatistik_ders_notu.pdfhttp://www.fevziapaydin.com/FileUpload/ds279354/File/istatistik_ders_notu.pdf