PENGANTAR & STATISTIKA DESKRIPTIF BI5106 Analisis Biostatistik BI5106 Analisis Biostatistik Utriweni Mukhaiyar
PENGANTAR & STATISTIKA DESKRIPTIF
BI5106 Analisis BiostatistikBI5106 Analisis BiostatistikUtriweni Mukhaiyar
IlustrasiIlustrasi2
Berikut adalah data produksi panas bumi di 25 titik pengeboran (ton/jam):titik pengeboran (ton/jam):
77.71 44.24 60.00 89.54 85.6460.00 24.00 54.12 64.52 27.1487 46 42 13 43 04 45 75 111 2787.46 42.13 43.04 45.75 111.2727.79 41.49 47.70 83.00 14.3270.00 32.35 41.60 77.96 14.37
Informasi apa yang ingin diperoleh dari data ini ?1. Rata-rata produksi panas bumi di 25 lokasi tersebut.2. Penyebaran nilai produksi panas bumi di area wilayah pengeboran tersebut.3. Lokasi pengeboran dengan nilai produksi yang ekstrim.
4 Signifikansi rata rata produksi panas bumi di area pengeboran tersebut4. Signifikansi rata-rata produksi panas bumi di area pengeboran tersebut.
Il t iIlustrasi3
Berikut adalah data rata-rata curah hujan bulanan yang d d S P d h d h 2001 2004diamati dari Stasiun Padaherang pada tahun 2001 – 2004.
Sumber : Modul 3 Praktikum Mekanika Medium Kontinu “ Medan Gravitasi”
Tahun Jan Feb Mar Apr Mei Jun Jul Agust Sep Okt Nop DesTahun Jan Feb Mar Apr Mei Jun Jul Agust Sep Okt Nop Des
2001 278.59 279.78 355.29 241.34 115.9 176.9 55.32 29.08 43.82 313.68 508.49 267.82
2002 299.78 245.88 266.64 185.27 122.22 133.1 76.78 32.4 26.09 169.05 461.62 415.73
2003 425.21 370.8 300.23 157.43 184.96 69.93 23.28 14.39 17.86 275.23 433.23 456.02
2004 547.8 308.2 388 93 297 128 47 5 87 105 389 371.6
Informasi apa yang ingin diperoleh dari data ini ?1. Rata-rata curah hujan setiap tahun.2. Penyebaran tingkat curah hujan setiap bulan pada tahun tertentu.3. Bulan tertentu yang memiliki tingkat curah hujan yang khusus.
STATISTIKA DESKRIPTIF
4. Signifikansi perbedaan tingkat curah hujan antara tahun-tahun yang diamati.
INFERENSI STATISTIKA
Statistik dan StatistikaStatistik dan Statistika4
Statistik : nilai-nilai ukuran data yang mudah dimengerti.
Contoh : Contoh : o statistik (mis. rata-rata) nilai elevasi pasang surut air laut di
selat Makassar (m), o statistik (mis. variansi) hasil pengukuran tinggi gelombang ( ) p g gg g g
(cm) menggunakan AWLR (Automatic Water Level Recorder)o Statisitik (mis. range) antara nilai tinggi pasang maksimum dan
surut minimum (m)
Statistika : ilmu yang berkaitan dengan cara pengumpulan, pengolahan, analisis dan pernarikan kesimpulan atas data.
Jenis-jenis Statistikaj5
1. Statistika deskriptif: metode yang berkaitandengan pengumpulan dan penyajian data.
2. Statistika inferensi: metode yang berkaitandengan analisis sampel untuk penarikankesimpulan tentang karakteristik populasi.
Populasi dan Sampel6
Populasi
SampelSampel
setiap obyek populasi memilikip y p p m mkemungkinan/kesempatan yang sama untuk terpilih
Sampel Acak
hasil pengukuran atau pengamatan Data
Contoh Populasi dan Sampelp p
Akan dilakukan pengamatan tentang rata-rata produksi minyak bumi di Indonesiaproduksi minyak bumi di Indonesia.
PopulasiS l h titik
Kendala: - sangat banyak, -menghabiskanSeluruh titik di wilayah Indonesia
?
waktu, -menghabiskan biaya
Kaidah PengambilanSampel (Teknik
Keterwakilan sampelatas populasi ??
Sampel
? p (Sampling)
p p
7
pContoh: setiap propinsi diambil beberapa titik pengamatan
Jenis-jenis Observasi8
OBSERVASI / DATA
KUALITATIF KUANTITATIF
Nominal Ordinal/Rank Diskrit Kontinu
Tidak mengenalurutan dan operasi
aritmatika
Mengenal urutan danoperasi aritmatika
Berhubungan dengan‘proses menghitung’,
dan pengamatan atas
Didasarkan padasuatu selang/interval
sehingga meliputiaritmatika himpunan terhitung. semua bilangan riil
Jenis bencana yang terjadi di suatu daerah
Jenjang pendidikan (SD, SMP, SMA,...), tingkatan
d h (K l h
Banyaknya gempa yang terjadi di suatu daerah
d l 1 h i b k
Intensitas gempa yang terjadi setiap hari di
t il h ti k t j
(banjir, longsor, gempa, dll), jenis batuan, dll
daerah (Kelurahan, Kecamatan Kab./Kota, Provinsi, Negara), dll
dalam 1 hari, banyaknya hari hujan dalam satu bulan
di suatu daerah, dll
suatu wilayah, tingkat curah hujan harian di
suatu daerah, dll
© 2012 by UM
Statistika DeskriptifStatistika Deskriptif9
Metode Tujuan : Metodepengolahan danpenyajian suatu
gugus data
Tujuan : memberikan
informasi yang berguna.
Informasi berupa : bentuk
distribusi data
UkuranPemusatan
Mean, median, modus, kuartil, desil,
persentil, dll
10
PARAMETER DISTRIBUSI
UkuranPenyebaran (Variabilitas)
Variansi, simpangan baku, range, jangkauan
kuartil, dll
Kemencengan Skewness
Kelancipan Kurtosis
KarakteristikDistribusi
Kelancipan Kurtosis
Simetris Mean = Median
Kesimetrisan Skew Positif Mean > Median
BENTUK DISTRIBUSI
Skew Negatif Mean < Median
Puncak t l 1 modus
@ UM
Puncak (Modal)
tunggal
Puncak jamak Modus banyak
Karakteristik Distribusi11
1. PARAMETER DISTRIBUSI Ukuran Pemusatan
mean, median, modus, kuartil atas, kuartil
bawah dll
Ukuran Penyebaran
bawah, dllRange, simpangan baku, variansi, jangkauan antar
kuartil, dll
Kemencengan
Kelancipan
skewness
kurtosis
2. BENTUK DISTRIBUSI Simetris
Menceng/skew
mean = median
Menceng/skew Positif
Menceng/skew Negatif
BerpuncakTunggal
BerpuncakJamak
mean > median
mean < medianggg
# modus > 1 # modus = 1
CONTOH 1CONTOH 112
Data rata-rata curah hujan bulanan yang diamati dari Stasiun Padaherang pada tahun 2001 (n = 12)
278.59 279.78 355.29 241.34 115.9 176.9 55.32 29.08 43.82 313.68 508.49 267.82
x1 x2 x12x7 x10
Data yang diurutkan:
29.08 43.82 55.32 115.9 176.9 241.34 267.82 278.59 279.78 313.68 355.29 508.49
x(1) x(2) x(12)X(7) x(10)
Adakah perbedaan dari penyajian kedua data di atas?minimum maksimum
Ukuran Pemusatan & Penyebaran Data y13
Ukuran pemusatan datapstatistik yang memberikan informasi dimana data terkumpul dengan ukuran/jumlah tertentu.Contoh : Mean (rataan), kuartil bawah, kuartil tengah (median), kuartil atas, modus, persentil, ...
Ukuran penyebaran data Ukuran penyebaran datastatistik yang memberikan informasi bagaimana data menyebar di sekitar pusat data.y pContoh : range (jangkauan data), IQR (jangkauan antar kuartil), variansi, standar deviasi (simpangan baku), ...
Ukuran Pemusatan Data Ukuran Pemusatan Data 14
1. Mean (rata-rata)( )
1 n
ix xn
1in
Contoh :
1 2 12...12
x x xx
278.59 279.78 ... 267.82 222.1712
50% data (50% data (akhirakhir))50 % data (50 % data (awalawal))15
29.08 43.82 55.32 115.9 176.9 241.34267.82278.59279.78313.68355.29508.49
X2. Median
l h b d k l k
X(6.5)
Nilai tengah yang membagi dua kelompokdata sama banyak.
3 M d
med = x(6.5) = x(6) + 0.5 (x(7) - x(6) )= 254.58
3. ModusNilai yang paling sering muncul.modus tidak ada
4. Kuartil25 %25 % 25 %25 % 25 %25 % 25 %25 %29.08 43.82 55.32 115.9 176.9 241.34267.82278.59279.78313.68355.29508.49
q d q Kuartil bawah (q1) :
q1 q2 = med q3
1 14
nq x
1 12 1 1 3 4 334 4
1 70.474
q x x x x x4
2 (6 5)12 1 254.58 q x x2 2( 1) 1
4 2n nq x x
Kuartil tengah (q2) :
2 (6.5)12 12
254.58
q x x
3 3( 1)nq x
Kuartil atas (q3) :16
3 3(12 1) 3 9 10 994 4
3 305.214
q x x x x x4
5. Persentil
17 29.08 43.82 55.32 115.9 176.9 241.34267.82278.59279.78313.68355.29508.49
p25 p50 = med p75
• Persentil ke-i : ( 1)i nx
• Persentil ke-50 :50( 1) 1x x
( 1)100
i n
median
50( 1) 1100 2
n nx x
• Persentil ke-25 dan Persentil ke-75?
kuartil ataskuartil bawah
Ukuran Penyebaran Data y18
D Data : x1, x2, x3, ..., xnRataan : x
Ukuran penyebaran data yang Ukuran penyebaran data yang melihat bagaimana SETIAP (keseluruhan) observasi terpisah dari pusat datadari pusat data.
Tidak memberikan informasi apa- ( )n
ix xpapa, karena : 1
( )ii
( ) 0n n
i ix x x nx nx nx Jumlah Kuadrat (JK)1 1i i
2
1( )
n
ii
x x
Ukuran Penyebaran Datay19
1. Jangkauan data (Range)
2n
R = datamax – datamin
2. Variansi
R = 508.49 – 29.08 = 479.41
12 2 2
1 1
1 1( ) 1 1
n
in ni
i ii i
xs x x x
n n n
2 20663.8s
?
3 Si B k ( d d d i i )JKXX
20663.8 143.75 s3. Simpangan Baku (standard deviation)
s = √s2
k k l4. Jangkauan antar kuartildq = q3 – q1 dq = q3 – q1 = 234.74
Data PencilanData Pencilan20
Data yang nilainya berbeda jauh dari kelompok data yang lain.
Bagaimana mendeteksi data pencilan ??1. Hitung dq
2 Hitung BBP = q1 – k dq
dq = 234.74
BBP = 70.47–(1.5)(234.74 ) = -281.65
Pilih nilai k = 3/2 (optional)2. Hitung BBP q1 k.dq
3 Hitung BAP = q + k dq
( )( )
BAP = 305 21 + (1 5)(234 74) = 657 323. Hitung BAP = q3 + k.dq
4. Pencilan bawah < BBP
BAP = 305.21 + (1,5)(234.74) = 657.32
tidak ada pencilan bawah
5. Pencilan atas > BAP tidak ada pencilan atas
SARI NUMERIKCount (banyak data, n) 12Sum (jumlah data) 2666.01Average (rata-rata) 222.17
< di
21
Median (kuartil tengah) 254.58Mode (modus) -Minimum 29.08
mean < median
Maximum 508.49Range 479.41Standard Deviation 143.75 Menceng
kiri/negatif ???Variance 20663.8Skewness 0.303*Kurtosis -0.181*
kiri/negatif ???
25th Percentile (persentil-25) 70.46550th Percentile (persentil-50) 254.5875th Percentile (persentil-75) 305.205Interquartile Range (dk) 234.74* Perhitungan dengan Mic. Excel
Penyajian Datay j22
1. Tabel Distribusi Frekuensi2. Pie Chart3. Dot Plot4. Histogram5. Diagram Batang – Daun (stem - leaf)6. Diagram Kotak – Titik (box plot)7. dll…
Penyajian data dalam bentuk grafik dapat dilakukan secara
Skala penggambaran harus diperhatikan dalam penyajian data dalam bentuk grafik.Penyajian data dalam bentuk grafik dapat dilakukan secara manual maupun menggunakan software-software statistik seperti Microsoft Excel, SPSS, SAS, S-Plus, Minitab dan lainnya.
T b l Di t ib i F k iTabel Distribusi Frekuensi23
Data banyaknya pelanggan yang datang ke sebuah k d h d b l ly y p gg y g g
mini market di 15 hari tertentu pada bulan Juli 2011.26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
Kelas Interval Titik Tengah Kelas
Frekuensi (f) Frekuensi Kumulatif
21 35 28 1 121-35 28 1 1
36-50 43 4 5
51-65 58 1 6
66-80 73 2 8
81-95 88 7 15PRINSIP DASAR
PELUANG
Bagaimana bentuk histogramnya?
PELUANG
Pie Chart24
10%
9%
58%23%
Pie chart merupakan grafik yang berbentuk lingkaran yang ti t kili i t tmana setiap potongannya mewakili proporsi atau persentase
suatu komponen dari sebuah kelompok data (100%). Pemakaian pie chart hanya cocok ketika menyatakan data y y
dalam bentuk proporsi dari satu kelompok data.
Dot Plot25
2,5
3
3,5si
0,5
1
1,5
2
frek
uens
Cara menggambarkan data dalam bentuk titik dengan
00 20 40 60 80 100
nilai
Cara menggambarkan data dalam bentuk titik, denganmemperhatikan frekuensi dari data yang bersangkutan
Titik ditumpuk diatas nilai data yang digambarkan. Titik ditumpuk diatas nilai data yang digambarkan.
Histogram g26
Histogram adalah gambar berdasarkan distribusi g gfrekuensi
Setiap frekuensi dipresentasikan oleh suatu segi empat (rectangle)(rectangle).
Daerah setiap rectangle sebanding dengan frekuensinya.
Diagram Batang-Daun (Stem-Leaf)
27
Leaf)
26 37 39 46 49 59 69 76 83 83 83 87 87 95 95
Stem atau batang, mirip dengan grup data pada histogram, sedangkang p g g p p g gleaf atau daun, mirip dengan frekuensi.
Stem atau batang adalah digit pertama yang terpenting yang adadalam bilangan yang membentuk harga data, sedangkan digit dig y g g , g gbelakangnya akan merupakan leaf atau daun.
Melalui stem-Leaf masih dapat dilihat nilai data mentahnya.
Diagram Kotak-Titikg(Box-Plot)28
95100 max
85
95
76
60
70
80
90max
q2
q3
mean
26
47,5
20
30
40
50
min
q1
Box Plot digunakan untuk menyelidiki distribusi tanpa k d d h d
0
10
menggunakan grup data seperti pada histogram dan diagram batang daun.
Box Plot terdiri dari: data i q1 q2 (median) q3 dan Box Plot terdiri dari: datamin , q1 , q2 (median), q3 , dan datamax yang disusun secara terurut dengan membentuk kotak.
Pencilan pada Box PlotPencilan pada Box Plot29
* pencilan atasBAP (pagar atas)
upper whisker
q2
q3
mean
maksimum
lower whisker
q1
minimumlower whisker
**
pencilan bawahBBP (pagar bawah)
Kelemahan dan KeunggulanKelemahan dan Keunggulan30
KELEMAHAN KEUNGGULAN
DOT PLOT Tidak efektif untuk ukuran data yang besar
Cepat
Nilai data asli dapat diperkirakan
Lama Histogram peluang dapat memberi gambaran tentang distribusi populasi
HISTOGRAM Banyak perhitungan
Nilai data tidak nampak
gambaran tentang distribusi populasi
Tidak menuntut ketelitian dalam mencatat setiap nilai data
Cepat
BATANG-DAUN Menuntut ketelitian mencatat daun
p
Tidak memerlukan perhitungan
Nilai data asli dapat dilihat
Memudahkan perhitungan berbagai parameter
BOX PLOT
Membutuhkan perhitungan yang panjang
T di i d i
Box plot dapat memberi gambaran tentangbentuk distribusi populasi
Ef k if k b di k b kBOX PLOT Terdiri dari parameter-parameter dari data yang sudah diurutkan
Efektif untuk membandingkan bentukdistribusi beberapa kelompok data sekaligus
Bentuk Distribusi IdealN lNormal
31
mean = median
Memiliki bentuk distribusi yang simetris, yaitu :
Skewness = 0
K t i 3 (d l ft t t t k t i l 0 Kurtosis = 3, (dalam software tertentu kurtosis normal = 0
L tih 1Latihan 132
Suatu jenis polimer digunakan dalam sistem evakuasi pesawatterbang. Penting diperhatikan bahwa polimer tersebut harusmampu melawan proses penuaan. Diambil dua puluh sampelpolimer yang kemudian dibagi atas dua percobaan. Percobaanpertama (batch 1) yang melibatkan 10 sampel dikenakan prosespercepatan penuaan dengan temperatur tinggi selama 10 hari.Sedangkan 10 sampel lainnya (batch 2) tidak dikenakan proses
K k t d t (d l i) l lapa-apa. Kekuatan daya rentang (dalam psi) sampel-sampeltersebut diukur dan dicatat sebagai berikut.
Batch 1 227 222 218 217 225 218 216 229 228 221
Batch 2 219 214 215 211 209 218 203 204 201 205
Q: Apakah percobaan proses penuaan memberikan
Sumber: Walpole (2006), hal.13
Q p p p pdampak pada kekuatan daya rentang polimer?
Contoh 2Contoh 233
K l k i ik ki- Keluarkan sari numerik yang mungkinUkuran pemusatan data : MEAN, MEDIAN, KUARTIL BAWAH-ATAS
Ukuran penyebaran data : RANGE, JANGKAUAN KUARTIL, VARIANSI,SIMPANGAN BAKU
Lain-lain : SKEWNESS dan KURTOSIS Apakah diperlukan???
Pilih plot yang informatif untuk menjawab pertanyaan tersebut
Misal: BOXPLOT
SARI NUMERIK Batch.1 Batch.IIMean 222,10 209,90
34
, ,Variansi 23,6556 42,1000
Simp.Baku 4,86 6,49Min. 216 201Max. 229 219Q1 218 204,25
Median 221,5 210Q3 226,5 214,75
226.5229230 230
216218
221.5
210
215
220
225
214.75
219
2 0210
215
220
225
Batch 1195
200
205
210
201
204.25
210
195
200
205
210
@ UM
195 Batch 2195
APA YANG DAPAT DISIMPULKAN??
Transformasi Data (pengayaan)(p g y )35
Transformasi dilakukan untuk mendapatkan bentukdistribusi yang lebih simetris.
Transformasi Tangga Tukey-1/x2 -1/x √x log (x) x x2 x3 10x
data awal untuk bentuk distribusi : skewness negatif
untuk bentuk distribusi : skewness positif
Data contoh kasus : skewness = 0 5 (menceng kiri)
Merenggangkan data‐data yang berharga kecildan merapatkan data‐data yang berharga besar
Merapatkan data‐data yang berharga kecil danmerenggangkan data‐data yang berharga besar
Data contoh kasus : skewness = -0,5 (menceng kiri), maka transformasi yang mungkin adalah x2, x3, dan 10x.
Transformasi Data (pengayaan) Contoh KasusContoh Kasus
36x y = x2
Lebih mendekati simetris (skew = 0) 873759
756913693481
Lebih mendekati simetris (skew 0) dibanding sebelum transformasi
(skew = -0,5)
49699583
2401476190256889 k 0 1883
873995
6889756915219025
skew = -0,18
837683
6
6889577668896 626
466762116
transformasi
** Ketika data ditransformasi, maka satuandari data juga akan berubah
Referensi
Djauhari, M.A., 2001, Catatan Kuliah Analisis Data.
Walpole Ronald E et al Statistitic for Scientist and Walpole, Ronald E., et.al, Statistitic for Scientist and Engineering, 8th Ed., 2007.
37