36
RENCANA MUTU PEMBELAJARAN: STATISTIC & PROBABILISTYKONTRAK
PEMBELAJARAN:
Pembelajaran meng-insertkan sofskill (character building):
working independently (SC, honesty) & team work (interpersonal
skill)
Toleransi masuk kelas: 15 menit
Proses pembelajaran mrpkan aktifitas 2 arah.Koordinator kelas:
Nama ...................................... No.
Hp...................................
NoKDDateSubjectSub Subject
1125 FebIntroductionSta.&prob Frequency and Distribution
Tabulation of data
Frequency grouping, Cumulative Freq, Graphycal representatio,
Accuracy & precision of measuement, Problems.
24 MarCharasteristics of distribution: Central tendencyAverage,
Arithmetic Mean, Median, Mode, Quantiles. Problems
311Charasteristics of distribution: dispersionVariance, standard
distribution, degree of freedom, coef of variation. Problems
418Test of KD1
5225Probability, Prob. Distribution & expectation.
61 AprSample: accuracy of the Mean
78Binomial Distr, Pisson Distr.
815 Test of KD 2
22Free
9329Normal distribution
106 MayUse of normal distr.
1113Chi-squared test
121920Test of KD3
13427Comparison of Mean
1423 JunLeast Squares Method & Regression, Correlation,
Multiple Regression, Analysis of variance.
1510MINGGU TENANG
17UJIAN KD3 & KD4
STATISTIK
Data
Alat
Is a science that deals with the collection, tabulation,
analysis, and interpretation of quantitative & qualitative
data.
Data:
Kualitatitf: data berbentuk kalimat, kata, gambar
Kuantitatif: data yg berupa angka, atau data kualitatif yg
diangkakan (skoring)
1. Data/variabel diskrit: data yg diperoleh dr hasil menghitung
(bukan mengukur): Jumlah mhs = 40 (disebut juga data nominal,
diperoleh dr survey / eksploratif).
2. Data/variabel kontinyu: data yg diperoleh dr hasil
pengukuran.Kuat beton = ...., jumlah kendaraaan di jalan ... =
...., jumlah hujan = ....
Mencari data ( see the pp
FERQUENCY DISTRIBUTION (distribusi frekuensi)
-bidang enggineering sering melakukan pengukuran /
penelitian
-sering terjadi error, hub nya dg ACCURACY (akurasi) &
PRECISION (presisi), terkait dg alat, manusia, lingkungan
dll.(lihat Gambar 2-5).TABULATON OF DATA
Hasil pengukuran ditabulasikan ( Contoh
Data bisa diurutkan/diranking: kecil ( besar (ASCENDING), atau
besar ( kecil (Decending)
Data di masukkan dlm Interval Kelas,
Nilai tengah dr tiap kelas dicantumkan,
Jumlah data pd tiap interval dihitung, dst.
....
Hingga diperoleh Relative Feqiency Distribution.
Lihat data Cummulative freq. F:
Berapa jumlah bata yg memp. Kekuatan LEBIH KECIL DARI 5,5 ?
Berapa jumlah bata yg memp. Kekuatan TIDAK LEBIH KECIL DARI 9,5
?
Bisa kah kita sebut: LEBIH BESAR DARI 9,5? (TIDAK)Proporsi bata
dg kekuatan < 5,5 = 30/270 = 0,11.
(Tidak bs disebut lebih besar dr 9,5 krn bata dg kekuatan 9,5
masuk dlm interval 9,5 10,5)
GRAPHICAL REPRESENTATION Grafik Histogram: Absis: class
interval; Ordinat: frequency f
Grafik Frequency Polygon: Absis: nilai tengah; Ordinat:
frequency f(biasanya utk data diskrit)Utk melihat procentase:
Grafik Kumulatif Frekuensi & fractional cummulative freq.:
Absis: class interval; Ordinat: cummulative frequencyOrdinat grafik
ini = representasi dr area sebelah kiri dr ordinat grafik
histogram.
Amati: Less than 6,5; dan Not less than 6,5.DAY 2:
HW 21 n 15
TEAM WORKPengujian terhadap kuat desak beton menghasilkan data
sbb:
Fig 2-2 has not been explained yet.CHARACTERISTICS OF
DISTRIBUTION: CENTRAL TENDENCY DISPERSIONCENTRAL TENDENCY
AVERAGE (rata-rata): Arithmetic Mean
Geometric Mean
Arithmetic Mean (MEAN = Xrt):-Jumlah dari nilai observasi /
pengamatan dibagi julah data:
Xrt =
3.1-Jumlah dari deviasi terhadap nilai Mean = 0
Xrt =
3.2Untuk jumlah data yang BANYAK (large number of observation /
sample) ( gunakan metode klas interval.
Lihat Tabel 3-2 (data dari Tabel 2-3)
Xrt = X0 + (friction mean) . w
3.3Keterangan:
X = nilai tengah (mid point) yang pertama = 2
Xi = deviasi nilai tengah pertama terhadap nilai tengah
berikutnya
w = lebar kelas Dari pers 3.3 diperoleh X rt = 2 + 4,92 x 1 =
6,92 NILAI RATA-RATA dari data Tabel 2.1 = 6,89.MEDIAN
Suatu Nilai yang membagi luas histogram menjadi dua sama
besar.
Median tidak konsen terkait dg numerik tapi pada jarak/posisi
data
Contoh:
Data: 21, 22, 31, 34, 31, 22, 17, 26 ( (n = 8)Data diurutkan:
17, 21, 22, 22, 26, 31, 31,
Median = (22+26)/2 = 24
Jika data = 34 tidak ada, Median = 22Contoh:
Data: 2, 3, 6, 8 9, 9, 12 ( Median = 8, Mean = 7Data: 3, 3, 6,
8, 9, 9, 18 ( Median masih sama, yaitu 8 , tetapi Mean = 8MODE
Merepresentasikan nilai tertinggi (peak value) pd distribusi
frekusensi.
Nilai dimana jumlah datanya paling banyak.Contoh: Kandungan
polutan dalam air (ppm) yg diukur dari 11 sampel adalah sbb:
1234567891011
45204570452044904540457045004520452045004590
Mean = 4530,9Data diurutkan ( ascending (kecil ke besar)
Mode = .4520 (jumlahnya 4)
Median = ....PROBLEM 3.1:
-Pengujian kekuatan regangan (kN/m2) pd 303 buah benda uji
selama 7 hari telah ditabulasikan sbb :
Tabel 3-4 n 3-5
PROBLEM 3.2:
MODE= 44, MEDIAN = 44,02, MEAN=44,6785%X541= 460 cars ( 54km/h;
95%x541= 530 cars ( 67km/h.
PR. Hitung Mean dr data hujan : ungroup data & frequency
tabel.DISPERSION DISTRIBUTION
VARIANCE:Jika terdapat satu set data (populasi terbatas) dg
jumlah observasi = n; dan nilai mean = , maka setiap observasi (xi)
mempunyai deviasi (.Xi - Xrt...). (Deviasi = residual).Varian (Mean
square deviation):
2 = atau JIKA TANPA MENCARI HARGA RATA-RATA ( 2 = X2/n
(X/n)2Varian pada distribusi frekuensi DATA TUNGGAL & DATA
BERGOLONG:
See page 43 & 45
STANDARD DEVIATION (Deviasi Baku):Utk keperluan praktis
digunakan Sandard deviasi (nilainya selalu positif) = akar dari
VARIANStandar deviasi = akar dr variance = =
JIKA TANPA MENCARI HARGA RATA-RATA ( = ......................
Untuk Populasi: RATA-RATA = ; VARIAN = 2; DEV. STANDARD =
SAMPEL: rata-rata =; VARIAN = S2 ; DEV. STANDARD = SS2 =
JIKA NILAI RATA-RATA tidak BULAT:S2 =
......................................
Contoh Excell (page 47)====================== 19/3/14COEFISIEN
VARIASI
Kalau Std. Deviasi diekspresikan sesuai data variabel yg
ada.
Coef variasi ( V) diekspresikan dalam prosentasi:
Kv = /Xrt x 100
CONTOH:Data X = 1,5,9,13,17
( Xrt = 9; S =6,32; Kv = 70,27% Data Y = 1,3,5,7,9,13,15,17( Xrt
= 9; S = 5,48; Kv = 60,89% SEBARAN DATA X lebih renggang drpd
Y.
Koefisien SKEWNESS (Kemencengan / Kemiringan): Cs = a3= m3
/S3;m3= (Xi-Xrt)3/n ( aplikasi : n .(Xi-Xrt)3/(n-1)(n-2) Koefisien
KURTOSIS (Keruncingan): a4= m4 /S4;m4 = (Xi-Xrt)4/n ( aplikasi : n2
. (Xi-Xrt)4/(n-1)(n-2)(n-3)JIKA
a3 > 0 (distribusi miring positifa3 < 0 ( negatif
a3 = 0 ( simetrik
JIKA:
a4 > 3 (runcing
a4 < 3 ( landai
a4 = 0 ( normal
CONTOH:DATA: 1,1,1,1,1,2,2,2,2,2,2,2,3,3,4,5,5,6,7,8
X=60; X2=266; n=20; Xrt=3; S=2,128
(X-3)3 = 186S3=9,636m3= 186/20 = 9,300
a3=9,300/9,636=0,965 (X-3)4 = 1082S4=20,506m4=1082/20=54,100
a4=54,100/20,506=2,638
Nilai a3 & a4 menyimpulkan bahwa distribusi datanya miring
ke kanan dan landai. ( Gambar!BILANGAN BAKU:
Seberapa jauh sebuah nilai menyimpang dari rata-ratanya
Z = (Xi Xrt)/S
RANGE = jangkauan: Nilai Data maksimum Nilai Data minimum==
PROBABILITY, PROBABILITY DISTRIBUTION, n EXPECTATION
SOAL KD 1 STATISTIK & PROBABILITASBerikut data distribusi
frekuensi dari populasi suatu alat yang diuji coba dalam suatu
laboratorium:
Lifetime
(jam)400-499500-599600-699700-799800-899900-9991000-10991100-1199
Jumlah25657910892763421
1. Buat histogram dan diagram frekuensi kumulatif2. Berapa
persen alat yg lifetime-nya tidak lebih dari 700 jam?
3. Berapa persen alat yg lifetime-nya minimal 600 jam dan tidak
lebih dari 1000 jam?
4. Hitung mean, median dan mode
5. Hitung varian, koefisien varian, dan standard deviasi data
populasi di atas.
==PERMUTASI
Contoh 1:
Dari angka 1,2,3,4,5, berapa bnyk angka 3 digit bs diatur
(setiap angka bs diulang)?
Masing2 angka berpeluang 5 kali
Jadi terdatat 5x5x5 = 125 angka yg berbedaContoh 2:
Berapa banyak angka dg 4 digit bs dibentuk dari angka 1 sd
9?
Rms 1
nPr = n!/(n-r)! = 9!/5! = 9x8x7x6 = 3024 angka
Jika r = n ( Rms 2: nPn = n!
Contoh 3:
Berapa banyak pola yg dibuat dari 3 warna kuning, 2 merah, 7
hijau?
n=3+2+7=12
Rms 3= 12!/(3!x2!x7!) = 7920
Contoh 4:
Berapa banyak cara sebuah tim beranggotakan 9 orang yg dipilih
dr 12 orang?
Rms 4:
n=12; 2=9 ( nCr = n!/r!(n-2)! = 12!/9!x3! = 220
Contoh 5: Dari 5 pria & 4 wanita, dalam berapa banyak kita
dpt memilih grup yg terdiri dari 3 pria & 2 wanita?
A. Pilih 3 dr 5 pria: 5C3 B. Pilih 2 dari 4 wanita: 4C2
Jawab: 5C3 x 4C2 = (5x4)/2 x (4x3)/2 = 60PROBABILITY
KONSEP DASAR PELUANG
Sebuah dadu dilempar.
S = (1,2,3,4,5,6); n(S) = 6
A = no gasal = (1,3,5); n(A)=3
( P(A) = 3/6=0,5
B = bil prima = (2,3,5); n(B)=3
( P(B) = 3/6=0,5
C = yg tak kurang dr 3 = (3,4,5,6); n(C)=4 ( P(C) = 4/6=0,67
P(A+B) = P(A) + P(B) P(AB)
Gambar peluang kejadian dr 2 kejadian yg independen
PELUANG BERSYARAT, yaitu:- peluang munculnya kejadian B jika
kejadian A telah terjadi: P(B/A) = P(AB)/P(A)- peluang munculnya
kejadian A jika kejadian B telah terjadi: P(A/B) = P(AB)/P(B)
Gambar klasifikasi kejadian
Dua kejadian A & B disebut independet JIKA:P(A/B) = P(A)
atau P(B/A) = P(B)
Contoh:Dari 900 orang yg disurvey, trdapat data sbb:
Tabel: orang yg bekerja ditijau dr jenis kelamin
Bekerja (B)Menganggur (M)J
L46040500
W140260400
JUMLAH600300900
Seseorang dipanggil secara randon. Jika orang tsb telah bekerja,
peluang orang tsb adalah laki-laki? P(L/B) = 460/600 = 0,767
Cara lain: P(BL) = 460/900 = 23/45; P(B) = 600/900 = 2/3 ;
P(L/B) = P(BL)/P(B) = (23/45) / (2/3) = 0,767
Contoh:Sebuah perusahaan jasa antar menggunakan kendaraan A
& B spt dlm tabel:
Kilometer
A BTotal40.001 dan lebih102030
20.001 40.000
6050110
0 20.000
301040
Total
10080180
Berapa peluang kendaraan yg lebih dari 40.000 km? (= 30/180)
Berapa besar peluang masing-2 kendaraan ?
Jawab:untuk A ( P = (10/180) / (100/180) = 0,1
Untuk B ( P = (20/180) / (80/180) = 0,25
DISTRIBUSI PELUANG
Proses generalisasi terkait statistik memuat ketidakpastian, krn
brdasar sampel
Model matematik diperlkan utk menjelaskan sifat populasi secara
teori statistik
Model teoritis tsb ( distribusi peluang
Variabel Random Diskrit (VRD) Jika nilai-nilai var random tsb
dpt didaftar sbb:
x1, x2, x3, ..... xn
Distribusi Peluang Diskrit (discrete probabilitty
distribution):
Peluang dari variabel random diskrit : p0, p1, p2, ....pn
Dimana pi > dan = 0 dan jumlah semua probabilitas = 1
Gambar Distribusi Peluang dari VRD: absis xi ; ordinat
p(x)Fungsi distribusi kumulatif dari VRD didefinisikan sbg:
P (X) = pi untuk xi XCatatan:
p(x) = probabilitas; P(X) = kumulatif probabilitas (ingat f
& F = frekuensi & kumilatif frekuensi)
Gambar Fungsi distribusi kumulatif (cumulative dist function =
cdf) dari VRD : absis xi ; ordinat P(X)
Contoh:
Gambar distr prob & distr prob kumulatif dari var random x
(dari 2 dadu):
Prob mendapatkan jumlah sama dengan2 = 1/6 +1/6 = 1/36 =
p(2)
3 =
KURVA NORMAL
Luas wilayah dibawah kurva distribusi frekuensi = jumlah data
(N) ( seperti luas histogram( jumlah dr semua kemungkinan = 1 unit
(100%)
( luas wilayah di bawah kurva distribusi probablitas = 1
( kurva disebut normal jika:
p(x) =
.............................................................. (
9.16p(x)=probability density for deviation (x-)
= bergerak sepanjang sumbu x tidak merubah bentuk kurva
= mempengaruhi melebar atau meruncing nya kurva
Normal biasa ( var random nya: & dirubah ke Normal Baku (
var rnadom nya : z
z = (x-)/
f (z) = ................................................ ( 9-18
( Tabel Ordinat Kurva NormalDISINI, variabel z memiliki nilai
rata-rata = 0 dan st. Dev = 1
LUAS AREA DIBAWAH KURVA NORMAL
Luas di bawah kurva normal antara mean (z=0) dan x=z adalah:
F(z) = f(z) dz
F(z) = ................................................. 9-19Fig
9-3 . Luas daerah di bawah kurva probabilitas normal
Absis: x & z;
Tabel 9-1.z00,250,50,670,67450,6811,9622,52,5763
F(z)00,09870,19150,24860,250,25180,34130,47300,4770,4930,4950,498
2xF(z)00,19740,500,68260,950,990
NOTE: SOME IMPORTANT PROBABILITIES50%( 0,6745
68,26% (
95% (1,96
99%( 2,576
Untuk mengetahui data observasi mengikuti kurva normal:1.
Berdasar visual/mata( Probability Paper (jaman belum ada komputer
?)
Dengan kertas ini, jika data di plot ke dalam nya, akan
membentuk (mendekati ) garis lurus.
REMEMBER: cummulative frequency curve ( berbentuk S (not
convenient)
KERTAS PROBABILITAS:
Absis: data observasi (skala linier)
Ordinat: Kiri: probabilitas Not less than x; Kanan: Less than
x
Nilai Mean ( diperoleh dari prob 50% lalu ........
Nilai st. Dev ( dari prob 16% .....
NOTE: tail area = 05 F(z) ( figure !
2. Chi SquareLEVEL OF SIGNIFICANCE
Jika distribusi data normal, maka prob 1-2F(z) = prob diluar
range z (tail area) ( probabilitas in disebut the level of
significance of statistical test yg ditandai dg .See fig 10-12 for
two-sided tests & one sided test
=level of sign = 1- 2F(z):
one tail area = /2 = 0,5 F(z)
Area of acceptance = 2xF(z) = confidence level
Jika z = 1,96 ( = [1- 2F(z)] = 1- 0,95 = 0,05 = 5%.
Penjelasan:
jika suatu data nilainya berjarak dari nilai Mean minimal
sebesar 1,96, maka data tsb significan berbeda dg data mayoritas yg
mengikuti distr. Normal & kemungkinannya adlah 5%.
ATAU: sekumpulan data tsb kemungkinannya 5% salah
Derajat kepercayaan (degree of confidence) 95% adalah area
2F(z).
Batasan (-z) dan (+z) disebut confidence limits.
Confidence level adlah area of aceptance region.
Significance level adalah area of rejection region.
Nilai z untuk beberapa area dalam interval (z)Level of
Significance %zConfidence Level
Team work: Pelajari soal 10-1 & 10-2 & 10-3 &
10-5===
DISTRIBUSI NORMAL
DISTRIBUSI NORMAL UMUM: N(,2)
The most widely used & most important continuous probability
distribution Many statistical methods derived under assumption of
normal distr.
Coef of skewness pd normal distrb = .....?
Rumus umum :
P (x) = (22)-1/2 e-1/2 (x )2/2 . untuk - < x < Notasi umum
: N (,2) ( distribusi normal dg mean dan variance 2Data
berdistribusi normal: Kurva simetris spt lonceng
Jumlah data di atas Mean & Simpangan Baku = jumlah data di
bawah Mean & Simpangan Baku
Prosentasi luas kurva normal kekanan & ke kiri sama, yaitu:
34,13% (1SD), 13,53% (antara 1SD&2SD), 2,27% (antara 2SD &
3SD)
Jumlah SD dari suatu kelompok data adalah tak terhingga, maka
secara teorotis kurva normal tak pernah menyentuh dasar ( luasnya
99,99% (bukan 100%) tp dalam praktek disebut 100% (kiri & kana
masing2 50%)DISTRIBUSI NORMAL STANDAR (BAKU): N(0,1)
Disebut standar krn nilai rata-rata = 0, dan SD = 1,2, dst.
Persamaan umum pd kurvanormal umum di atas sulit diselesaika
secara analitis ( ditransform secara linier dg simbol z:
Z = (x-)/
Variabel random Z menjadi N(0,1) artinya: =0, 2=1
PENGUJIAN NORMALITAS DATA
(Penelitian biasanya pertama kali berasumsi bahwa datanya
berdist. Normal) Plot data pd kertas probabilitas normal (secara
visual)
CHI KUADRAT
CHI SQUARE TEST (CHI KUADRAT)Chi square test untuk mengetahui
apakah data frekuensi Observasi berbeda cukup signifikan dengan yg
diharapkan (Expectation).X2 = (O E)2 EPersamaan di atas dibatasi
(constrain) dg: O = E = N
( = jumlah semua kelas)N = total data (frekuensi)
K = jumlah kelas
Nilai chi (X2) tsb di atas diandingkan dg nilai chi tabel.
Contoh 1:Nilai mata kuliah Statistik dari 150 mahasiswa adalah
(lihat tabel kolom . Uji normalitas data dg Chi Kuadrat.
Step pengujian:
Tentukan jumlah kelas interval. Sesuai dg jumlah batasan luasa
di bawah kurva normal (ada 6) ( jumlah kelas =6
Tentukan lebar kelas = (data terbesar terkecil)/jumlah kelas
Susun dlm tabel.
Jika nilai Chi hitung < nilai Chi dalam tabel ( distribusi
datanya NormalChi tabel diambil berdasar: dk (derajat kebebasan /
degree of freedom) & level of significant yg ditetapkan
DEGREE OF FREEDOM:
-is defined as a comparison between the data,
-the number of independent variables minus the number of
constraint
if there are n independent variabel related by m equation
(restrictions) ( degree of freedom = n-m
Degree of Freedom (dk= derajat kebebasan) dalam Chi Kuadrat:Dk =
K -1K = jumlah kelas interval
Angka 1 karena constraintnya =1 yaitu persamaan *) di atas
HOME WORK:
Analisis dg Chi Kuadrat data hujan pd PR yg lalu apakah ikuti
distribusi normal atau bukan.Cek nilai skewness nya.
CONTOH :
Data diameter pipa diasumsi berdistribusi normal. Mean=4,5cm.
St.dev= 0,005cm. Berapa probabilitas pipa yg berdiameter lebih dari
4,51cm?
Z=4,51-4,5 /0,005 = 0,01/0,005 = 2 ( table : z=2, F(z)= 0,4772,
maka 0,5-0,4772=0,0228=2,28%
Latihan:(Carilah luas di bawah kurva normal:
1. yg dibatasi oleh z= 0 dan z=1,24
2. yg dibatasi oleh z = - 0,76 dan z = 0
3. yg dibatasi oleh z= - 0,76 dan z=1,24
4. di sebelah kanan z= - 0,76
5. di sebelah kanan z= 2,21
6. yg dibatasi oleh z = 0,76 dan z = 1,24
( Dari 2000 mahasiswa, rata-rata tinggi badan = 160 cm. Deviasi
standar 4 cm. Dengan mengganggap distribusi normal, berapa banyak
mahasiswa yg:
a. tingginya lebih dari 166 cm?b. yg tingginya antara 150cm dan
165 cm.
Catatan:
Jika suatu data ditentukan nilai Mean & SD nya ( terdapat 2
constraint lagi, shg m=2 ( nilai dk menjadi dk= k 1
-2====STATISTIK
Arti sempit: data
Arti luas: alat utk analisis guna mengambil keputusan
Statistik dibedakan menjadi 2, yaitu:
1. Statistik Deskriptif
(digunakan utk menggambarkan/menganalisis suatu statistic hasil
penelitian, ttp tidak utk mengambil kesimpulan yg lebih luas (tidak
menggeneralisir). 2. Statistik Inferensial: a. Statistik
Parametris, b. Statistik Non Parametris
(digunakan utk menggambarkan/menganalisis suatu sampel
penelitian dan hasilnya akan digeneralisir pd polulasi dimana
sampel diambil.a. Sta. Parametris: utk analisis data Interval /
Ratio dari populasi dg Distribusi Normal
b. Sta. Non Parametris: utk analisis data Nominal dan Ordinal
dari populasi yg bebas distribusi (tidak hrs normal)(Teknik
Korelasi dan Regresi dapat berperan baik pd st. deskriptif maupun
inferensial)DATA PENELITIAN
Kualitatif: berbentuk gambar, kalimat, dll
Kuantitatif: berbentuk angka atau data kualitatif yg
di-angka-kan/scoring
1. Data diskrit (Nominal):
(diperoleh dari menghitung (bukan mengukur)
( biasanya dlm penelitian survey
2. Data Kontinum:( diperoleh dari hasil pengukuran, yg
dikelompokkan dalam: a. Data Ordinal: data berjenjang (juara
1,2,3)b. Data Interval: data yg jaraknya sama dg tidak mempunyai
nilai Nol absolute (pen. Social: skala likert, dll., data ini bisa
dijadikan data ordinal)c. Data Rasio: data yg jaraknya sama dan
punya nilai absolute (berat/kg, panjang/m, dll, bisa dijumlah,
dikali, data yg lain tdk bisa). Data ini dpt disusun kedlm data
ordinal atau interval.Teknik statistic mana yg digunakan? Tgt pada
data : 1) jenis data nya, 2) bentuk hipotesisnya. 1. Hipotesis
Deskriptif: Pernyataan terkait dugaan nilai suatu variable
mandiri
Rumusan masalah: Berapa umur efektif bangunan jembatan ini?
Hipotesis: Umur efektif bangunan jembatan = 50 tahun
2. Hipotesis Komparatif:Pernyataan terkait dugaan nilai satu
variable atau lebih pd sampel yg berbeda
Rumusan masalah: Apakah ada perbedaan kekuatan antara genteng
beton produk X dan produk Y?
Hipotesis: kekuatan genteng produk X sama dengan produk Y
3. Hipotesis Asosiatif:Pernyataan yg menduga adanya hubungan
antara 2 variabel atau lebihRumusan masalah: Apa ada hubungan
antara jumlah kendaraan dan kecelakaan di jalan?
Hipotesis: Tidak ada hubungan hubungan antara jumlah kendaraan
dan kecelakaan di jananUJI HIPOTHESIS:
Hipotesis dlm penelitian: merupakan suatu pernyataan /argumen
yang akan diuji kebenarannya Hipothesis dlm statistic: pernyataan
statistic ttg parameter populasi (taksiran parameter populasi
melalui data sampel)Hipotesis Nol: Ho = tidak ada perbedaan antara
ukuran sampel dan populasi
Hipotesis Alternatif: Ha = ada perbedaan antara ukuran sampel
dan populasi1. Hipotesis Deskriptif: perkiraan nilai suatu variable
bebas, tidak diperbandingkan / hubungan.a. Uji t-test (uji
statistik parametris utk menguji hipotesis deskriptif)
(Uji 2 pihak (Two Tail Test)
Uji 2 pihak digunakan jika hipotesis Ho berbunyi: sama dengan
(=); dan Ha berbunyi: tidak sama dengan () Jika t hitung t tabel (
Ho diterima;
Gambar : daerah penerimaan & penolakan.
Contoh:
Produsen baja menyatakan bahwa daya tahan / kekuatan baja
produksinya = 4 (satuan unit). ( Apa iya?
Rumusan hipotesis:Hipotesis nol (Ho):
daya tahan baja = 4 ( =4Hipotesis alternatif (Ha): daya tahan
baja 4 ( 4Dari sampel diketahui: n=31, x rata2 = 4,645; S =
1,81
Lihat tabel Nilai-Nilai dalam distribusi t
Jika derajat kesalahan () ditetapkan = 5% dan derajat kebebasan
= n-1= 30 ( nilai t tabel = 2,042
T hitung < t tabel ( Ho diterima (bahwa daya tahan baja tsb =
4 satuan ).
Plot harga t pada gambar tsb di atas!
(Uji Satu Pihak (One Tail Test)
Uji Pihak Kiri
Uji pihak kiri digunakan jika hipotesis Ho berbunyi: lebih besar
atau sama dengan (); dan Ha berbunyi: lebih kecil ()
Jika t hitung t tabel ( Ho diterima;
Gambar:
Contoh:
Asosiasi Pengembang menyatakan bhw jumlah rumah paling banyak
100 unit terjual tiap bulan.
Apa iya?
Ho: rumah terjual paling paling banyak 100 ( 100 unit)
Ha: rumah terjual paling > 100 unit (> 100 unit)
Penelitian pd 20 Pengembang (n=20): nilai rata2 = 86,65; S =
15,83
( t = (86,65-100)/(15,83/V20) = - 3,77 Dk = n-1= 20-1= 19 =
5%
Tabel uji satu pihak = 1,729 Plot di gambar: t hitung terletak
pd area penerimaan ( Ho diterima!
b. Uji Chi KuadratX2 = (O E)2 E
O = frekuensi Observed; E = frekuensi Expexted (yg diharapkan)N
= total data (frekuensi)
K = jumlah kelas
Nilai chi (X2) tsb di atas diandingkan dg nilai chi tabel.
Contoh:
Penelitian menunjukkan data terkait warna cat tembok yang
disukai masyarakat:
1000 orang memilih warna biru; 900 pilih merah; 600 pilih putih;
500 pilih warna lain.
Ho: peluang masyarakat memilih empat warna adalah sama
Ha: peluang masyarakat memilih empat warna adalah TIDAK sama
WarnaOEO E(O-E)^2(O-E)^2/E
Biru100075025062.50083,33
Merah90075015022.50030,00
Putih600750-15022.50030,00
Lainnya500750-25062.50083,33
Jumlah300030000170.000226,67
Dk = K-1 = 4-1 = 3; kesalahan: 5% ( Chi Kuadrat table = 7,815Chi
Kuadrat hitung = 226,67> table = 7,815 ( Ho ditolak, Ha
diterima2. Hipotesis Komparatif( Komparasi 2 sampel:
a. Uji 2 pihak:
Ho: tidak ada perbedaan (ada kesamaan) produk beton antara yg
diberi zat addiktif tertentu dan yg tidak
Ha: ada perbedaan (ada kesamaan) produk beton antara yg diberi
zat addiktif tertentu dan yg tidak
Contoh: N=25;
Diberi zat: X1 rerata = 74; S1 = 7,5; S12 = 56,25
Tdk diberi zat: X2 rerata = 79,2; S2 = 0,17; S22 = 103,5
Rumus:
Nilai t hitung < t table;
Contoh di atas: r = Coefisien korelasi = 0,866 ( t hitung = -
4,952
Dk = n1 + n2 2 = 25+25-2= 48; dg tingkat kesalahan 5% ( t table
= 2,013 ( Ho ditolak
3. UJI HIPOTESIS ASOSIATIF
->hipotesa / dugaan adanya hubungan antara 2 variabel dalam
populasi dg mengambil sampel dari populasi tsb.
->dihitung koefisien korelasi (r) yg juga disebut korelasi
Product Moment antara 2 variabel tsb. Dg rumus:
Dimana X = xi-x rata2; Y = yi y rata2
R = koefisien/ angka yg menunjukkan relasi (hub) anta var x
& y
Nilai -1r1
r = 0 ( tidak ada korelasi
r = 1 ( positif sempurna ( garis dg gradien +;
r = -1( negatif sempurna ( garis dg gradien ;
Contoh: -> excel: ada tidaknya hubungan antara pendapatan
& pengeluaranHasil r diuji signifakannya dg table r produt
momen, dan atau dg uji-t (t table)
Uji t:
=
Nilai t hitung = 6,33;
Nilai t tabel: Dk = n-2 = 8; kesalahan: 5%; ( t tabel =
2,306
t hitung > t tabel ( Ho ditolak; berarti terdapat hubungan
antara pendapatan & pengeluaran dg koef. Korelasi ( r ) =
0,9129
Koefisien Determinasi:
r2 = 0,83 ( artinya 83% pengeluaran ditentukan oleh factor besar
pendapatan, sedangkan yg 17% ditentukan oleh factor lain, misalnya
sakit, dll. ====
ANALISIS DUA VARIABEL ATAU LEBIHPertanyaan:
1. Adakah hubungan antara variabel x & y? ( berdasar common
sense, bukan berdasar statistic/matematik2. Jika ada hubungan,
bgmana hubungan tsb? ( regresi3. Seberapa erat hubungan antara 2
var tsb? ( korelasiHubugan antara 2 var:
1. Fungsi secara matematik: y = f (x)
2. Fungsi secara statistik
Contoh:
Matematik: Jika satu harga motor Rp 15jt, kalau 2 motor? ( pasti
= 30jtStatistik: Jika nilai X diketahui, nilai Y tidak dpt
diperkirakan dg pasti.
Contoh: X = jam kerja. Y = produksi yg dipengaruhi jam kerja,
dll SCATTER DIAGRAM
Dalam gambar garis regresi:
tidak semua titik terletak pd grs regresi
ada perbedaan ( dinamakan ERROR (hal ini sering terjadi pada
pengamatan/pengukuran, dll, akibat human error, alat yg error,
dll)
TUJUAN REGRESI adalah: untuk memperkirakan besar parameter Y
dari bentuk hubungan yg diprediksi ada antara variable yg
diamati.
KORELASI:
untuk menunjukkan seberapa erat hub ant 2 var
hubungan yg erat secara statistic tsb BUKAN berarti hub kausal
(sebab-akibat), krn hub kausal ditentukan oleh ilmu non-statistik
atau common sense.
Misal: ada data antara jumlah di .dan kejahatn di . Yg absurd
(lucu)
PERINGATAN:
JANGAN MENGAMBIL KESIMPULAN ADA HUB KAUSAL HANYA KARENA KOEF r
TINGGI.
MODEL REGRESI:
1. Linier Sederhana: 1Y & 1X
2. Linear Berganda: 1Y & lebih dari 1X
LINIER SEDERHANA:
Bentuk lurus: Y = a + bX
Besaran a: nilai Y pada X = 0; b: setiap X berubah 1 unit, maka
Y berubah b unit. ( PR: CEK PADA GAMBAR : b = kemiringan Jika tidak
lurus, model ditransformasikan (dg Log atau akar, eksponential )
sehingga jd lurus
REGRESI SEDERHANA (METHOD OF LEAST SQUARES)
REGRESI LINIER SEDERHANA
y = a + bx
y = DEPENDENT variabel (= predicted value, estimated value)x =
independet variabel
a = harga konstanta Y saat X = 0
b = koef regresi (tangen : y/x) ( jika b=+, grafik naik, jika b=
-, grafik turun( b = f (r), artinya jika r tinggi, maka b juga
besar, dan sebaliknya
( jika r negative, maka b juga negative, dan sebaliknya CEK PR
!Contoh: y = 2+0,5x ( Gambar
=Contoh:
Mencari pers hub ant tegangan normal (x) & gaya geser (y) pd
sampel tanah:
Diperoleh pers. Refresi:Y = 4,089 + 1,026 x
Setelah persamaan diperoleh ( bisa melakukan prediksi Y utk
sembarang nilai X (interpolasi).Note:
Hanya melakukan prediksi pd domainnya (interpolasi)
Tidak ekstrapolasi krn model nya mungkin bukan linier di luar
domainnya
Persyaratan pada Uji Regresi Linier:
Normalitas
Keberartian Regresi
Linieritas
Keberartian Koefisien Regresi
KOEFISIEN KORELASI (r) LINIER
Angka yg menunjukkan relasi (hub) anta var x & y
Nilai -1r1
r = 0 ( tidak ada korelasi
r = 1 ( positif sempurna ( garis dg gradien +; x>>> (
y>>>
r = -1( negatif sempurna ( garis dg gradien ; x>>> ( y
excel: ada tidaknya hubungan antara pendapatan &
pengeluaran
Hasil r diuji signifakannya dg table r produt momen, dan atau dg
uji-t (t table)
Uji t:
=
Nilai t hitung = 6,33;
Nilai t tabel: Dk = n-2 = 8; kesalahan: 5%; ( t tabel =
2,306
t hitung > t tabel ( Ho ditolak; berarti terdapat hubungan
antara pendapatan & pengeluaran dg koef. Korelasi ( r ) =
0,9129
NOTE:
Jika regresi signifinakan maka koefisien regresinya juga
signifikan !Contoh:
Data dg n=12, X = 800, Y=811, XY=54107, X^2= 53418, Y^2 =
54849
Jika diambil alpha 5%, bagaimana persyaratan regresi linier? 1.
Dengan Analisis Korelasi
Hipotesis:
Ho = tidak ada korelasi antara X dan Y
Ha = ada korlasi antara X dan Y
koef r dihitung = 0,7027 t dihitung = 3,12Daerah kritis: alfa 5%
dan n = 10 ( t tabel = 1,812 ( t hitung > t tabel ( Ho ditolak (
Kesimpulan: ada korelasi antara X dan Y2. Analisis VarianSource
of
VariationSSDfMSFFtabel
Regression19,2119,29,754,96
Error19,712-2=101,97
TOTAL38,911
F hitung > F tabel ( Ho ditolak NOTE: F hitung = kuadrat dari
t hitung==REVIEW
Hubungan antara variabel:
functional relation
statistical relation
Functional relation is expresed by: Y = f (X)
X = independent var; Y = dependent var
Ex: Y = 2X( Gambar: semua titik data langsung terletak pd
kurva
Statiscal relation: semua titik data tidak langsung terletak pd
kurva
1. gambar kurva
SIMPLE LINIER REGRESION (A FIRST ORDER MODEL)
Y = a0 + a1 X ; a0= koef regresi; b1= kemiringan garis
regresi
DATA for REGRESSION ANALYSIS
Observational Data:
data are obtained WITHOUT controlling the independent
variable
misal: studi hub ant umur dan jumlah hari ijin krn sakit (NOT
cause and effect)
Experimental Data:
data are obtained WITH controlling the independent variable
misal: hub anta pemahaman thd materi kursus (>> waktu
kursus >> paham), jadi lamanya waktu kursus mrpka kontrol dr
variabel independent
PROPERTIES OF FITTED REGRESSION LINE (sifat-sifat dr garis
regresi)
2. The sum of residual = 0
3. The sum of observed values = the sum of fitted values (nilai
hasil regresi)
4. Titik data rata-rata (Xrt, Yrt) selalu berada di garis
regresi)
Coefficient of determination = r2 = SSR/SSTO ( 0r21
Coefficient of correlation = r = r2 = ( -1r1
HOMEWORK: buat Anova Table dg data di atas, dan koef
korelasi
Rumus r (Koef. Korelasi):
Dimana: Yi = yi yrt; Xi=xi x rtMULTIPLE LINIER REGRESSION
Persamaan : y = b0 + b1 x1 + b2 x2 + .............. bk xk
Yi = yi yrt; Xi=xi x rtb1 dan b2 dicari dari 2 persamaan
sbb:
X1Y = b1 X12 + b2 (X1 X2)
X2Y = b1 (X1X2) + b2 X22b0 dicari dari persamaan : y rt = b0 +
b1 X1 rerata + b2 X2 rerataExample:
From an experimental study on the stabilization of highly
plastic clay, molding water content for optimum density was found
to be linierly dependent on the percentages of lime and pozoolan
mixed with the clay. The result was tabulated. Fit an equation of
the form : y = b0+b1x1+b2x2 to the data.
Water content = y% of lime = x1% of pozzolan = x2
27,5218
Cari b1, b2, dan b0Persamaan mutiple regresi dari data di atas
:
Y = .... + ..... x1 + .... x2
Rumus r (Koef. Korelasi) utk Simple Linier Regresi:
Dimana: Yi = yi yrt; X1i= x1i x1 rt Rumus r (Koef. Korelasi) utk
Multiple Linier Regresi:
5. Multiple correlation coefficient:
6. Dimana: Yi = yi yrt; X1i= x1i x1 rt ; X2 = x2i x2 rt. Antara
dua variabel, coef of correlation:
REGRESSION TROUGH THE ORIGIN / Regresi dari titik pusat
(0,0)
Pers: y reg = b1 . x
Rumus mencari b1 (
TRANFORMATION
See fig. 4.13 & 4.14
( dari scatter diagram, dpt dilihat pola regresi non linier dg
varian yg konstant ( transfor x
a. x = log x
b.
c.
Contoh: Regression calculation with Square Root Transformation
of x.
See fig. 4.15 & 4.16
( dari scatter diagram, dpt dilihat variasi yg unik ( transform
y
Transfor y: y = akar y; y = log y;y = 1/y
Contoh: Regression calculation with Logarithmic Transformation
of y.
==
Note:
Teknik statistic t-test :
( statistic parametris utk uji komparasi data ratio /
interval
7. statistic nonparametris pakai Kolmonogorof / chi kuadrat/
dll.
8. ==
=============================
===REVIEW:Coefficient for multiple linier regression.
Non Linier Regression / Polynomial regression ( just 4 a slight
exp.
NON LINIER: y = a + bx2POLYNOMIAL REGRESSION:y = b0 + b1 x + b2
x2 ( satu variabel bebas
Dimana: x = xobserved x rerataY = nb0 + b2 X2XY = b1 X2 + b2
X3X2Y = b0 X2 + b1 X3 + b2 X4.
One independent variable second order ( See fig. 9.1 &
9.2One independent variable third order ( fig 9.3
CONFIDENCE LIMIT OF REGRESSIONGambar a: influence of the
confidence limits of Yrerata on the confidence limits of regression
line
Gambar b: confidence limits of an estimate of y (==y topi=y
reg)
Estimate of y ( y = a + bx9. Nilai y tsb tidak mesti nilai
observed
10. Nilai tsb hasil dr nilai x sembarang
11. Muncul pertanyaan: seberapa besar kepercayaan (confidence
level) dr nilai estimasi tsb?
12. Perlu diketahui/dihitung varian dari y-reg thd y observed
dibagi dk:Sy/x2 = e2/dke = nilai y-reg dikurangi y observednote:
Constraint (batasan) dari garis regresi: parameter a & b( dk =
n 2
(
==
13. The probablity of being wrong = level of significant of the
value of t14. Garis regresi pasti melalui titik centroidal (x
rerata, y rerata) => eror nilai y rerata adalah konstan
sepanjang garis regresi (gambar a)Jika mau memprediksi derajat
kepercayaan/confidence interval/confidence limit (confidence level
) dari nilai Y regresi (Y reg = b0 + b1.X) oleh sembarang nilai
tunggal x (=xi , varian dari nilai tunggal adalah:
Confidence interval nilai tunggal = y t x Syi ( gambar bContoh
Soal :Hub X & Y ( lihat excell
Problem:
1. Estimasi Y jika X = 2010
2. Tentukan 95% confidence level dari Y hubungannya dg X = 2010
tsb
Solusi:
1. Y = - 38,007 + 0,994 x 2010 = 1959,933
2. area 95% confidence level = 1959,993 t . Syi
t = nilai pd 5% significant level untuk 8 degree of freedom
(dk=n-2) => t hitung = 2,306
Sy/x = 19,267
Batasan 95% confidence level:1959,933 2,306 x Syi 1959,933
46,784
OVERIEW OF F-test & T-test
Problem:
15. Buat persamaan regresi dari data yg diketahui16. Gunakan
F-test untuk mengecek apakah persamaan tsb di atas signifikan
secara statistik ? (dg lpha=1%)
17. Gunakan t-test untuk mengecek signifikansi dari koefisien
regresi pada level 1%
UJIAN KD3 SEMESTER GENAP 2010/11 JURUSAN TEKNIK SIPIL FAKULTAS
TEKNIK UNSMata Kuliah
: Statistik & Probabilitas (Kelas D) Hari/Tanggal
: Kamis, 19 Mei 2011Waktu
: 75 menit
Dosen
: Ir. Siti Qomariyah, M.Sc.
1. Rata-rata nilai ujian mata kuliah Statistik dari 150
mahasiswa adalah 72. Deviasi standard = 9. Jika nilai-nilai tsb
diasumsi distribusi normal, hitung:
a. Jumlah mahasiswa yg nilainya kurang dari 70
b. Jumlah mahasiswa yg nilainya lebih dari 60
c. Jumlah mahasiswa yg nilainya antara 60 dan 70
d. Jumlah mahasiswa yg nilainya A (sama atau lebih besar dari
80)
2. Pengujian laboratorium terhadap kekuatan suatu bahan
kostruksi dengan metode tertentu menunjukkan distribusi normal.
Jika 10% dari hasil pengujian kekuatannya lebih besar dari 8000 N,
dan 70% lebih besar dari 6000 N, berapa nilai Mean dan Standard
Deviasi nya?
3. Jika suatu data mempunyai distribusi normal dengan nilai Mean
= 100, dan Stand. Deviasi = 18, hitung peluang (probabilitas)
variabel dengan nilai:
a. Antara 115 dan 140
b. Antara 90 dan 120
4. Pengujian kekuatan geser terhadap 50 sampel material
menghasilkan nilai Mean = 3265 kN/m2. Dan nilai Standard deviasi =
466 kN/m2. Distribusi diasumsi normal.
a. Estimasi probabilitas suatu random tes yang menghasilkan
nilai berjarak dari nilai Mean sebesar 100 dan + 400 kN/m2.
b. Tentukan besaran kekuatan geser minimum dimana 2% dari hasil
tes memiliki nilai dibawah nilai minimum tsb.
c. Jika nilai level of significance data tsb = 5%, jelaskan
maksud dari ketentuan tsb.
JAWAB
1a. 70-72/9= -0,22( f(z)=0,0871
Kurang dr 70( luas=0,5-0,0871=0,4129( kali 150=62
1b. 60-72/9= -1,33( f(z)=0,4082
Lbh besar dr 60( luas=0,5+0,4082=0,9082( kali 150=136
1c. F(z)= 0,4082-0,0871= 0,3211( kali 150= 48
1d. 79-72/9= 0,89( f(z)=0,3133
Lbh besar n =80( luas=0,5-0,3133=0,1867( kali 150=28
2 F(z)=0,5-0,1=0,4 ( z=1,285 ( 1,285xsigma=8000-rerata ..(1)
F(z)=0,7-0,5=0,2 ( z=0,525 ( 0,525xsigma=rerata-6000 ..(2)
Dari (1)&(2): diperoleh rerata= 6580 &
sigma=11053a115-100/18= 0,833( f(z)=0,2970;140-100/18= 2,222(
f(z)=0,4865
0,4865-0,2970= 0,1898= 18,9%
3b100-90/18= 0,... ( f(z)=0,2123;
120-100/18= 1,111( f(z)=0,3665
0,2123 + 0,3665= 0,5788= 57,9%
4a.100/466=0,21 ( 0,0832
400/466=0,86 ( 0,3051
Dijumlah=0,38834b.f(z)=0,5 0,02 = 0,48 ( z= 2,06 ( 2,06x 466 =
3265 x ( x = 2305
UJIAN TENGAH (KD2) SEMESTER GENAP 2010/11 JURUSAN TEKNIK SIPIL
FAKULTAS TEKNIK UNSMata Kuliah
: Statistik & Probabilitas (Kelas D) Hari/Tanggal
: Jumat, 15 April 2011Waktu
: 75 menit
Dosen
: Ir. Siti Qomariyah, M.Sc.
1. Terdapat 20 data sbb:
3; 3; 3; 3; 3; 3; 3; 1; 2; 2; 2; 2; 5; 4; 5; 6; 6; 7; 8; 9
a. Hitung koefisien skewness (kemencengan) dan koefisien
kurtosis (keruncingan)
b. Gambar histogram dr data di atas. Bgmana kesimpulan anda
antara hasil hitungan dengan histogram?
2. Dalam suatu percobaan di laboratorium, terdapat hubungan
antara dua variabel x dan y sbb:
x4567891011
y4681318232631
a. Hitung persamaan garis regresi
b. Buktikan bhw jumlah kuadrat total (JKT) = jumlah kuadrat
erros (JKG) + jumlah kuadrat regresi (JKR)
UJIAN KD4 SEMESTER GENAP 2010/11 JURUSAN TEKNIK SIPIL FAKULTAS
TEKNIK UNSMata Kuliah
: Statistik & Probabilitas (Kelas D) Hari/Tanggal
: Jumat, 24 Juni 2011Waktu
: 75 menit
Dosen
: Ir. Siti Qomariyah, M.Sc.
1. Jelaskan yg dimaksud dg koefisien korelasi (r) pada garis
regresi. Kalau perlu gunakan bantuan gambar / sketsa 20%.
2. Penelitian laboratorium terhadap material tertentu,
menghasilkan data tegangan F (N/m2) dan temperatur T (0 Celsius)
seperti pada kolom 2 & 3 tabel di bawah.
a. Dengan y = transformasi dari data T (y=log T), lakukan
analisis hubungan antara tegangan F (variabel x) & temperatur T
(variabel y) 20%.b. Jika menginginkan material dg tegangan 65 N/m2,
estimasi berapa waktu yang dibutuhkan? -10%c. Dengan tingkat
signifikan 5% dan derajat kebebasan = 2 diperoleh t = 4,303. Hitung
berapa confidence interval (batas kepercayaan) hubungannya dg
jawaban b) tsb di atas 10%.Ix= FTy=log Tx2Xy
180221,34246400107,3938
270571,75594900122,9112
3602052,31183600138,7052
45013243,12192500156,0944
JUMLAH2608,531917400525,1047
3. Penelitian skala kecil menghasilkan data seperti tabel di
bawah. a. Tentukan persamaan regresi ganda (multiple regression)
-30%. b. Hitung koefisien korelasinya 10%.
Ix1x2y
173342
244133
316775
434928
521591
683155
jumlah59166324
UJI LINIERITAS REGRESI
Apakah grs regresi antara x & y membentuk grs lurus?
Kalau tidak linier analisis regresi tidak dipakai
_1362879931.unknown
_1427084434.unknown
_1459696432.unknown
_1460304987.unknown
_1461522595.unknown
_1459696282.unknown
_1427084608.unknown
_1369045165.unknown
_1369669317.unknown
_1369676816.unknown
_1427082363.unknown
_1369675992.unknown
_1369046682.unknown
_1369047875.unknown
_1369045047.unknown
_1369045107.unknown
_1369043990.unknown
_1362823165.unknown
_1362823189.unknown
_1362820635.unknown