SEMINAR NASIONAL MATEMATIKA DAN PENDIDIKAN MATEMATIKA 2010 Kelompok Matematika Terapan 880 ANALISIS DISKRIMINAN DISKRIT UNTUK MENGELOMPOKKAN KOMPONEN Bernik Maskun Jurusan Statistika FMIPA UNPAD [email protected]Abstrak Untuk mengelompokkan hasil pengukuran yang diukur dengan p buah variabel dimana penilaian setiap variabel dilakukan dengan pengkategorian yang bersifat biner maka banyak susunan yang mungkin terjadi adalah 2 p . Dari sampel yang diperoleh, terlebih dahulu sampel dibagi dalam dua bagian yaitu Analysis Sample sebagai sampel untuk membuat aturan pengklasifikasian dan Holdout Sample sebagai sampel untuk menguji ketepatan kalsifikasi dari aturan klasifikasi. Hair dkk (1988) mengusulkan ukuran sampel untuk sampel analysis adalah 75% dari sampel yang ada. Dari Sampel Analysis selanjutnya dikategorikan atas dua kelompok sampel yaitu kelompok yang baik dan kelompok tidak baik (perlu perbaikan) yang selanjutnya dilakukan pengujian hipotesis kesamaan proporsi dengan statistik uji berbentuk yang berdistribusi Chi kuadrat dengan dk =2 p -1 Jika hasil pengujian bersifat signifikan, selanjutnya lakukan Klasifikasi dengan aturan 1 2 , D D D Dimana : 1 jika 1 2 () () g x g x ; 2 jika 1 2 ; () i i N x g N Peluang kesalahan pengklasifikasian dari Sampel analysis dapat di hitung (i) Actual Error Rate (AER) : 2 1 3 1 1 1 2 2 2 ( ) ( ) ... () ( ) ( ) ... () ... N N N n D D D D D D pD g x g x g x g x g x (ii) Apparent Error Rate (APER) : APER dihitung dengan terlebih dahulu nilai N i diurutkan dari nilai terbesar N i(k) hingga terkecil N i(1) kemudian gunakan rumus : 1(1) 1(2) 1( 1) ( 1) 1 ( ) () () ... () k nk x pD N x N x N x N x N Kata kunci : Chi-Kuadrat, AER, APER
14
Embed
ANALISIS DISKRIMINAN DISKRIT UNTUK ...pustaka.unpad.ac.id/wp-content/uploads/2011/08/pustaka...SEMINAR NASIONAL MATEMATIKA DAN PENDIDIKAN MATEMATIKA 2010 Kelompok Matematika Terapan
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
SEMINAR NASIONAL MATEMATIKA DAN PENDIDIKAN MATEMATIKA 2010
Kelompok Matematika
Terapan
880
ANALISIS DISKRIMINAN DISKRIT UNTUK MENGELOMPOKKAN KOMPONEN
Abstrak Untuk mengelompokkan hasil pengukuran yang diukur dengan p buah variabel dimana penilaian setiap variabel dilakukan dengan pengkategorian yang bersifat biner maka banyak susunan yang mungkin terjadi adalah 2p . Dari sampel yang diperoleh, terlebih dahulu sampel dibagi dalam dua bagian yaitu Analysis Sample sebagai sampel untuk membuat aturan pengklasifikasian dan Holdout Sample sebagai sampel untuk menguji ketepatan kalsifikasi dari aturan klasifikasi. Hair dkk (1988) mengusulkan ukuran sampel untuk sampel analysis adalah 75% dari sampel yang ada. Dari Sampel Analysis selanjutnya dikategorikan atas dua kelompok sampel yaitu kelompok yang baik dan kelompok tidak baik (perlu perbaikan) yang selanjutnya dilakukan pengujian hipotesis kesamaan proporsi dengan statistik uji berbentuk
yang berdistribusi Chi kuadrat dengan dk =2p-1 Jika hasil pengujian bersifat signifikan, selanjutnya lakukan Klasifikasi dengan aturan
1 2,D D D
Dimana : 1 jika 1 2( ) ( )g x g x ; 2 jika 1 2 ;
( )ii
N xgN
Peluang kesalahan pengklasifikasian dari Sampel analysis dapat di hitung (i) Actual Error Rate (AER) :
(ii) Apparent Error Rate (APER) : APER dihitung dengan terlebih dahulu nilai Ni diurutkan dari nilai terbesar Ni(k) hingga terkecil Ni(1) kemudian gunakan rumus :
1(1) 1(2) 1( 1) ( 1)1( ) ( ) ( ) ... ( ) ( )k n k
xp D N x N x N x N x
N
Kata kunci : Chi-Kuadrat, AER, APER
SEMINAR NASIONAL MATEMATIKA DAN PENDIDIKAN MATEMATIKA 2010
Kelompok Matematika
Terapan
881
1. PENDAHULUAN
Dalam perindusrian terutama yang menghasilkan produk yang
memerlukan ketelitian/presisis yang tinggi seperti komponen AIR BRAKE
SYSTEM (sistem pengereman kereta api) yang merupakan hasil produk dari PT.
PINDAD (Persero) Bandung untuk memenuhi pesanan khusus dari PT. KAI,
maka produk yang dihasilkan harus memenuhi standar yang telah ditentukan.
Untuk itu perlu dilakukan pengujian terhadap komponen-komponen Air Brake
yang dihasilkan antara lain dengan mengandalkan uji fungsi (tidak diuji secara
keseluruhan) yaitu pengujian yang dikerjakan oleh para pekerja dengan cara
mencelupkan komponen yang diproduk kedalam air untuk mengetahui bocor atau
tidak. Selama kurun waktu Mei 2007 sampai dengan Januari 2009 terdapat fakta
terjadinya kebocoran dari produk yang dihasilkan untuk memenuhi pemesanan
PT. KAI sebagai berikut :
Tabel 1.1
Jumlah Kebocoran Air Brake System
Produk PT. PINDAD
Waktu Sampel Pemeriksaan
Baik % Bocor %
Mei 2007 100 73 73,00 27 27,00
Agustus 2007 60 40 67,00 20 33,00
November 2007 500 370 74,00 130 26,00
Juli 2008 510 360 70,59 150 29,41
Januari 2009 336 248 73,80 88 26,20
Terlihat dalam tabel di atas, produk yang mengalami kerusakan
(kebocoran) dari waktu ke waktu cenderung meningkat. Tentunya jika hal ini
terus menerus berlangsung tidak menutup terjadinya penangguhan pemesanan
yang mengakibatkan dapat merugikan kedua belah pihak.
Untuk menentukan apakah produk yang dihasilkan memenuhi standar atau
tidak, tentukan dapat dilakukan dengan cara mengklasifikasikan berdasarkan uji
yang telah dilakukan untuk setiap komponen produk. Dalam mengklasifikasikan
SEMINAR NASIONAL MATEMATIKA DAN PENDIDIKAN MATEMATIKA 2010
Kelompok Matematika
Terapan
882
hasil produknya, PT. PINDAD menggunakan 5 komponen dominan dari Air
Brake System yang harus diperiksa, dimana untuk tiap komponen dikategorikan
dalam data kualitatif berskala nominal (bocor atau tidak bocor).
Berdasarkan data kualitatif untuk ke lima komponen tersebut, dapat
ditentukan komponen mana yang paling dominan untuk membedakan klasifikasi
satu kelompok dengan kelompok lainnya serta besar peluang kesalahan
pengklasifikasiannya.
2. TINJAUAN PUSTAKA
2.1 Pengelompokkan berdasarkan satu variabel prediktor
Pada saat kita dihadapkan pada persoalan pengelompokan dengan
memperhatikan satu variabel prediktor, maka univariate classification dapat
digunakan dengan tujuan : (i) untuk menaksir besarnya pengaruh variabel
pengelompokkan ketika terdapat dua kelompok yang sudah tersedia sebelumnya,
dan (ii) untuk menetapkan nilai pemisah variabel respon yang baik untuk
menentukan standar agar unit sampel dapat dibagi ke dalam dua kelompok untuk
mengidentifikasikan objek dengan tepat.
a. Pengelompokkan berdasarkan dua atau lebih variabel prediktor
Dalam mulivariate pengelompokan dapat dilakukan dengan beberapa
merode, diantaranya Analisis Diskriminan. Analisis ini merupakan suatu teknik
analisis statistika untuk mengelompokkan setiap objek ke dalam dua kelompok
atau lebih berdasarkan kriteria sejumlah variabel bebas (interval atau rasio dan
bersifat kuantitatif) sedangkan variabel tidak bebasnya merupakan kategori (non-
metrik, nominal atau ordinal yang bersifat kualitatif) (Hair, 1998). Untuk
melakukan analisis diskriminan, langkah pertama yang harus dilakukan adalah
melakukan pengujian hipotesis apak terdapat perbedaan antara kedua kelompok
populasi yang telah diketahui. Apabila terdapat perbedaan antara kedua kelompok
maka analisis diskriminan dapat dilakukan, jika tidak terdapat perbedaan maka
analisis diskriminan tidak perlu dilakukan.
Hipotesis statistiknya berbentuk :
SEMINAR NASIONAL MATEMATIKA DAN PENDIDIKAN MATEMATIKA 2010
Kelompok Matematika
Terapan
883
1 2:oH Melawan
1 1 2:H Statitik uji nya adalah :
yang berdistribusi Chi kuadrat dengan dk =2p-1
Menentukan Aturan Klasifikasi
Untuk menentukan aturan klasifikasi ; jika banyaknya individu yang
berasal dari populasi i pada X = x merupakan variabel acak binom Ni(x), i =
1,2, sehingga banyaknya individu yang terambil menjadi sampel dari dua populasi
1 1 dan 2 2 ( )N N x merupakan variabel acak Binom dengan
1 2 .
Peluang prior ditaksir oleh ii
NN
dan taksiran untuk peluang susunan
adalah ii
i
Sehingga taksiran untuk diskriminan adalah :
( )ii
N xgN
2.2.2 Menghitung peluang kesalahan Klasifikasi
Setelah proses klasifikasi, selajutnya dapat diketahui seberapa tepat aturan
klasifikasi yang telah ditentukan tersebut dengan menghitung nilai error rate yaitu
proporsi kesalahan kalasifikasi dari Holdout Sample. Jika Nilai eror rate kecil
maka ketepatan klasifikasi semakin tinggi.
Jika klasifikasi yang dihasilkan dari sampel telah dihitung, dapat pula dihitung
dua buah kesalahan klasifikasi yaitu
(i) Actual Error Rate (AER)
SEMINAR NASIONAL MATEMATIKA DAN PENDIDIKAN MATEMATIKA 2010