ANALISIS DISKRIMINAN Agus Riyanto
ANALISIS DISKRIMINAN
Agus Riyanto
PENGERTIAN
Analisis diskriminan merupakan analisis multivariat dengan metode dependensi
Mempelajari hubungan beberapa variabel (lebih dari satu variabel) independen dengan satu atau beberapa variabel dependen
Variabel dependen merupakan variabel kategorik sedangkan variabel independen merupakan variabel numerik.
Tujuan Analisis Diskriminan
Menguji apakah ada perbedaan signifikan antara kelompok pada variabel dependen, dikaitkan dengan variabel independen.
Menentukan variabel independen yang mana yang memberikan sumbangan terbesar terhadap terjadinya perbedaan antar kelompok.
Membuat suatu fungsi atau model diskriminan, yang pada dasarnya mirip dengan persamaan regresi.
Mengelompokkan (mengklasifikasikan) terhadap objek (dalam SPSS disebut baris), apakah suatu objek termasuk pada salah satu kelompok variabel dependen
Asumsi Analisis Diskriminan
Multivariat Normality Matriks kovarians dari semua variabel independen seharusnya
sama (equal) Tidak adanya data yang sangat ekstrim (outlier) pada variabel
independen, jika ada data ekstrim yang tetap diproses, hal ini bisa berakibat berkurangnya ketepatan klasifikasi dari fungsi diskriminan.
Tidak ada multikolinearitas antar variabel independen. Multikolinearitas terjadi bila ada variabel independen yang berkorelasi sangat kuat dengan variabel independen lainnya. Untuk mengetahui adanya multikolinearitas dapat dilakukan dengan melihat korelasi antar variabel independen yaitu jika nilai r > 0,8 menunjukkan adanya multikolinearitas. (Santoso, 2005)
Model Analisis Diskriminan
nknkkjk XWXWXWZ ...2211
Keterangan:
jkZ = Nilai (skor) diskriminan dari fungsi diskriminan j untuk objek k.
a = Intercep
nW = Timbangan diskriminan untuk variabel independen
nkX = Variabel independen n untuk objek k
Langkah-langkah Analisis Diskriminan
1. Desain penelitian untuk analisis diskriminan. Pemilihan variabel dependen dan independen.
1. Analisis diskriminan dua kategori/kelompok, dimana variabel dependen dikelompokkan menjadi 2 (dikotom), diperlukan satu fungsi diskriminan.
2. Analisis diskriminan berganda (Multiple Discriminant Analysis/MDA), dimana variabel dependen dikelompokkan menjadi
lebih dari 2 kelompok (multikotomi), diperlukan fungsi diskriminan sebanyak (k-1) kalau ada k kategori Besar Sampel Pembagian Sampel
Langkah-langkah Analisis Diskriminan Melakukan analisis univariat untuk mengetahui kenormalan data.
uji Kolmogorov Smirnov dimana jika p value > 0,05 maka data berdistribusi normal.
Melakukan analisis bivariat untuk melihat korelasi antar variabel.jika nlai r > 0,8 menunjukkan adanya multikolinearitas
Melakukan Uji EqualityDilihat pada significancy dari Wilk’s Lambda. Jika nilai p > 0,05 menunjukkan bahwa variabel equal
Pembentukan fungsi diskriminan. Menguji signifikasi dari fungsi diskriminan.
Uji F, jika nilai p< 0,05 maka menunjukkan bahwa fungsi diskriminan ini dapat memperlihatkan perbedaan yang jelas antara dua kelompok variabel dependen
Menguji ketepatan klasifikasi dari fungsi diskriminan Jika fungsi diskriminan mempunyai ketepatan mengklasifikasi kasus ≥ 50%, ketepatan model dianggap tinggi
Melakukan interpretasi terhadap fungsi diskriminan tersebut
Faktor-faktor yang mempengarahi kejadian berat badan bayi lahir rendah (BBLR) di Desa Melati
tahun 2009
1. Kerangka Konsep Penelitian
Umur Ibu Berat Badan Ibu Tekanan Darah Ibu Pendapatan Jam Kerja ANC
KejadianBBLR
BBLR
Tidak BBLR
3. Definisi Operasional Variabel Definisi Perasional Hasil Ukur Skala
Kejadian BBLR
Kondisi berat badan bayi yang dilahirkan oleh ibu kurang dari 2500 gr
1. BBLR 2. Tidak BBLR
Ordinal
Umur Masa hidup ibu bersalin yang dihitung dari lahir sampai ulang tahun yang terakhir
Numerik Rasio
Berat Badan Ibu
Masa tubuh ibu bersalin yang ditili dalam satuan kilogram
Numerik Rasio
Tekanan darah ibu
Tekanan darah ibu bersalin yang diteliti dalam satuan mmhg
Numerik Rasio
Pendapatan Penghasilan keluarga ibu bersalin dalam satu bulan dalam rupiah
Numerik Rasio
Jam kerja Lamanya ibu bekerja pada saat hamil dalam satu hari
Numerik Rasio
ANC Frekuensi kunjungan ibu hamil ke pelayanan kesehatan selama masa kehamilan
Numeril Rasio
5. Uji Kenormalan Data
One-Sample Kolmogorov-Smirnov Test
80 80 80 80 80 8030.15 54.36 159.90 613.50 5.27 3.036.218 10.601 6.563 123.975 .123 .626.097 .151 .181 .117 .119 .139.097 .151 .181 .081 .094 .081
-.070 -.105 -.084 -.117 -.119 -.139.869 1.348 1.623 1.043 1.066 1.239.437 .053 .010 .226 .206 .093
NMeanStd. Deviation
Normal Parameters a,b
AbsolutePositiveNegative
Most ExtremeDifferences
Kolmogorov-Smirnov ZAsymp. Sig. (2-tailed)
UMURIBU BBIBU TDIBU Pendapatan jamkerja ANC
Test distribution is Normal.a.
Calculated from data.b.
Dari hasil test Kolmogorov Smirnov terlihat bahwa p value variabel “tekanan darah” adalah 0,016 (< 0,05) yang menunjukkan bahwa vaiabel ini tidak berdistribusi normal. Dengan demikian variabel “tekanan darah” tidak diikutkan dalam analisis selanjutnya
One-Sample Kolmogorov-Smirnov Test
80 80 80 80 80 8030.15 54.36 613.50 5.27 3.03 2.20356.218 10.601 123.975 .123 .626 .01744.097 .151 .117 .119 .139 .173.097 .151 .081 .094 .081 .173
-.070 -.105 -.117 -.119 -.139 -.080.869 1.348 1.043 1.066 1.239 1.550.437 .053 .226 .206 .093 .016
NMeanStd. Deviation
Normal Parameters a,b
AbsolutePositiveNegative
Most ExtremeDifferences
Kolmogorov-Smirnov ZAsymp. Sig. (2-tailed)
UMURIBU BBIBUPendapa
tan jamkerja ANC Normal
Test distribution is Normal.a.
Calculated from data.b.
6. Uji Kolinearitas
Dari hasil uji kolinearitas terlihat bahwa ada r yang > 0,8 yaitu “umur ibu” dan “pendapatan” (0,843) artinya ada masalah kolinearitas. Kedua variabel ini tetap dimasukkan dalam proses analisis selanjutnya
Correlations
1 .053 .843** -.069 .538**.640 .000 .540 .000
80 80 80 80 80.053 1 .034 .073 -.006.640 .763 .521 .958
80 80 80 80 80.843** .034 1 -.004 .716**.000 .763 .973 .000
80 80 80 80 80-.069 .073 -.004 1 -.025.540 .521 .973 .825
80 80 80 80 80.538** -.006 .716** -.025 1.000 .958 .000 .825
80 80 80 80 80
Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N
UMURIBU
BBIBU
Pendapatan
jamkerja
ANC
UMURIBU BBIBU Pendapatan jamkerja ANC
Correlation is significant at the 0.01 level (2-tailed).**.
Asumsi Equality
Tests of Equality of Group Means
.941 4.885 1 78 .030
.932 5.648 1 78 .020
.892 9.451 1 78 .003
.996 .294 1 78 .589
.942 4.816 1 78 .031
UMURIBUBBIBUPendapatanjamkerjaANC
Wilks'Lambda F df1 df2 Sig.
1. Contoh analisis menggunakan uji F: 1. Variabel ”Umur Ibu”, angka Sig adalah 0,030 (p < 0,05). Hal ini berarti
ada perbedaan antar grup, atau responden yang mengalami BBLR atau tidak BBLR terkait dengan umur responden tersebut. Mungkin mereka yang lebih tua akan berisiko mengalami BBLR dibandingkan dengan mereka yang masih muda, atau mungkin sebaliknya. Hal ini akan dibahas saat sudah terbentuk model deskriminan.
a) Variabel ”berat badan ibu” angka Sig. Adalah 0,020 (p<0,05). Hal ini berarti berat badan ibu mempengaruhi anak yang dilahirkannya mengalami BBLR atau tidak BBLR
b) Variabel ”Jam kerja ibu” angka Sig adalah 0,589 (p>0,05). Hal ini berarti jumlah jam kerja ibu tidak mempengaruhi anak yang dilahirkannya mengalami BBLR atau tidak BBLR.
a. Dari lima variabel ada empat variabel yang berbeda secara signifikan untuk dua grup diskriminan (BBLR dan Tidak BBLR), yaitu UMUR IBU, BERAT BADAN IBU, PENDAPATAN DAN ANC. Dengan demikian BBLR atau tidak BBLR anak yang dilahirkan oleh ibu dipengaruhi oleh umur ibu, berat badan ibu, pendapatan keluarga dan ANC ibu.
a. Untuk Asumsi Equality dapat dilihat pada ”Test Results”
Test Results
21.8421.356
1524496.105
.160
Box's MApprox.df1df2Sig.
F
Tests null hypothesis of equal population covariance matrices.
b. Dari tabel terlihat bahwa Sig = 0,160 berarti p value jauh ditas 0,05, yang berarti proup covariance matrices adalah sama. Hal ini berarti data di atas sudah memenuhi asumsi analisis diskriminan, sehingga proses bisa dilanjutkan.
c. Catatan: Bagaimana jika ternyata proup covariance matrices adalah berbeda secara nyata? J ika hal ini terjadi pada variabel dependen yang hanya ada dua kelompok, seperti pada kasus ini (dua kategori: BBLR dan Tidak BBLR), maka proses tidak dapat dilanjutkan.
Membuat Fungsi Diskriminan
Pada menu utama: klik atau beri tanda centang pilihan “Use stepwise method”, tindakan ini secara otomatis mengaktifkan ikon Method.
Catatan: Pilihan Use stepwise method akan memasukkan variabel satu persatu ke dalam model, sedangkan pilihan Enter Independent Together memasukkan variabel sekaligus.
Group Statistics
31.65 6.053 40 40.00057.10 11.963 40 40.000
654.00 107.006 40 40.0003.18 .549 40 40.000
28.65 6.087 40 40.00051.63 8.316 40 40.000
573.00 127.746 40 40.0002.88 .667 40 40.000
30.15 6.218 80 80.00054.36 10.601 80 80.000
613.50 123.975 80 80.0003.03 .626 80 80.000
UMURIBUBBIBUPendapatanANCUMURIBUBBIBUPendapatanANCUMURIBUBBIBUPendapatanANC
BBLRBBLR
TDK BBLR
Total
Mean Std. Deviation Unweighted WeightedValid N (listwise)
1. Dari tabel diatas terlihat perbedaan rata-rata variabel-variabel dari kedua kelompok, dimana rata-rata dari masing-masing variabel antara kelompok berbeda, namun apakah perbedaan tersebut signifikan?
2. Kemudian tabel diatas terlihat ada 40 responden yang anaknya mengalami BBLR, sedangkan 40 responden lainnya tergolong anaknya yang tidak mengalami BBLR, maka pada kasus ini tidak ada data yang hilang (missing), sehingga total data untuk semua variabel adalah 80 responden. Catatan: Bila ada satu atau beberapa data yang hilang atau tidak tercatat, bisa dilakukan proses rata-rata untuk pengisian data yang kosong, atau menghilangkan data missing dari proses pembuatan model.
Tabel Variabel Entered dari Analysis 1 (Stepwise Statistics) memperlihatkan variabel mana saja yang masuk ke dalam fungsi diskriminan, dimana nilai p < 0,05
Variables Entered/Removeda,b,c,d
Pendapatan .473 BBLR and
TDK BBLR 9.451 1 78.000 .003
BBIBU .799 BBLR andTDK BBLR 7.883 2 77.000 .001
Step1
2
Entered StatisticBetweenGroups Statistic df1 df2 Sig.
Exact F
Min. D Squared
At each step, the variable that maximizes the Mahalanobis distance between the two closestgroups is entered.
Maximum number of steps is 8.a.
Maximum significance of F to enter is .05.b.
Minimum significance of F to remove is .10.c.
F level, tolerance, or VIN insufficient for further computation.d.
Pada tahap 1, variabel PENDAPATAN yang pertama masuk kedalam fungsi diskriminan karena variabel ini mempunyai p value = 0,003 (p< 0,05).
Pada tahap 2, variabel BBIBU juga masuk karena mempunyai p value= 0,019 (p<0,05)
Variables in the Analysis
1.000 .003
.997 .003 .282 BBLR andTDK BBLR
.997 .019 .473 BBLR andTDK BBLR
PendapatanPendapatan
BBIBU
Step12
ToleranceSig. of F to
RemoveMin. D
SquaredBetweenGroups
Variables Not in the Analysis
1.000 1.000 .030 .244 BBLR andTDK BBLR
1.000 1.000 .020 .282 BBLR andTDK BBLR
1.000 1.000 .003 .473 BBLR andTDK BBLR
1.000 1.000 .031 .241 BBLR andTDK BBLR
.305 .305 .552 .493 BBLR andTDK BBLR
.997 .997 .019 .799 BBLR andTDK BBLR
.518 .518 .938 .473 BBLR andTDK BBLR
.304 .303 .471 .831 BBLR andTDK BBLR
.517 .517 .854 .801 BBLR andTDK BBLR
UMURIBU
BBIBU
Pendapatan
ANC
UMURIBU
BBIBU
ANC
UMURIBU
ANC
Step0
1
2
ToleranceMin.
ToleranceSig. of Fto Enter
Min. DSquared
BetweenGroups
1. Tabel Summary Canonical Discriminant Analysis, mengukur keeratan hubungan antara diskriminan score dengan grup (dalam hal ini, karena ada dua tipe responden, maka ada dua grup)
Eigenvalues
.205a 100.0 100.0 .412Function1
Eigenvalue % of Variance Cumulative %CanonicalCorrelation
First 1 canonical discriminant functions were used in theanalysis.
a.
2. Perhatikan pada kolom “Canonical Correlation” angkanya 0,412
menunjukkan keeratan yang cukup tinggi, dengan ukuran skala asosiasi antara 0 sampai 1.
1. Tabel Structure Matrix menjelaskan korelasi antara variabel independent dengan fungsi diskriminan yang terbentuk.
Structure Matrix
.769
.664
.595
.512
PendapatanUMURIBUa
BBIBUANCa
1Function
Pooled within-groups correlations between discriminatingvariables and standardized canonical discriminant functions Variables ordered by absolute size of correlation within function.
This variable not used in the analysis.a.
2. Terlihat variabel PENDAPATAN paling erat hubungannya dengan fungsi diskriminan, diikuti oleh variabel UMURIBU, BBIBU DAN ANC. Hanya disini variabel UMURIBU dan ANC tidak masuk kedalam model diskriminan (perhatikan tanda huruf a di dekat variabel tesebut)
1. Tabel Summary of Canonical Discriminant Coefficients, dapat dilihat nilai “Unstandardized coefficients yang merupakan fungsi diskriminan.
Canonical Discriminant Function Coefficients
.062
.007-7.569
BBIBUPendapatan(Constant)
1Function
Unstandardized coefficients
2. Hasil menunjukkan model (fungsi) diskriminan yang tebentuk adalah: Zscore = - 7,569 + 0,062 Berat badan ibu + 0,007 Pendapatan
3. Kegunaan fungsi ini untuk mengetahui sebuah case (dalam kasus ini adalah ibu bersalin) masuk pada grup yang satu ataukah tergolong pada grup yang lainnya.
1. Tabel Fungtion at Group Centroids memperlihatkan nilai rata-rata tiap kelompok
Functions at Group Centroids
.447-.447
BBLRBBLRTDK BBLR
1Function
Unstandardized canonical discriminantfunctions evaluated at group means
Oleh karena ada dua tipe responden, maka disebut two group discriminant, dimana grup yang satu mempunyai centroid (group mean) negative (-0,447) dan grup yang satunya lagi mempunyai centroid positif (0,447)
1. Tabel Priod Probabilities For Groups, memperlihatkan komposisi responden pada fungsi diskriminan.
Prior Probabilities for Groups
.500 40 40.000
.500 40 40.0001.000 80 80.000
BBLRBBLRTDK BBLRTotal
Prior Unweighted WeightedCases Used in Analysis
Tabel diatas memperlihatkan komposisi ke 80 responden yang dengan fungsi diskriminan menghasilkan 40 responden ada dikelompok BBLR sedangkan sisanya di kelompok Tidak BBLR
1. Untuk membuat cut off score (nilai batas) dilakukan penghitungan Zcu.
BA
ABBACU NN
ZNZNZ
Dimana: ZCU = Angka Kritis, yang berfungsi sebagai cut off score NA dan NB = Jumlah sampel di Grup A dan B, yang dalam kasus ini grup BBLR dan grup Tidak BBLR. ZA dan ZB = Angka centroid pada kasus kelompok A dan B. Perhitungan:
04040
447,040447,040
xxZCU
Penggunaan angka ZCU (Discriminant Z Score): 1. Bila angka skor kasus > ZCU, maka kasus tersebut masuk ke kelompok BBLR
(kode 0). 2. Bila angka skor kasus < ZCU, maka kasus tersebut masuk ke kelompok Tidak
BBLR (kode 1) Catatan: Penggunaan angka 0 sebagai pembatas pada kasus ini karena kebetulan didapat angka yang praktis sama dengan nol. Pada banyak kasus lainya, tentu angka pembatas bisa tidak sama dengan nol, seperti -1,2 atau -2,1 dan sebagainya.
Kasus nomor 1, mempunyai score 1,115. Karena 1,115 > 0 , maka responden nomor 1 masuk pada kelompok BBLR.
Kasus nomor 6, mempunyai score -0,711. karena -0,711 < 0, maka responden nomor 6 masuk pada kelompok tidak BBLR
1. Menguji Signifikan dari Fungsi Diskriminan Untuk mengetahui nilai signifikan dari fungsi diskriminan yang terbentuk, dilihat dari Wilk’s Lambda pada Summary of Canonical Diskriminan Function.
Wilks' Lambda
.830 14.343 2 .001Test of Function(s)1
Wilks'Lambda Chi-square df Sig.
Dari hasil output diatas terlihat bahwa hasil signifikansi dari uji Wilk’s Lambda 0,001 ( p < 0,05) ini menunjukkan perbedaan yang jelas antara kelompok variabel dependen.
1. Menguji Ketepatan Klasifikasi dari Fungsi Diskriminan. Untuk mengetahui ketepatan klasifikasi fungsi diskriminan, dilihat dari Classification Results pada Casewise Diagnostics
Classification Resultsb,c
28 12 4014 26 40
70.0 30.0 100.035.0 65.0 100.0
27 13 4014 26 40
67.5 32.5 100.035.0 65.0 100.0
BBLRBBLRTDK BBLRBBLRTDK BBLRBBLRTDK BBLRBBLRTDK BBLR
Count
%
Count
%
Original
Cross-validateda
BBLR TDK BBLR
Predicted GroupMembership
Total
Cross validation is done only for those cases in the analysis. In crossvalidation, each case is classified by the functions derived from allcases other than that case.
a.
67.5% of original grouped cases correctly classified.b.
66.3% of cross-validated grouped cases correctly classified.c.
Dari output diatas terlihat bahwa ketepatan prediksi dari model adalah 67,5% dan dalam menerangkan kejadian BBLR. Untuk memperhitungkan kemungkinan berbagai bias dilakukan uji kekuatan prediksi dengan metode Leave-one-out-cross validation, dan diperoleh hasil 66,3%. Dengan demikian terbukti bahwa fungsi diskriminan tersebut mempunyai ketepatan prediksi yang tinggi, maka fungsi diskriminan tersebut dapat digunakan untuk memprediksi sebuah kasus, apakah akan diklasifikasikan ke tipe BBLR atau tipe Tidak BBLR.
1. Melakukan interprestasi terhadap fungsi diskriminan tersebut. Fungsi diskriminan yang diperoleh adalah: Zscore = - 7,569 + 0,062 Berat badan ibu + 0,007 Pendapatan Contoh kasus: J ika ada seorang ibu mempunyai berat badan 50 Kg dan mempunyai pendapatan keluarga rata-rata perbulan 750.000 perbulan, maka dengan memasukkan data tersebut kedalam fungsi diskriminan : Zscore = - 7,569 + 0,062 Berat badan ibu + 0,007 Pendapatan Zscore = - 7,569 + (0,062 x 50) + (0,007 x 750) Zscore = + 0,781 Oleh karena angka skor (+0,781) diatas ZCU maka ibu tersebut masuk ke grup BBLR atau ibu tersebut termasuk tipe ibu yang berpotensi anaknya mengalami BBLR
1. Kesimpulan a. Ada perbedaan yang signifikan antara responden yang anaknya mengalami
BBLR dengan responden yang anaknya tidak mengalami BBLR. Hal ini dibuktikan pada analisis Wilk’s Lambda.
b. Variabel yang membuat perbedaan terhadap responden yang anaknya mengalami BBLR dengan responden yang anaknya tidak mengalami BBLR adalah Berat Badan Ibu dan Pendapatan Keluarga. Dimana Pendapatan Keluarga merupakan stronger diskriminant factor.
c. Model atau Fungsi diskriminan yang diperoleh adalah: Zscore = - 7,569 + 0,062 Berat badan ibu + 0,007 Pendapatan
d. Model (fungsi) diskriminan diatas mempunyai ketepatan mengklasifikasi kasus sebesar 67,5. karena diatas 50% ketepatan model dianggap tinggi, dan model diatas bisa digunakan untuk mengklasifikasikan sebuah kasus pada kejadian BBLR