ANALISIS DISKRIMINAN

ANALISIS DISKRIMINAN

Agus Riyanto

PENGERTIAN

Analisis diskriminan merupakan analisis multivariat dengan metode dependensi

Mempelajari hubungan beberapa variabel (lebih dari satu variabel) independen dengan satu atau beberapa variabel dependen

Variabel dependen merupakan variabel kategorik sedangkan variabel independen merupakan variabel numerik.

Tujuan Analisis Diskriminan

Menguji apakah ada perbedaan signifikan antara kelompok pada variabel dependen, dikaitkan dengan variabel independen.

Menentukan variabel independen yang mana yang memberikan sumbangan terbesar terhadap terjadinya perbedaan antar kelompok.

Membuat suatu fungsi atau model diskriminan, yang pada dasarnya mirip dengan persamaan regresi.

Mengelompokkan (mengklasifikasikan) terhadap objek (dalam SPSS disebut baris), apakah suatu objek termasuk pada salah satu kelompok variabel dependen

Asumsi Analisis Diskriminan

Multivariat Normality Matriks kovarians dari semua variabel independen seharusnya

sama (equal) Tidak adanya data yang sangat ekstrim (outlier) pada variabel

independen, jika ada data ekstrim yang tetap diproses, hal ini bisa berakibat berkurangnya ketepatan klasifikasi dari fungsi diskriminan.

Tidak ada multikolinearitas antar variabel independen. Multikolinearitas terjadi bila ada variabel independen yang berkorelasi sangat kuat dengan variabel independen lainnya. Untuk mengetahui adanya multikolinearitas dapat dilakukan dengan melihat korelasi antar variabel independen yaitu jika nilai r > 0,8 menunjukkan adanya multikolinearitas. (Santoso, 2005)

Model Analisis Diskriminan

nknkkjk XWXWXWZ ...2211

Keterangan:

jkZ = Nilai (skor) diskriminan dari fungsi diskriminan j untuk objek k.

a = Intercep

nW = Timbangan diskriminan untuk variabel independen

nkX = Variabel independen n untuk objek k

Langkah-langkah Analisis Diskriminan

1. Desain penelitian untuk analisis diskriminan. Pemilihan variabel dependen dan independen.

1. Analisis diskriminan dua kategori/kelompok, dimana variabel dependen dikelompokkan menjadi 2 (dikotom), diperlukan satu fungsi diskriminan.

2. Analisis diskriminan berganda (Multiple Discriminant Analysis/MDA), dimana variabel dependen dikelompokkan menjadi

lebih dari 2 kelompok (multikotomi), diperlukan fungsi diskriminan sebanyak (k-1) kalau ada k kategori Besar Sampel Pembagian Sampel

Langkah-langkah Analisis Diskriminan Melakukan analisis univariat untuk mengetahui kenormalan data.

uji Kolmogorov Smirnov dimana jika p value > 0,05 maka data berdistribusi normal.

Melakukan analisis bivariat untuk melihat korelasi antar variabel.jika nlai r > 0,8 menunjukkan adanya multikolinearitas

Melakukan Uji EqualityDilihat pada significancy dari Wilk’s Lambda. Jika nilai p > 0,05 menunjukkan bahwa variabel equal

Pembentukan fungsi diskriminan. Menguji signifikasi dari fungsi diskriminan.

Uji F, jika nilai p< 0,05 maka menunjukkan bahwa fungsi diskriminan ini dapat memperlihatkan perbedaan yang jelas antara dua kelompok variabel dependen

Menguji ketepatan klasifikasi dari fungsi diskriminan Jika fungsi diskriminan mempunyai ketepatan mengklasifikasi kasus ≥ 50%, ketepatan model dianggap tinggi

Melakukan interpretasi terhadap fungsi diskriminan tersebut

Faktor-faktor yang mempengarahi kejadian berat badan bayi lahir rendah (BBLR) di Desa Melati

tahun 2009

1. Kerangka Konsep Penelitian

Umur Ibu Berat Badan Ibu Tekanan Darah Ibu Pendapatan Jam Kerja ANC

KejadianBBLR

BBLR

Tidak BBLR

3. Definisi Operasional Variabel Definisi Perasional Hasil Ukur Skala

Kejadian BBLR

Kondisi berat badan bayi yang dilahirkan oleh ibu kurang dari 2500 gr

1. BBLR 2. Tidak BBLR

Ordinal

Umur Masa hidup ibu bersalin yang dihitung dari lahir sampai ulang tahun yang terakhir

Numerik Rasio

Berat Badan Ibu

Masa tubuh ibu bersalin yang ditili dalam satuan kilogram

Numerik Rasio

Tekanan darah ibu

Tekanan darah ibu bersalin yang diteliti dalam satuan mmhg

Numerik Rasio

Pendapatan Penghasilan keluarga ibu bersalin dalam satu bulan dalam rupiah

Numerik Rasio

Jam kerja Lamanya ibu bekerja pada saat hamil dalam satu hari

Numerik Rasio

ANC Frekuensi kunjungan ibu hamil ke pelayanan kesehatan selama masa kehamilan

Numeril Rasio

5. Uji Kenormalan Data

One-Sample Kolmogorov-Smirnov Test

80 80 80 80 80 8030.15 54.36 159.90 613.50 5.27 3.036.218 10.601 6.563 123.975 .123 .626.097 .151 .181 .117 .119 .139.097 .151 .181 .081 .094 .081

-.070 -.105 -.084 -.117 -.119 -.139.869 1.348 1.623 1.043 1.066 1.239.437 .053 .010 .226 .206 .093

NMeanStd. Deviation

Normal Parameters a,b

AbsolutePositiveNegative

Most ExtremeDifferences

Kolmogorov-Smirnov ZAsymp. Sig. (2-tailed)

UMURIBU BBIBU TDIBU Pendapatan jamkerja ANC

Test distribution is Normal.a.

Calculated from data.b.

Dari hasil test Kolmogorov Smirnov terlihat bahwa p value variabel “tekanan darah” adalah 0,016 (< 0,05) yang menunjukkan bahwa vaiabel ini tidak berdistribusi normal. Dengan demikian variabel “tekanan darah” tidak diikutkan dalam analisis selanjutnya

One-Sample Kolmogorov-Smirnov Test

80 80 80 80 80 8030.15 54.36 613.50 5.27 3.03 2.20356.218 10.601 123.975 .123 .626 .01744.097 .151 .117 .119 .139 .173.097 .151 .081 .094 .081 .173

-.070 -.105 -.117 -.119 -.139 -.080.869 1.348 1.043 1.066 1.239 1.550.437 .053 .226 .206 .093 .016

NMeanStd. Deviation

Normal Parameters a,b

AbsolutePositiveNegative

Most ExtremeDifferences

Kolmogorov-Smirnov ZAsymp. Sig. (2-tailed)

UMURIBU BBIBUPendapa

tan jamkerja ANC Normal

Test distribution is Normal.a.

Calculated from data.b.

6. Uji Kolinearitas

Dari hasil uji kolinearitas terlihat bahwa ada r yang > 0,8 yaitu “umur ibu” dan “pendapatan” (0,843) artinya ada masalah kolinearitas. Kedua variabel ini tetap dimasukkan dalam proses analisis selanjutnya

Correlations

1 .053 .843** -.069 .538**.640 .000 .540 .000

80 80 80 80 80.053 1 .034 .073 -.006.640 .763 .521 .958

80 80 80 80 80.843** .034 1 -.004 .716**.000 .763 .973 .000

80 80 80 80 80-.069 .073 -.004 1 -.025.540 .521 .973 .825

80 80 80 80 80.538** -.006 .716** -.025 1.000 .958 .000 .825

80 80 80 80 80

Pearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)NPearson CorrelationSig. (2-tailed)N

UMURIBU

BBIBU

Pendapatan

jamkerja

ANC

UMURIBU BBIBU Pendapatan jamkerja ANC

Correlation is significant at the 0.01 level (2-tailed).**.

Asumsi Equality

Tests of Equality of Group Means

.941 4.885 1 78 .030

.932 5.648 1 78 .020

.892 9.451 1 78 .003

.996 .294 1 78 .589

.942 4.816 1 78 .031

UMURIBUBBIBUPendapatanjamkerjaANC

Wilks'Lambda F df1 df2 Sig.

1. Contoh analisis menggunakan uji F: 1. Variabel ”Umur Ibu”, angka Sig adalah 0,030 (p < 0,05). Hal ini berarti

ada perbedaan antar grup, atau responden yang mengalami BBLR atau tidak BBLR terkait dengan umur responden tersebut. Mungkin mereka yang lebih tua akan berisiko mengalami BBLR dibandingkan dengan mereka yang masih muda, atau mungkin sebaliknya. Hal ini akan dibahas saat sudah terbentuk model deskriminan.

a) Variabel ”berat badan ibu” angka Sig. Adalah 0,020 (p<0,05). Hal ini berarti berat badan ibu mempengaruhi anak yang dilahirkannya mengalami BBLR atau tidak BBLR

b) Variabel ”Jam kerja ibu” angka Sig adalah 0,589 (p>0,05). Hal ini berarti jumlah jam kerja ibu tidak mempengaruhi anak yang dilahirkannya mengalami BBLR atau tidak BBLR.

a. Dari lima variabel ada empat variabel yang berbeda secara signifikan untuk dua grup diskriminan (BBLR dan Tidak BBLR), yaitu UMUR IBU, BERAT BADAN IBU, PENDAPATAN DAN ANC. Dengan demikian BBLR atau tidak BBLR anak yang dilahirkan oleh ibu dipengaruhi oleh umur ibu, berat badan ibu, pendapatan keluarga dan ANC ibu.

a. Untuk Asumsi Equality dapat dilihat pada ”Test Results”

Test Results

21.8421.356

1524496.105

.160

Box's MApprox.df1df2Sig.

F

Tests null hypothesis of equal population covariance matrices.

b. Dari tabel terlihat bahwa Sig = 0,160 berarti p value jauh ditas 0,05, yang berarti proup covariance matrices adalah sama. Hal ini berarti data di atas sudah memenuhi asumsi analisis diskriminan, sehingga proses bisa dilanjutkan.

c. Catatan: Bagaimana jika ternyata proup covariance matrices adalah berbeda secara nyata? J ika hal ini terjadi pada variabel dependen yang hanya ada dua kelompok, seperti pada kasus ini (dua kategori: BBLR dan Tidak BBLR), maka proses tidak dapat dilanjutkan.

Membuat Fungsi Diskriminan

Pada menu utama: klik atau beri tanda centang pilihan “Use stepwise method”, tindakan ini secara otomatis mengaktifkan ikon Method.

Catatan: Pilihan Use stepwise method akan memasukkan variabel satu persatu ke dalam model, sedangkan pilihan Enter Independent Together memasukkan variabel sekaligus.

Group Statistics

31.65 6.053 40 40.00057.10 11.963 40 40.000

654.00 107.006 40 40.0003.18 .549 40 40.000

28.65 6.087 40 40.00051.63 8.316 40 40.000

573.00 127.746 40 40.0002.88 .667 40 40.000

30.15 6.218 80 80.00054.36 10.601 80 80.000

613.50 123.975 80 80.0003.03 .626 80 80.000

UMURIBUBBIBUPendapatanANCUMURIBUBBIBUPendapatanANCUMURIBUBBIBUPendapatanANC

BBLRBBLR

TDK BBLR

Total

Mean Std. Deviation Unweighted WeightedValid N (listwise)

1. Dari tabel diatas terlihat perbedaan rata-rata variabel-variabel dari kedua kelompok, dimana rata-rata dari masing-masing variabel antara kelompok berbeda, namun apakah perbedaan tersebut signifikan?

2. Kemudian tabel diatas terlihat ada 40 responden yang anaknya mengalami BBLR, sedangkan 40 responden lainnya tergolong anaknya yang tidak mengalami BBLR, maka pada kasus ini tidak ada data yang hilang (missing), sehingga total data untuk semua variabel adalah 80 responden. Catatan: Bila ada satu atau beberapa data yang hilang atau tidak tercatat, bisa dilakukan proses rata-rata untuk pengisian data yang kosong, atau menghilangkan data missing dari proses pembuatan model.

Tabel Variabel Entered dari Analysis 1 (Stepwise Statistics) memperlihatkan variabel mana saja yang masuk ke dalam fungsi diskriminan, dimana nilai p < 0,05

Variables Entered/Removeda,b,c,d

Pendapatan .473 BBLR and

TDK BBLR 9.451 1 78.000 .003

BBIBU .799 BBLR andTDK BBLR 7.883 2 77.000 .001

Step1

2

Entered StatisticBetweenGroups Statistic df1 df2 Sig.

Exact F

Min. D Squared

At each step, the variable that maximizes the Mahalanobis distance between the two closestgroups is entered.

Maximum number of steps is 8.a.

Maximum significance of F to enter is .05.b.

Minimum significance of F to remove is .10.c.

F level, tolerance, or VIN insufficient for further computation.d.

Pada tahap 1, variabel PENDAPATAN yang pertama masuk kedalam fungsi diskriminan karena variabel ini mempunyai p value = 0,003 (p< 0,05).

Pada tahap 2, variabel BBIBU juga masuk karena mempunyai p value= 0,019 (p<0,05)

Variables in the Analysis

1.000 .003

.997 .003 .282 BBLR andTDK BBLR

.997 .019 .473 BBLR andTDK BBLR

PendapatanPendapatan

BBIBU

Step12

ToleranceSig. of F to

RemoveMin. D

SquaredBetweenGroups

Variables Not in the Analysis

1.000 1.000 .030 .244 BBLR andTDK BBLR

1.000 1.000 .020 .282 BBLR andTDK BBLR

1.000 1.000 .003 .473 BBLR andTDK BBLR

1.000 1.000 .031 .241 BBLR andTDK BBLR

.305 .305 .552 .493 BBLR andTDK BBLR

.997 .997 .019 .799 BBLR andTDK BBLR

.518 .518 .938 .473 BBLR andTDK BBLR

.304 .303 .471 .831 BBLR andTDK BBLR

.517 .517 .854 .801 BBLR andTDK BBLR

UMURIBU

BBIBU

Pendapatan

ANC

UMURIBU

BBIBU

ANC

UMURIBU

ANC

Step0

1

2

ToleranceMin.

ToleranceSig. of Fto Enter

Min. DSquared

BetweenGroups

1. Tabel Summary Canonical Discriminant Analysis, mengukur keeratan hubungan antara diskriminan score dengan grup (dalam hal ini, karena ada dua tipe responden, maka ada dua grup)

Eigenvalues

.205a 100.0 100.0 .412Function1

Eigenvalue % of Variance Cumulative %CanonicalCorrelation

First 1 canonical discriminant functions were used in theanalysis.

a.

2. Perhatikan pada kolom “Canonical Correlation” angkanya 0,412

menunjukkan keeratan yang cukup tinggi, dengan ukuran skala asosiasi antara 0 sampai 1.

1. Tabel Structure Matrix menjelaskan korelasi antara variabel independent dengan fungsi diskriminan yang terbentuk.

Structure Matrix

.769

.664

.595

.512

PendapatanUMURIBUa

BBIBUANCa

1Function

Pooled within-groups correlations between discriminatingvariables and standardized canonical discriminant functions Variables ordered by absolute size of correlation within function.

This variable not used in the analysis.a.

2. Terlihat variabel PENDAPATAN paling erat hubungannya dengan fungsi diskriminan, diikuti oleh variabel UMURIBU, BBIBU DAN ANC. Hanya disini variabel UMURIBU dan ANC tidak masuk kedalam model diskriminan (perhatikan tanda huruf a di dekat variabel tesebut)

1. Tabel Summary of Canonical Discriminant Coefficients, dapat dilihat nilai “Unstandardized coefficients yang merupakan fungsi diskriminan.

Canonical Discriminant Function Coefficients

.062

.007-7.569

BBIBUPendapatan(Constant)

1Function

Unstandardized coefficients

2. Hasil menunjukkan model (fungsi) diskriminan yang tebentuk adalah: Zscore = - 7,569 + 0,062 Berat badan ibu + 0,007 Pendapatan

3. Kegunaan fungsi ini untuk mengetahui sebuah case (dalam kasus ini adalah ibu bersalin) masuk pada grup yang satu ataukah tergolong pada grup yang lainnya.

1. Tabel Fungtion at Group Centroids memperlihatkan nilai rata-rata tiap kelompok

Functions at Group Centroids

.447-.447

BBLRBBLRTDK BBLR

1Function

Unstandardized canonical discriminantfunctions evaluated at group means

Oleh karena ada dua tipe responden, maka disebut two group discriminant, dimana grup yang satu mempunyai centroid (group mean) negative (-0,447) dan grup yang satunya lagi mempunyai centroid positif (0,447)

1. Tabel Priod Probabilities For Groups, memperlihatkan komposisi responden pada fungsi diskriminan.

Prior Probabilities for Groups

.500 40 40.000

.500 40 40.0001.000 80 80.000

BBLRBBLRTDK BBLRTotal

Prior Unweighted WeightedCases Used in Analysis

Tabel diatas memperlihatkan komposisi ke 80 responden yang dengan fungsi diskriminan menghasilkan 40 responden ada dikelompok BBLR sedangkan sisanya di kelompok Tidak BBLR

1. Untuk membuat cut off score (nilai batas) dilakukan penghitungan Zcu.

BA

ABBACU NN

ZNZNZ

Dimana: ZCU = Angka Kritis, yang berfungsi sebagai cut off score NA dan NB = Jumlah sampel di Grup A dan B, yang dalam kasus ini grup BBLR dan grup Tidak BBLR. ZA dan ZB = Angka centroid pada kasus kelompok A dan B. Perhitungan:

04040

447,040447,040

xxZCU

Penggunaan angka ZCU (Discriminant Z Score): 1. Bila angka skor kasus > ZCU, maka kasus tersebut masuk ke kelompok BBLR

(kode 0). 2. Bila angka skor kasus < ZCU, maka kasus tersebut masuk ke kelompok Tidak

BBLR (kode 1) Catatan: Penggunaan angka 0 sebagai pembatas pada kasus ini karena kebetulan didapat angka yang praktis sama dengan nol. Pada banyak kasus lainya, tentu angka pembatas bisa tidak sama dengan nol, seperti -1,2 atau -2,1 dan sebagainya.

Kasus nomor 1, mempunyai score 1,115. Karena 1,115 > 0 , maka responden nomor 1 masuk pada kelompok BBLR.

Kasus nomor 6, mempunyai score -0,711. karena -0,711 < 0, maka responden nomor 6 masuk pada kelompok tidak BBLR

1. Menguji Signifikan dari Fungsi Diskriminan Untuk mengetahui nilai signifikan dari fungsi diskriminan yang terbentuk, dilihat dari Wilk’s Lambda pada Summary of Canonical Diskriminan Function.

Wilks' Lambda

.830 14.343 2 .001Test of Function(s)1

Wilks'Lambda Chi-square df Sig.

Dari hasil output diatas terlihat bahwa hasil signifikansi dari uji Wilk’s Lambda 0,001 ( p < 0,05) ini menunjukkan perbedaan yang jelas antara kelompok variabel dependen.

1. Menguji Ketepatan Klasifikasi dari Fungsi Diskriminan. Untuk mengetahui ketepatan klasifikasi fungsi diskriminan, dilihat dari Classification Results pada Casewise Diagnostics

Classification Resultsb,c

28 12 4014 26 40

70.0 30.0 100.035.0 65.0 100.0

27 13 4014 26 40

67.5 32.5 100.035.0 65.0 100.0

BBLRBBLRTDK BBLRBBLRTDK BBLRBBLRTDK BBLRBBLRTDK BBLR

Count

%

Count

%

Original

Cross-validateda

BBLR TDK BBLR

Predicted GroupMembership

Total

Cross validation is done only for those cases in the analysis. In crossvalidation, each case is classified by the functions derived from allcases other than that case.

a.

67.5% of original grouped cases correctly classified.b.

66.3% of cross-validated grouped cases correctly classified.c.

Dari output diatas terlihat bahwa ketepatan prediksi dari model adalah 67,5% dan dalam menerangkan kejadian BBLR. Untuk memperhitungkan kemungkinan berbagai bias dilakukan uji kekuatan prediksi dengan metode Leave-one-out-cross validation, dan diperoleh hasil 66,3%. Dengan demikian terbukti bahwa fungsi diskriminan tersebut mempunyai ketepatan prediksi yang tinggi, maka fungsi diskriminan tersebut dapat digunakan untuk memprediksi sebuah kasus, apakah akan diklasifikasikan ke tipe BBLR atau tipe Tidak BBLR.

1. Melakukan interprestasi terhadap fungsi diskriminan tersebut. Fungsi diskriminan yang diperoleh adalah: Zscore = - 7,569 + 0,062 Berat badan ibu + 0,007 Pendapatan Contoh kasus: J ika ada seorang ibu mempunyai berat badan 50 Kg dan mempunyai pendapatan keluarga rata-rata perbulan 750.000 perbulan, maka dengan memasukkan data tersebut kedalam fungsi diskriminan : Zscore = - 7,569 + 0,062 Berat badan ibu + 0,007 Pendapatan Zscore = - 7,569 + (0,062 x 50) + (0,007 x 750) Zscore = + 0,781 Oleh karena angka skor (+0,781) diatas ZCU maka ibu tersebut masuk ke grup BBLR atau ibu tersebut termasuk tipe ibu yang berpotensi anaknya mengalami BBLR

1. Kesimpulan a. Ada perbedaan yang signifikan antara responden yang anaknya mengalami

BBLR dengan responden yang anaknya tidak mengalami BBLR. Hal ini dibuktikan pada analisis Wilk’s Lambda.

b. Variabel yang membuat perbedaan terhadap responden yang anaknya mengalami BBLR dengan responden yang anaknya tidak mengalami BBLR adalah Berat Badan Ibu dan Pendapatan Keluarga. Dimana Pendapatan Keluarga merupakan stronger diskriminant factor.

c. Model atau Fungsi diskriminan yang diperoleh adalah: Zscore = - 7,569 + 0,062 Berat badan ibu + 0,007 Pendapatan

d. Model (fungsi) diskriminan diatas mempunyai ketepatan mengklasifikasi kasus sebesar 67,5. karena diatas 50% ketepatan model dianggap tinggi, dan model diatas bisa digunakan untuk mengklasifikasikan sebuah kasus pada kejadian BBLR

ANALISIS DISKRIMINAN

Documents