Analisis Korespondensi Disusun untuk memenuhi tugas matakuliah Analisis Statistik Multivariat yang dibina oleh Ibu Trianingsih Eny Lestari Anggota kelompok : Griselda A.Y 308312417486 Yunis Sulistyorini 308312417488 Syaifudin 308312417498 Laili Kartika 908312410094 Fakultas Matematika dan Ilmu Pengetahuan Alam Jurusan Matematika 2011
UNIVERSITAS NEGERI MALANG FAKULTAS MATEMATIKA DAN ILMU PENGETAHUAN ALAM PROGRAM STUDI MATEMATIKA
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Analisis Korespondensi
Disusun untuk memenuhi tugas matakuliah
Analisis Statistik Multivariat
yang dibina oleh Ibu Trianingsih Eny Lestari
Anggota kelompok :
Griselda A.Y 308312417486
Yunis Sulistyorini 308312417488
Syaifudin 308312417498
Laili Kartika 908312410094
Fakultas Matematika dan Ilmu Pengetahuan Alam
Jurusan Matematika
2011
BAB I
PENDAHULUAN
A. Latar Belakang
Analisis korespondensi adalah teknik penyajian data antar baris, antar kolom, dan
antar baris dan kolom dari tabel kontingensi (dua arah yang kemudian dapat diperluas untuk
tabel kontingensi multiarah) pada suatu ruang vektor berdimensi kecil dan optimal. Analisis
ini memberikan output berupa peta persepsi yang merupakan plot antara baris dan kolom dari
matriks yang berbentuk data kategori. Dalam analisis korespondensi data yang digunakan
adalah data dengan skala pengukuran nominal atau ordinal, variabel-variabelnya kualitatif
dan tidak ada asumsi tentang distribusi data yang harus dipenuhi. Oleh karena itu, analisis ini
dapat digunakan untuk melihat perkembangan di suatu wilayah berdasarkan indikator-
indikator tertentu yang merupakan data-data dengan skala pengukuran nominal.
Dalam makalah ini, penyusun akan melihat perkembangan pembangunan di
kabupaten Sumedang dengan melihat data dari tiap-tiap kecamatan yang ada dalam
kabupaten tersebut. Dalam prosesnya terdapat beberapa variabel yang digunakan yaitu
adanya banyaknya fasilitas pendidikan, banyaknya perusahaan, dan letak stategis dari
masing-masing kecamatan yang merupakan beberapa indikator untuk melihat keberhasilan
pembangunan di wilayah tersebut. Dari hasil analisis korespondensi tersebut kita juga akan
melihat hubungan antara variabel-variabel indikator keberhasilan pembangunan tersebut.
B. Rumusan Masalah
1. Bagaimana peta persepsi yang dihasilkan dalam analisis korespondensi ?
2. Bagaimana hubungan antara variabel-variabel indikator keberhasilan pembangunan di
kecamatan ?
BAB II
KAJIAN PUSTAKA
Analisis korespondensi ditemukan dan dikembangkan pertama kali tahun 1960- an
oleh Jean-Paul Benzécri dan kawan-kawan di Perancis. Analisis ini diartikan sebagai teknik
penyajian data antar baris, antar kolom, dan antara baris dan kolom dari tabel kontingensi
(dua arah yang kemudian dapat diperluas untuk tabel kontingensi multi arah) pada suatu
ruang vector berdimensi kecil dan optimal. Analisis ini juga didesain untuk digunakan dalam
pengembangan pengelompokan yang mewakili data frekwensi.
Sifat-sifat Dasar Analisis Korespondensi.
Analisis ini juga mempunyai beberapa sifat dasar yang perlu diperhatikan yaitu:
a. Dipergunakan untuk data non-metrik dengan skala pengukuran nominal dan ordinal.
b. Bisa dipergunakan untuk hubungan non-linier.
c. Tidak ada asumsi tentang distribusi.
d. Tidak ada model yang dihipotesiskan.
e. Sebagai salah satu metode dalam eksplorasai data yang hasil akhirnya dapat berupa
hipotesis yang perlu di uji lebih lanjut.
f. Salah satu teknik struktur pengelompokan atau reduksi data.
Tujuan Analisis Korespondensi
Tujuan dari analisis korespondensi dua arah adalah:
a. Membandingkan kemiripan (similarity) dua kategori dari variabel kualitatif pertama
(baris) berdasarkan sejumlah variabel kualitatif kedua (kolom).
b. Membandingkan kemiripan (similarity) dua kategori dari variabel kualitatif kedua
(kolom) berdasarkan sejumlah variabel kualitatif pertama (baris).
c. Mengetahui hubungan antara satu kategori variabel baris dengan satu kategori variabel
kolom.
d. Menyajikan setiap kategori variabel baris dan kolom dari tabel kontingensi sedemikian
rupa sehingga dapat ditampilkan secara bersama-sama pada satu ruang vektor berdimensi
kecil secara optimal.
Kelebihan dan Kekurangan Analisis Korespondensi.
Analisis Korespondensi juga memiliki kelebihan dan kekurangan bila dibandingkan
dengan analisis lainya, yaitu:
a) Kelebihan
1) Sangat tepat untuk menganalisis data variabel kategori ganda yang dapat digambarkan
secara sederhana dalam data tabulasi silang.
2) Tidak hanya menggambarkan hubungan antar baris dengan kolom tetapi juga antar
kategori dalam setiap baris dan kolom.
3) Memberikan tampilan grafik gabungan dari kategori baris dan kolom dalam satu
gambar yang berdimensi sama.
4) Cukup fleksibel untuk digunakan dalam data matrik berukuran besar.
b) Kekurangan
1) Analisis ini tidak cocok untuk pengujian hipotesis tetapi sangat tepat untuk eksplorasi
data.
2) Analisis ini kurang tepat bila dipakai untuk analisis data kuantitatif.
Perhitungan dalam Analisis Korespondensi
1. Kategori Variabel dan Matriks Indikator
Buatlah kategori variabel penelitian berdasarkan aturan normalitas, menggunakan
aturan Sturges. Setelah terbentuk kategori, dapat dibuat matriks indikator (Z) disebut juga
Matriks Burt dengan nilai 0 jika objek tidak termasuk dalam kategori tersebut dan nilai 1 jika
objek tersebut masuk dalam kategori Z=UΛP dengan P =Z’Z dan Λ adalah matriks diagonal
λi, dan U dalah ZZ’.
2. Matriks Korespondensi
Misalkan N matriks kontingensi, dan P matriks korespondensi.
N(IxJ) ≡ [nij] ; nij ≥ 0
P ≡ (1/n..)N ;n.. = 1TN1 …(2.1)
Jumlah baris dan kolom P ditulis sebagai:
r ≡ P1 dan c ≡ PT1 …(2.2)
dimana ri > 0 (I = 1, …,I), cj > 0 (j = 1, …,J)
Dr ≡ diag (r) dan Dc ≡ diag (c) …(2.3)
Matriks P disebut juga matriks kepadatan peluang, karena jika kita jumlahkan setiap
baris matriks P hasilnya 1 (satu). Simbol 1 pada persamaan (2.2) adalah matriks kolom yang
setiap unsurnya adalah 1 (satu), ditulis 1 ≡ [1…1]T. Dr dan Dc berturut-turut adalah matriks
diagonal baris dan matriks diagonal kolom yang unsur diagonalnya masing-masing adalah r
dan c.
3. Matriks Profil Baris dan Kolom
Matriks profil baris dan kolom dari P didefinisikan sebagai vektor baris dan vektor
kolom dari P dibagi oleh jumlah masing-masing, ditulis;
R ≡ Dr-1
P ≡ [
] dan C ≡ Dc
-1P
T ≡ [
] …(2.4)
Kedua profil baris (i = 1…I) dan profil kolom (i = 1…J) masing-masing ditulis
dalam baris R dan kolom C. Profil-profil ini identik dengan baris dan kolom N yang dibagi
oleh jumlah masing-masing.
4. Titik, Massa dan Metrik
Kumpulan baris
Titik : Profil baris ke-I dalam ruang dimensi-J
Massa : Elemen sebanyak I dari r
Metrik : Bobot Euclidean dengan bobot Dc-1
Kumpulan kolom
Titik : Profil baris ke-J dalam ruang dimensi-I
Massa : Elemen sebanyak I dari c
Metrik : Bobot Euclidean dengan bobot Dr-1
5. Pusat Baris dan Pusat Kolom
Pusat baris : c ≡ RTr dan Pusat kolom: r ≡ C
Tc …(2.5)
6. Total Inersia
Jumlah kuadrat jarak berbobot dari titik (baris atau kolom) terhadap sentroidnya:
in(I) = ∑
= trace[Dr(R-1cT)Dc
-1(R-1c
T)T] …(2.6)
in(J) = ∑
= trace[Dc(R-1rT)Dr
-1(R-1r
T)T] …(2.7)
in(I) dan in(J) berturut-turut adalah total inersia titik baris dan total inersia titik
kolom. Hubungan inersia baris dengan inesia kolom.
in(I)= in(J) =∑ ∑
; ∑ ∑
= trace[Dr -1
(P-rcT)Dc
-1(P-rc
T)T] …(2.8)
7. Sumbu Utama
Misalkan SVD dari P - rcT adalah :
P – rcT = ADµB
T dimana A
TDr
-1A = B
TDc
-1B = I…(2.9)
maka kolom dari matriks A dan B berturut-turut mendefinisikan
sumbu utama dan sumbu utama baris, dimana
[
] [
]
[ ];
adalah akar pangkat dua dari nilai eigen (√ ) dan e adalah vektor eigen yang
didapatkan dari matrik [P – rcT].
8. Kooordinat Baris dan Kolom
Misalkan BDPFKxJ
JxJ
T
JxI
1
rKxI
1c
1cD
adalah koordinat utama dari profil baris
terhadap sumbu utama B, maka F = Dr-1ADµ …(2.10)
Misalkan ADPGKxI
IxI
T
IxJ
1
C
KxJ
1r
1rD
adalah koordinat utama dari profil kolom
terhadap sumbu utama A, maka G = Dc-1BDµ …(2.11)
9. Transisi Baris dan Kolom
Transisi dari baris (F) ke kolom (G)
G = Dc-1
PTFDµ
-1 atau GDµ = Dc
-1P
TF …(2.12)
Transisi dari kolom (G) ke baris (F)
F = Dr-1
PGDµ-1
= RGDµ-1
atau FDµ = Dr-1
PG …(2.13)
10. Inersia Utama
Pusat kumpulan profil baris dan profil kolom terhadap sumbu koordinat berada pada
titik pusat sumbu tersebut. Jumlah bobot kuadrat dari titik-titik koordinat (momen inersia)
sepanjang sumbu utama ke-k adalah yang dinotasikan dengan dan disebut inersia
utama.
Inersia utama terhadap kumpulan baris
FTDrF = Dµ
2 = Dλ …(2.14)
Inersia utama terhadap kumpulan baris
GTDcG = Dµ
2 = Dλ …(2.15)
Berdasarkan persamaan (2.12), (2.13), (2.14), dan (2.15) maka total inersia dari setiap
kumpulan titik-titik dapat dikomposisikan sepanjang sumbu utama dan diantaranya titik-titik
itu sendiri. Dekomposisi tersebut analog dengan dekomposisi variasi.
Metode Analisis Data
Cara mengolah data untuk mencari peta presepsi dengan menggunakan Analisis
Korespondensi sangat efektif bila dipakai untuk mencari peta persepsi, dengan asumsi dari
analisis Korespondensi itu sendiri, yaitu jenis data non-metrik. Peta presepsi ini dapat
memperlihatkan suatu diagram plot jarak antar kategori baris dan antar kategori kolom,
diagram itu memperlihatkan bagaimana hubungan antara kategori baris, kategori kolom
maupun kategori baris dan kolom.
Diagram 1. Flowchart untuk analisis korespondensi
Ya
Data
Nominal/Ordinal
Variabel Kategori
Tabel Indikator
Analisis Korespondensi
Peta Persepsi
Hubungan antar
kategori baris
Hubungan antar
kategori baris
Hubungan antar kategori
baris dan kolom
Bkn Variabel Kategori
Susun Variabel Kategori
Tidak
Kesimpulan
BAB III
Analisis dan Pembahasan
Data yang digunakan menggunakan tiga(3) variabel indikator pembangunan yaitu
X1 : Banyaknya fasilitas pendidikan (SD-SMU),
X2 : Banyaknya perusahaan perdagangan (menengah ke atas),
X3 : Letak strategis kecamatan yang diberi kode 1 untuk kecamatan yang dilewati jalan
propinsi dan 0 untuk kecamatan yang tidak dilewati jalan propinsi.
Peta dari Kabupaten Sumedang dapat dilihat pada gambar di bawah ini,
Gambar 1 Peta wilayah Kabupaten Sumedang
Data yang akan digunakan adalah sebagai berikut
No Kecamatan
Banyaknya fasilitas
pendidikan
(X1)
Banyaknya
perusahaan
(X2)
Letak
Strategis
(X3)
1 Jatinangor 83 317 1
2 Cimanggung 56 148 0
3 Tanjungsari 73 320 1
4 Sukasari 19 0 0
5 Pamulihan 39 137 1
6 Rancakalong 49 242 0
7 Sum.Sel 81 194 1
8 Sum.Utr 88 318 1
9 Ganeas 41 8 0
10 Situraja 45 226 0
11 Cisitu 31 0 0
12 Darmaraja 61 243 0
13 Cibugel 25 84 0
14 Wado 48 2 0
15 Jatinunggal 51 123 0
16 Jatigede 31 297 0
17 Tomo 34 113 1
18 Ujungjaya 31 164 0
19 Conggeang 41 197 0
20 Paseh 54 174 1
21 Cimalaka 69 204 1
22 Cisarua 22 20 0
23 Tanjungkerta 54 155 0
24 Tanjungmedar 45 0 0
25 Buahdua 38 151 0
26 Surian 15 1 0
Kategori dari ketiga variabel tersebut adalah sebagai berikut
Variabel Nama variabel Kategori
X1 Banyaknya fasilitas pendidikan X11 : pend
X12 : < pend < 70
X13 : pend
X2 Banyaknya perusahaan X21 : ush
X22 : 100 < ush < 200
X23 : ush 200
X3 Letak strategis X31 : dilalui jalan propinsi
X32 : tidak dilalui jalan propinsi
Berdasarkan tabel kategori diatas diperoleh tabel indikatornya adalah sebagai berikut,
No Kecamatan X11 X12 X13 X21 X22 X23 X31 X32
1 Jatinangor 0 0 1 0 0 1 1 0
2 Cimanggung 0 1 0 0 1 0 0 1
3 Tanjungsari 0 0 1 0 0 1 1 0
4 Sukasari 1 0 0 0 0 0 0 1
5 Pamulihan 0 1 0 0 1 0 1 0
6 Rancakalong 0 1 0 0 0 1 0 1
7 Sum.Sel 0 0 1 0 1 0 1 0
8 Sum.Utr 0 0 1 0 0 1 1 0
9 Ganeas 0 1 0 1 0 0 0 1
10 Situraja 0 1 0 0 0 1 0 1
11 Cisitu 0 1 0 1 0 0 0 1
12 Darmaraja 0 1 0 0 0 1 0 1
13 Cibugel 1 0 0 1 0 0 0 1
14 Wado 0 1 0 1 0 0 0 1
15 Jatinunggal 0 1 0 0 1 0 0 1
16 Jatigede 0 1 0 0 0 1 0 1
17 Tomo 0 1 0 0 1 0 1 0
18 Ujungjaya 0 1 0 0 1 0 0 1
19 Conggeang 0 1 0 0 1 0 0 1
20 Paseh 0 1 0 0 1 0 1 0
21 Cimalaka 0 1 0 0 0 1 1 0
22 Cisarua 1 0 0 1 0 0 0 1
23 Tanjungkerta 0 1 0 0 1 0 0 1
24 Tanjungmedar 0 1 0 1 0 0 0 1
25 Buahdua 0 1 0 0 1 0 0 1
26 Surian 1 0 0 1 0 0 0 1
Dari tabel indikator tersebut selanjutnya dianalisis menggunakan Analisis
Korespondensi Multipel dengan bantuan Software Minitab 14.
1. Tabel Burt
Tabel ini berisi data tentang frekuensi obyek (kecamatan) yang memenuhi kriteria
berdasarkan variabel pada kolom dan barisnya.
Burt Table
X11 X12 X13 X21 X22 X23 X31 X32
X11 4 0 0 4 0 0 0 4
X12 0 18 0 4 9 5 4 14
X13 0 0 4 0 1 3 4 0
X21 4 4 0 8 0 0 0 8
X22 0 9 1 0 10 0 4 6
X23 0 5 3 0 0 8 4 4
X31 0 4 4 0 4 4 8 0
X32 4 14 0 8 6 4 0 18
Sebagai contoh dari tabel Burt diatas diperoleh :
data di baris X11 dan kolom X11 menunjukkan terdapat 4 objek (kecamatan) yang
memenuhi kriteria X11.
baris X11 dan kolom X21 menunjukkan terdapat 4 objek (kecamatan) yang