Model Log-Linier dan Regresi Logistik Julio Adisantoso, G16109011/STK 26 Mei 2010 Ringkasan Regresi log-linier adalah suatu pendekatan pemodelan linier terampat yang dapat digu- nakan untuk data yang menyebar Poisson. Model log-linier merupakan pengembangan dari analisis tabel silang dua arah atau lebih dimana terdapat hubungan antara dua atau lebih variabel kategori yang dianalisis menggunakan logaritme alami terhadap setiap isi sel dalam tabel. Hasil analisis menunjukkan bahwa model log-linier yang melibatkan tiga variabel untuk data tabel tiga arah dengan interaksi dua level merupakan model yang sesuai dibanding hanya menggunakan model additive sempurna. Model ini juga memberikan hasil dugaan yang relatif sama dengan model regresi logistik nominal dengan menggunakan fungsi hubung logit, baik berdasarkan hasil analisis numerik terhadap data contoh maupun berdasarkan tinjauan matematis. 1 Pendahuluan Hasil pengukuran suatu variabel sering mempunyai ciri berupa dua atau lebih ke- mungkinan nilai yang dikenal sebagai variabel kategorik. Variabel kategorik yang tidak memiliki urutan disebut sebagai variabel nominal sedangkan yang memiliki urutan disebut variabel ordinal. Kedua jenis variabel ini, baik nominal maupun ordinal sering disebut juga sebagai variabel multinomial. Dalam analisis data dimana variabel respon adalah nominal, digunakan suatu metode yang merupakan pengembangan dari regresi logistik dan dikenal sebagai regresi logistik nominal atau nominal logistic regression, sedangkan untuk vari- abel respon ordinal digunakan regresi logistik ordinal atau atau nominal logistic regression (McCullagh & Nelder, 1983). Pada keadaan tertentu, variabel respon yang berupa frekuensi mengikuti sebaran Poisson. Dalam analisis data dimana variabel respon adalah frekuensi dengan sebaran Poisson, digunakan model Poisson dan log-linier (Dobson, 2001). Fakta menunjukkan bahwa sebaran binomial maupun multinomial dapat diturunkan dari sebaran peubah acak Poisson yang saling bebas. Oleh karena terdapat hubungan antara model multinomial untuk proporsi dan model log-linier untuk frekuen- si. Makalah ini akan mengkaji perbandingan antara model log-linier dan model multinomial dengan menggunakan data pada buku Dobson (2001) bab 9.9. 1
27
Embed
Model Log-Linier dan Regresi Logistik analisis data dimana variabel ... Pengertian model log-linier digunakan untuk menjelaskan semua model ... Kondisi lain jika nilai antara Pearson
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Model Log-Linier dan Regresi Logistik
Julio Adisantoso, G16109011/STK
26 Mei 2010
Ringkasan
Regresi log-linier adalah suatu pendekatan pemodelan linier terampat yang dapat digu-nakan untuk data yang menyebar Poisson. Model log-linier merupakan pengembangan darianalisis tabel silang dua arah atau lebih dimana terdapat hubungan antara dua atau lebihvariabel kategori yang dianalisis menggunakan logaritme alami terhadap setiap isi sel dalamtabel.
Hasil analisis menunjukkan bahwa model log-linier yang melibatkan tiga variabel untuk datatabel tiga arah dengan interaksi dua level merupakan model yang sesuai dibanding hanyamenggunakan model additive sempurna. Model ini juga memberikan hasil dugaan yangrelatif sama dengan model regresi logistik nominal dengan menggunakan fungsi hubunglogit, baik berdasarkan hasil analisis numerik terhadap data contoh maupun berdasarkantinjauan matematis.
1 Pendahuluan
Hasil pengukuran suatu variabel sering mempunyai ciri berupa dua atau lebih ke-mungkinan nilai yang dikenal sebagai variabel kategorik. Variabel kategorik yangtidak memiliki urutan disebut sebagai variabel nominal sedangkan yang memilikiurutan disebut variabel ordinal. Kedua jenis variabel ini, baik nominal maupunordinal sering disebut juga sebagai variabel multinomial.
Dalam analisis data dimana variabel respon adalah nominal, digunakan suatumetode yang merupakan pengembangan dari regresi logistik dan dikenal sebagairegresi logistik nominal atau nominal logistic regression, sedangkan untuk vari-abel respon ordinal digunakan regresi logistik ordinal atau atau nominal logisticregression (McCullagh & Nelder, 1983).
Pada keadaan tertentu, variabel respon yang berupa frekuensi mengikuti sebaranPoisson. Dalam analisis data dimana variabel respon adalah frekuensi dengansebaran Poisson, digunakan model Poisson dan log-linier (Dobson, 2001). Faktamenunjukkan bahwa sebaran binomial maupun multinomial dapat diturunkan darisebaran peubah acak Poisson yang saling bebas. Oleh karena terdapat hubunganantara model multinomial untuk proporsi dan model log-linier untuk frekuen-si. Makalah ini akan mengkaji perbandingan antara model log-linier dan modelmultinomial dengan menggunakan data pada buku Dobson (2001) bab 9.9.
1
2
2 Model
Ketika variabel respon berupa nilai kategori dengan dua atau lebih kategori, ter-dapat dua pendekatan yang dapat dilakukan dalam model linier terampat. Perta-ma adalah menggunakan model regresi logistik dari respon dikotomus dan modelregresi nominal atau ordinal untuk lebih dari dua kategori, yang keduanya dise-but sebagai regresi logistik multinomial. Pendekatan kedua adalah menggunakanmodel log-linier untuk respon frekuensi yang mengikuti sebaran Poisson.
2.1 Regresi Logistik Multinomial
Regresi logistik multinomial (nominal dan ordinal) merupakan salah satu pen-dekatan pemodelan yang dapat digunakan untuk mendeskripsikan hubungan be-berapa variabel kovariat X dengan suatu variabel respon multinomial (polyto-mous). Model regresi logistik nominal digunakan ketika tidak ada urutan di an-tara kategori respon. Satu kategori diantaranya dipilih sebagai kategori acuan.Misalnya terdapat J kategori respon dan kategori 1 sebagai acuan, maka modellogit untuk kategori selain kategori acuan dapat dituliskan sebagai
logit(πj) = log(πjπ1
)= xTj βj, untuk j = 2, ..., J (1)
Terdapat (J − 1) persamaan logit digunakan secara simultan untuk menduga pa-rameter βj sehingga penduga linier dari xTj βj dapat dihitung. Dari persamaan (1)dapat diperoleh
π̂j = π̂1 exp(xTj β̂j
)
Karena π̂1 + π̂2 + ...+ π̂J = 1, maka dapat diperoleh
π̂1 =1
1 +∑Jj=2 exp
(xTj β̂j
)π̂j =
exp(xTj β̂j
)1 +
∑Jj=2 exp
(xTj β̂j
) , untuk j = 2, ..., J (2)
Jika ada urutan pada kategori respon (respon ordinal) maka model yang digunakanadalah regresi logistik ordinal. Misalkan z adalah variabel kontinu yang dapatdipotong-potong dengan titik-titik C1, ..., CJ−1 untuk mendefinisikan J kategoriordinal yang masing-masing dengan peluang π1, ..., πJ dimana
∑Jj=1 πj = 1. Ada
beberapa model yang dapat digunakan untuk regresi logistik ordinal ini, antaralain model logit kumulatif, proportional odds, adjacent categories logit, dan con-tinuation ratio logit.
Cumulative odds untuk kategori ke-j adalah
P (z ≤ CjP (z > Cj
=π1 + ...+ πjπj+1 + ...+ πJ
2.2 Regresi Log-Linier 3
sehingga model kumulatif logit adalah
log
(π1 + ...+ πjπj+1 + ...+ πJ
)= xTj βj (3)
Jika penduga linier xTj βj pada persamaan (3) memiliki intercept β0j untuk kategorike-j tetapi variabel kovariat tidak tergantung pada j, maka digunakan modelproportional odds, yaitu
log
(π1 + ...+ πjπj+1 + ...+ πJ
)= β0j + β1x1 + ...+ βp−1xp−1 (4)
Alternatif lainnya dari model kumulatif odd adalah rasio dari peluang sukses untukkategori yang bersebelahan, yaitu
π1
π2
,π2
π3
, ...,πJ−1
πJ
sehingga model adjacent logit menjadi
log
(πjπj+1
)= xTj βj (5)
Model rasio peluang lainnya adalah
π1
π2
,π1 + pi2π3
, ...,π1 + ...+ πJ−1
πJ
atauπ1
π2 + ...+ πJ,
pi2π3 + ...+ πJ
, ...,πJ−1
πJ
sehingga model logit rasio menjadi
log
(πj
πj+1 + ...+ πJ
)= xTj βj (6)
2.2 Regresi Log-Linier
Misalkan Y1, Y2, ..., YN adalah peubah acak saling bebas dimana Yi adalah jumlahkejadian dari frekuensi ni untuk kovariat ke-i. Nilai harapan dari Yi dapat ditulissebagai
E(Yi) = µi = niθi
2.2 Regresi Log-Linier 4
Pengaruh θi dalam variabel penjelas biasanya dimodelkan sebagai
θi = exTi β
sehingga model linier terampat menjadi
E(Yi) = µi = niexT
i β, dimana Yi ∼ Poisson(µi)
Dengan menggunakan fungsi hubung log, maka diperoleh
log µi = log ni + xTi β (7)
Misalkan data frekuensi dalam tabulasi silang dua dimensi dinotasikan sebagaiYjk, yaitu frekuensi untuk sel ke-(j, k) dimana j=1,...,J dan k=1,...,K sedemikiansehingga
∑Jj=1
∑Kk=1 Yjk = n. Jika Yjk adalah peubah acak saling bebas yang
mengikuti sebaran Poisson dengan parameter E(Yjk) = µjk, maka jumlahnyaakan mengikuti sebaran Poisson dengan parameter E(n) = µ =
∑∑µjk. Den-
gan demikian, sebaran peluang bersama dari Yjk merupakan sebaran multinomial,yaitu
f(y | n) = n!J∏j=1
K∏k=1
θyjkjk
yjk!
dimana θjk = µjk/µ, yang dapat diartikan sebagai peluang pengamatan pada selke-(j, k) dari tabel silang dua dimensi. Nilai harapan dari Yjk adalah
E(Yjk) = µjk = nθjk
Dengan fungsi hubung log maka diperoleh
log µjk = log n+ log θjk
Oleh karena itu, dengan fungsi hubung log diperoleh komponen linier
logE(Yi) = konstanta + xTi β (8)
Pengertian model log-linier digunakan untuk menjelaskan semua model linier ter-ampat pada persamaan (8) ini.
Jika tidak ada hubungan antara dua variabel (baris dan kolom pada tabel) atausaling bebas, maka peluang bersama θjk adalah hasil kali dari peluang marjinalnya,yaitu
θjk = θj.θ.k, untuk j = 1, ..., J dan k = 1, ..., K.
2.2 Regresi Log-Linier 5
Uji hipotesis dilakukan dengan membandingkan model aditif
logE(Yjk) = log n+ log θj. + log θ.k (9)
denganlogE(Yjk) = log n+ log θjk (10)
Hal ini sama dengan sidik ragam (ANOVA) untuk percobaan dua faktor tanpaulangan sehingga persamaan (10) dapat dianalogikan sebagai
logE(Yjk) = µ+ αj + βk + (αβ)jk
dan persamaan (9) dapat dianalogikan sebagai
logE(Yjk) = µ+ αj + βk
dan model minimalnya adalah
logE(Yjk) = µ
Tabel 1: Tabel silang dua arah Y dan X
Y0 1 ... J − 1
X 0 µ00 µ01 ... µ0,J−1
1 µ10 µ11 ... µ1,J−1
. ... ... ... ...
. ... ... ... ...I − 1 µI−1,0 µI−1,1 ... µI−1,J−1
Sebagai contoh, Tabel 1 menunjukkan tabel silang dua arah Y (ada J kategori)dan X (ada I kategori). Maka model log-linier penuh (saturated) dapat dituliskansebagai
dimana µ adalah rata-rata umum, αXi adalah pengaruh baris, βYj adalah pengaruh
kolom, dan (αβ)XYij adalah pengaruh interaksi baris dan kolom. Pada keadaan ter-tentu, ada beberapa parameter yang membutuhkan kendala, salah satunya adalahkendala sudut (corner constraints), yaitu αX0 = βY0 = αXYi0 = βXY0j = 0 untuk se-mua i dan j. Sebagai contoh, untuk I = J = 2, maka isi sel tabel 2x2 sepertidicantumkan pada Tabel 2.
Dengan demikian, rasio odd untuk tabel silang pada Tabel 2 adalah
µ00/µ01
µ10/µ11
=µ00µ11
µ11µ10
=eµ.eµ+αX
1 +βY1 +(αβ)XY
11
eµ+βY1 .eµ+αX
1
= e(αβ)XY11 (12)
2.3 Hubungan Analisis Log-Linier dan Logit 6
Tabel 2: Isi Sel pada tabel silang dua arah Y dan X
Y0 1
X 0 eµ eµ+βY1
1 eµ+αX1 eµ+αX
1 +βY1 +(αβ)XY
11
sehingga (αβ)XY11 dari persamaan (12) merupakan log dari rasio odd. Jika (αβ)XY11 =0, maka tidak ada interaksi antara X dan Y sehingga menjadi model additive sem-purna, yaitu
log(µij) = µ+ αXi + βYj
2.3 Hubungan Analisis Log-Linier dan Logit
Dari sel-sel yang terdapat pada Tabel 2, jika Y merupakan variabel respon danX merupakan variabel penjelas, maka diperoleh model logit pada X = 1 sebagaiberikut:
logit[P (Y = 1))] = log
(P (Y = 1)
P (Y = 0)
)
= log
(eµ+αX
1 +βY1 +(αβ)XY
11
eµ+αX1
)= βY1 + (αβ)XY11 x (13)
Nilai intercept βY1 disebut sebagai baseline log odds, yaitu nilai log odds dari Y = 1dengan syarat X = 0. Sedangkan koefisien dari x merupakan beda antara log oddsY = 1 pada X = 0 dan X = 1.
Untuk tabel silang tiga arah yang melibatkan tiga variabel kategori, model log-linier dengan interaksi dua level adalah
Dengan demikian, untuk tabel silang tiga arah dengan Y sebagai respon biner, ter-dapat hubungan antara model log-linier dengan model logistik seperti tercantumpada Tabel 3.
Tabel 3: Model Log-Linier dan Logistik pada tabel tiga arah
Simbol Log-Linier Model Logistik(Y , XZ) µ(XY , XZ) µ+ αXi(Y Z, XZ) µ+ γZk(XY , Y Z, XZ) µ+ αXi + γZk(XY Z) µ+ αXi + γZk + (αγ)XZik
2.4 Uji Kebaikan Model
Untuk mengukur tentang kesesuaian model regresi logistik maupun log-linier, adabeberapa ukuran statistik yang dapat dijadikan kriteria, di antaranya adalah Pear-son Chi-square residual, Deviance, Uji Rasio likelihood, dan uji lainnya misalkanAIC. Nilai Pearson chi-squares residual dapat dihitung melalui persamaan:
ri =oi − ei√
ei
dimana oi dan ei adalah nilai observasi dan nilai dugaan (harapan) untuk setiapi=1,2,...,n. Nilai
∑ni=1 ri mengikuti sebaran χ2 dengan derajat bebas n − p, p
adalah banyaknya parameter.Kriteria lainnya untuk mengukur kesesuaian model adalah deviance yang didefin-isikan sebagai nilai maksimum dari fungsi log-likelihood untuk model fit l(b) danuntuk model maksimum l(bmax),
D = 2[l(bmax)− l(b)]
Untuk model yang baik, nilai deviance juga mempunyai kedekatan dengan sebaranχ2 dengan derajat bebas np. Kondisi lain jika nilai antara Pearson Chi-square dandeviance relative sama dengan derajat bebas np, maka model yang dihasilkan ke-mungkinan mempunyai tingkat kesesuaian yang cukup.
Kriteria ketiga adalah uji rasio likelihood yang dapat diimplementasikan untukmenduga kesesuaian dari pendugaan parameter regresi dengan menggunakan MLE
8
(Maximum Likelihood Estimation). Uji ini untuk melihat kontribusi variabel pen-jelas terhadap variabel respon di dalam model. Dengan demikian, uji hipotesisyang dilakukan adalah
H0 : β1 = β2 = ... = βk = 0
H1 : sedikitnya ada satu β 6= 0
Statistik uji yang digunakan adalah G = 2(l1 − l0) dimana l1 adalah likelihoodtanpa variabel penjelas dan l0 adalah likelihood dengan variabel penjelas. Nilai Gmengikuti sebaran χ2 dengan derajat bebas k.
Ukuran lain yang dapat mengukur kebaikan model adalah AIC (Akaike Informa-tion Criteria) dan SC (Schwartz Criteria). AIC didefinisikan sebagai G2 − 2d, dadalah derajat bebas. Nilai AIC yang semakin kecil mengindikasikan model yangbaik.
3 Analisis Data
3.1 Bahan dan Metode
Analisis data dilakukan terhadap soal nomor 9.5 pada buku Dobson (2001), yaituhasil survei tentang tingkat kepuasan kondisi rumah di Copenhagen. Respon-den dipilih di daerah hunian rumah yang disewa pada tahun 1960-1968. Tingkatkepuasan diukur berdasarkan derajat kontak mereka dengan penghuni lainnya.Data dikelompokkan berdasarkan tipe rumah seperti yang dicantumkan padaTabel 4.
Tabel 4: Data yang dianalisis
Tingkat KepuasanDerajat Rendah Sedang TinggiKontak Rendah Tinggi Rendah Tinggi Rendah TinggiTower block 65 34 54 47 100 100Apartment 130 141 76 116 111 191House 67 130 48 105 62 104
Tingkat kepuasan terdiri atas tiga level, yaitu rendah, sedang, dan tinggi; dera-jat kontak terdiri atas dua level yaitu rendah dan tinggi; sedangkan tipe rumahterdiri atas tiga kategori yaitu tower block, apartment. dan house. Data dianalisismenggunakan program SAS v9.1 sebagai berikut:
1. Pertama data dianalisis menggunakan model regresi logistik nominal untukmelihat hubungan antara tingkat kepuasan dengan dua variabel lainnya, yaituderajat kontak dan tipe rumah.
2. Data juga dianalisis menggunakan model regresi logistik ordinal logit kumu-latif untuk selanjutnya dibandingkan dengan model regresi logistik nominal.
3.1 Bahan dan Metode 9
3. Hasil tahap (1) dan (2) dibandingkan untuk mendapatkan model terbaik.
4. Selanjutnya data dianalisis untuk melihat hubungan antara tingkat kepuasan(diperlakukan sebagai variabel kategori nominal) dengan derajat kontak re-ponden terhadap penghuni lainnya, terpisah untuk setiap tipe rumah, meng-gunakan model log-linier.
5. Analisis pada tahap (4) dilanjutkan dengan melakukan secara simultan untuksemua tipe rumah.
6. Hasil analisis tahap (4) dan (5) dibandingkan dengan model yang diperolehpada tahap (3).
Model regresi logistik nominal dengan fungsi hubung logit yang dilakukan dapatdituliskan sebagai
log(πjπ1
)= β0j + β1jT2 + β2jT3 + β3jK2, untuk j = 2, 3
dimana
S2 =
{1, tingkat kepuasan sedang0, tingkat kepuasan lainnya
S3 =
{1, tingkat kepuasan tinggi0, tingkat kepuasan lainnya
T2 =
{1, tipe apartment0, tipe lainnya
T3 =
{1, tipe house0, tipe lainnya
K2 =
{1, derajat kontak tinggi0, derajat kontak lainnya
Model regresi logistik ordinal logit kumulatif yang digunakan dalam analisis dataadalah
log(
π1
π2 + π3
)= β01 + β11T2 + β12T3 + β2K2
log(π1 + π2
π3
)= β02 + β11T2 + β12T3 + β2K2
Model regresi log-linier yang digunakan dalam analisis data terdiri dari beberapatahap. Pertama adalah model additive regresi log-linier untuk variabel tingkatkepuasan dan derajat kontak untuk setiap tipe rumah. Dengan demikian terdapattiga model additive yang masing-masing berbentuk
log(µjk) = µ+ β1S2j + β2S3
j + γK2k
3.2 Hasil Analisis 10
atauµjk = eµ+β1
S2j +β2
S3j +γ
K2k
dimana µ adalah rataan umum, β1S2j adalah pengaruh tingkat kepuasan sedang,
β2S3j adalah pengaruh tingkat kepuasan tinggi, dan γK2
k adalah pengaruh derajatkontak tinggi. Selanjutnya dianalisis untuk model saturated sebagai berikut:
log(µjk) = µ+ β1S2j + β2S3
j + γK2k + (β1γ)S2K2
jk + (β2γ)S3K2jk
Model terakhir yang digunakan untuk analisis data adalah model yang melibatkansemua variabel, dimulai dengan model additive sempurna, yaitu:
log(µijk) = µ+ α1T2j + α2T3
j + β1S2j + β2S3
j + γK2k
dimana α1T2j adalah pengaruh tipe rumah apartment dan α2T3
j adalah pengaruhtipe rumah house. Model selanjutnya adalah model saturated dengan interaksiyang dibatasi hanya untuk dua level, yaitu
log(µijk) = µ+ α1T2j + α2T3
j + β1S2j + β2S3
j + γK2k +
(α1β1)T2S2ij + (α1β2)
T2S3ij + (α1γ)T2K2
ik +
(β1γ)S2K2jk + (β1γ)S3K2
jk (15)
dan model saturated untuk semua interaksi, yaitu:
log(µijk) = µ+ α1T2j + α2T3
j + β1S2j + β2S3
j + γK2k +
(α1β1)T2S2ij + (α1β2)
T2S3ij + (α1γ)T2K2
ik +
(β1γ)S2K2jk + (β1γ)S3K2
jk +
(α1β1γ)T2S2K2ijk + (α1β2γ)T2S3K2
ijk +
(α2β1γ)T3S2K2ijk + (α2β2γ)T3S3K2
ijk (16)
3.2 Hasil Analisis
Data disusun dan dibaca dengan prosedur SAS sebagai berikut:
Hasil plot proporsi data antara tingkat kepuasan responden (S) dengan derajatkontak (K) menunjukkan hasil yang berbeda pada setiap tipe rumah (Gambar1). Pada tipe TOWER HOUSE tingkat kepuasan responden lebih tinggi padaderajat kontak rendah, dan sebaliknya, pada tipe APARTMENT tingkat kepuasanresponden lebih rendah pada derajat kontak rendah. Pada kedua tipe rumah initerlihat ada perpotongan garis yang menunjukkan adanya korelasi antara tingkatkepuasan dan derajat kontak. Sedangkan pada tipe HOUSE, kedua garis terlihatsejajar dan tingkat kepuasan responden lebih tinggi pada derajat kontak rendah.Perbedaan ketiga kurva pada Gambar 1 tersebut menunjukkan bahwa tipe rumahmemberi kontribusi yang berbeda, atau terdapat interaksi antara tipe rumah,derajat kontak, dan tingkat kepuasan responden.
3.2.2 Model Regresi Logistik
Berdasarkan tabel data sebelumnya, selanjutnya digunakan PROC LOGISTICuntuk menduga model nominal dengan fungsi hubung logit dan model ordinalsebagai berikut:
proc logistic data=tugas3;title ’Hasil analisis model logistik nominal’;weight count;model Y (REFERENCE="0")= T2 T3 K2/link=glogit scale=none aggregate;output out = hasil PRED=PREDICTED PREDPROBS=I C;run;
proc print data=hasil;run;
proc logistic data=tugas3;title ’Hasil analisis model logistik ordinal’;weight count;model Y (REFERENCE="0")= T2 T3 K2/link=clogit scale=none aggregate;output out = hasil PRED=PREDICTED PREDPROBS=I C;run;
proc print data=hasil;run;
Model dugaan regresi logistik nominal yang dihasilkan adalah
log(π̂2
π̂1
)= −0.1071− 0.4069T2 − 0.3371T3 + 0.2959K2
log(π̂3
π̂1
)= 0.5605− 0.6413T2 − 0.9453T3 + 0.3282K2 (17)
sedangkan dugaan regresi logistik ordinal adalah
log(
π̂1
π̂2 + π̂3
)= −0.9973 + 0.5009T2 + 0.7362T3 − 0.2525K2
log(π̂1 + π̂2
π̂3
)= 0.1152 + 0.5009T2 + 0.7362T3 − 0.2525K2 (18)
3.2 Hasil Analisis 12
Gambar 1: Plot data tingkat kepuasan dan derajat kontak setiap tipe rumah
Berdasarkan nilai deviance dan Pearson untuk model nominal dan ordinal padaTabel 6 menunjukkan bahwa kedua model dapat digunakan untuk menduga pa-rameter. Hal ini juga dapat dilihat dari AIC, SC, dan -2 Log L pada Tabel 7.Namun demikian, model nominal lebih baik dibanding dengan model ordinal, di-mana deviance untuk model nominal sebesar 6.8930 lebih baik dibanding untuk
3.2 Hasil Analisis 13
Tabel 5: Penduga maksimum likelihood model logistik
Tipe rumah memberikan pengaruh yang berbeda ke dalam setiap model. Hal iniditunjukkan oleh hasil uji penduga parameter yang berbeda pada Tabel 8, dimanaS2 tidak nyata pada tipe Tower Block tetapi nyata pada tipe lainnya. Sebaliknya,S3 nyata pada tipe Tower Block tetapi tidak nyata pada tipe lainnya. Sedan-gkan intercept berbeda nyata pada setiap model, dan tidak terlihat ada interaksiantara S2 dengan K2. Nilai deviance untuk tipe house sebesar 1.2736 pada mod-el saturated lebih kecil dari nilai χ2
(2,0.5)=5.99, sehingga model ini paling sesuaidibanding model pada dua tipe rumah lainnya. Hal ini juga tercermin dari nilaiPearson chi-square pada Tabel 8.
Hasil analisis log-linier setiap tipe rumah menunjukkan hasil yang berbeda, yangsesuai dengan hasil plot data pada Gambar 1. Hal ini menunjukkan bahwa tipe
3.2 Hasil Analisis 15
Tabel 9: Penduga parameter dan deviance model semua variabel
rumah memberikan kontribusi yang berbeda terhadap model, sehingga perlu di-lakukan analisis model log-linier yang melibatkan ketiga variabel secara simultan.Oleh karena itu, model selanjutnya yang dianalisis adalah model yang melibatkansemua variabel yang hasilnya dituangkan pada Tabel 9.
Dengan menambah interaksi dua level ke dalam model, diperoleh dugaan yanglebih baik dibanding model additive sempurna. Nilai deviance sebesar 6.8930 danPearson sebesar 6.9323 jauh lebih rendah dibanding pada model additive sem-purna yaitu berturut-turut 89.3481 dan 85.3473 (Tabel 9). Uji terhadap setiapparameter juga memperlihatkan hasil yang lebih baik setelah menambahkan inter-aksi dua level ke dalam model. Model log-linier dengan interaksi sampai dengandua level dari setiap variabel ternyata menghasilkan dugaan dan Pearson residualyang sama dengan model logistik nominal (Tabel 6 dan 10; Gambar 2). Nilaideviance model log-linier dengan interaksi dua level pada Tabel 9 juga sama den-gan nilai deviance untuk model logistik nominal pada Tabel 6. Dengan demikian,model yang sudah diturunkan pada persamaan (14) dan hubungan antara modellog-linier dan model logit pada Tabel 3 dapat ditunjukkan dalam analisis ini.
Walaupun model log-linier dengan model regresi nominal menunjukkan kesamaan,tetapi intrepretasi terhadap model log-linier lebih kompleks karena melibatkanbanyak variabel. Dari hasil penelitiannya, Jeansonne (1975) juga menyatakanbahwa untuk tabel dua arah, frekuensi yang diharapkan pada suatu sel harus
17
lebih besar dari satu, dan tidak lebih dari 20% yang kurang dari lima. Jika terjadimaka ada beberapa cara harus dilakukan, antara lain menggabungkan beberapavariabel atau menambahkan suatu nilai yang sama ke setiap sel.
4 Kesimpulan
Berdasarkan analisis yang telah dilakukan telah diperoleh beberapa kesimpulan,yaitu model log-linier yang melibatkan tiga variabel untuk data tabel tiga arahdengan interaksi dua level merupakan model yang sesuai dibanding hanya meng-gunakan model additive sempurna. Model ini juga memberikan hasil yang samadengan model regresi logistik nominal dengan menggunakan fungsi hubung logit,baik berdasarkan hasil analisis numerik terhadap data contoh maupun berdasarkantinjauan matematis. Walaupun demikian, intrepretasi hasil analisis menggunakanmodel log-linier lebih kompleks dibanding model regresi logistik karena melibatkanbanyak variabel, dan modelnya juga lebih kompleks.
5 Daftar Pustaka
Agresti, A. 2007. An Introduction to Categorical Data Analysis . 2nd Ed.John Wiley and Sons, Inc.
Dobson, A.J. 2001. An Introduction to Generalized Linear Models .Chapman Hall/CRC Texts in Statistical Science Series.
Jeansonne, A. 1975. Loglinear Models.http://www.statsoftinc.com/textbook/stloglin.html.
McCullagh,P. and Nelder,J.A. 1983. Generalized Linear Models . 2nd Ed.Chapman and Hall.
Ragavan, A.J. 2008. How to use SAS to fit Multiple Logistic RegressionModels . SAS Global Forum 2008.
Saparita, R. 1999. Model Regresi Logistik untuk Respon Kualitatif.Buletin IPT No.5 Vol.IV.
Zeileis, A; C.Kleiber and S.Jackman. 2008. Regression Models for CountData in R. Department of Statistics and Mathematics, Wirtschaftsuniver-sitat Wien, Austria.
18
6 Lampiran
6.1 Output SAS untuk model log-linier tipe TOWER BLOCK
The GENMOD Procedure
Model Information
Data Set WORK.TUGAS3ADistribution PoissonLink Function LogDependent Variable count
Number of Observations Read 6Number of Observations Used 6