PERBANDINGAN MODEL COX PROPORTIONAL HAZARD DAN MODEL PARAMETRIK BERDASARKAN ANALISIS RESIDUAL (Studi Kasus pada Data Kanker Paru-Paru yang Diperoleh dari Contoh Data pada Software S-Plus 2000 dan Simulasi untuk Distribusi Eksponensial dan Weibull ) Muthmainnah PROGRAM STUDI MATEMATIKA FAKULTAS SAINS DAN TEKNOLOGI UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH JAKARTA 2007 M/1428 H PERBANDINGAN MODEL COX PROPORTIONAL HAZARD
90
Embed
PERBANDINGAN MODEL COX PROPORTIONAL HAZARDrepository.uinjkt.ac.id/dspace/bitstream/123456789/10567/1/MUTHMAINNAH... · kelayakan bentuk distribusi yang diharuskan pada model parametrik.
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
PERBANDINGAN MODEL COX PROPORTIONAL HAZARD
DAN MODEL PARAMETRIK BERDASARKAN ANALISIS RESIDUAL
(Studi Kasus pada Data Kanker Paru-Paru yang Diperoleh dari Contoh Data
pada Software S-Plus 2000 dan Simulasi untuk Distribusi Eksponensial dan
Weibull )
Muthmainnah
PROGRAM STUDI MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH
JAKARTA
2007 M/1428 H
PERBANDINGAN MODEL COX PROPORTIONAL HAZARD
DAN MODEL PARAMETRIK BERDASARKAN ANALISIS RESIDUAL
(Studi Kasus pada Data Kanker Paru-Paru yang Diperoleh dari Contoh Data
pada Software S-Plus 2000 dan Simulasi untuk Distribusi Eksponensial dan
Weibull )
Skripsi
Sebagai Salah Satu Syarat Untuk Memperoleh Gelar
Sarjana Sains
Fakultas Sains dan Teknologi
Universitas Islam Negeri Syarif Hidayatullah Jakarta
Oleh :
MUTHMAINNAH
103094029740
PROGRAM STUDI MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UNIVERSITAS ISLAM NEGERI SYARIF HIDAYATULLAH
JAKARTA
2007 M/1428 H
PERBANDINGAN MODEL COX PROPORTIONAL HAZARD
DAN MODEL PARAMETRIK BERDASARKAN ANALISIS RESIDUAL
(Studi Kasus pada Data Kanker Paru-Paru yang Diperoleh dari Contoh Data pada
Software S-Plus 2000 dan Simulasi untuk Distribusi Eksponensial dan Weibull )
Skripsi
Sebagai Salah Satu Syarat Untuk Memperoleh Gelar
Sarjana Sains
Pada Fakultas Sains dan Teknologi
Universitas Islam Negeri Syarif Hidayatullah Jakarta
Oleh :
Muthmainnah
103094029740
Menyetujui,
Pembimbing I Pembimbing II
Sarini Abdullah, M.Stats Suma’inna, M.Si
Mengetahui,
Ketua Program Studi Matematika
Nur Inayah, M.Si
NIP. 150 326 911
PROGRAM STUDI MATEMATIKA
FAKULTAS SAINS DAN TEKNOLOGI
UIN SYARIF HIDAYATULLAH JAKARTA
Dengan ini menyatakan bahwa skripsi yang ditulis oleh :
Nama : Muthmainnah
NIM : 103094029740
Program Studi : Matematika
Judul Skripsi : Perbandingan Model Cox Proportional Hazard dan Model
Parametrik Berdasarkan Analisis Residual
(Studi Kasus pada Data Kanker Paru-Paru yang Diperoleh dari
Contoh Data pada Software S-Plus 2000 dan Simulasi untuk
Distribusi Eksponensial dan Weibull )
Dapat diterima sebagai syarat kelulusan untuk memperoleh gelar Sarjana Sains pada
Program Studi Matematika, Fakultas Sains dan Teknologi UIN Syarif Hidayatullah
Jakarta.
Jakarta, Agustus 2007
Menyetujui,
Pembimbing I Pembimbing II
Sarini Abdullah, M.Stats Suma’inna, M.Si
Mengetahui,
Dekan Fakultas Sains dan Teknologi Ketua Program Studi Matematika
Dr. Syopiansyah Jaya Putra, M. Sis Nur Inayah, M.Si
NIP. 150 317 956 NIP. 150 326 911
PENGESAHAN UJIAN
Skripsi yang berjudul “Perbandingan Model Cox Proportional Hazard dan Model
Parametrik Berdasarkan Analisis Residual (Studi Kasus pada Data Kanker Paru-
Paru yang Diperoleh dari Contoh Data pada Software S-Plus 2000 dan Simulasi
untuk Distribusi Eksponensial dan Weibull )” telah diuji dan dinyatakan lulus dalam
sidang Munaqosah Fakultas Sains dan Teknologi Universitas Islam Negeri Syarif
Hidayatullah Jakarta pada hari Rabu, 29 Agustus 2007. Skripsi ini telah diterima
sebagai salah satu syarat untuk memperoleh gelar sarjana strata satu (S1) pada Program
Studi Matematika.
Jakarta, Agustus 2007
Tim Penguji,
Penguji I Penguji II
Hermawan Setiawan, M.Si Nur Inayah, M.Si
NIP. 250 000 505 NIP. 150 326 911
Mengetahui,
Dekan Fakultas Sains dan Teknologi
Dr. Syopiansyah Jaya Putra, M. Sis
NIP. 150 317 956
PERNYATAAN
DENGAN INI SAYA MENYATAKAN BAHWA SKRIPSI INI BENAR-BENAR
HASIL KARYA SENDIRI YANG BELUM PERNAH DIAJUKAN SEBAGAI
SKRIPSI ATAU KARYA ILMIAH PADA PERGURUAN TINGGI ATAU
LEMBAGA MANAPUN.
Jakarta, Agustus 2007
Muthmainnah
103094029740
“Sesungguhnya dalam penciptaan langit dan bumi, dan silih bergantinya malam dan
siang, terdapat tanda-tanda bagi orang-orang yang berakal.”
(Ali Imran : 190)
ABSTRACT
Muthmainnah, Comparation Of Cox Propotional Hazard Model and Parametric Model Based On Residual Analyzes (Case Study : Lungs cancer data from S-Plus 2000 software example data and simulation for exponensial and weibull distribution) (Supervised by Sarini Abdullah, M.Stats dan Suma’inna, M.Si) The Cox Propotional Hazard Model widely used in survival analyzes. It has more advantage than parametric model because it doesn’t need functional form specification from baseline hazard function, and assumptions checked about distribution form that must be done in parametric model. Even tough it has easiness like mention above, but it doesn’t mean that The Cox Proportional Hazard Model always better than parametric model. If the survival time’s distributions are known, than parametric model gives better result. It happens because from parametric model’s result some quantity calculation can be done, such as hazard or survival value for some observation with some characteristics. In this Final Project, Cox Proportional Hazard Model was compared with parametric model based on Cox-Snell, Martingale, deviance, normal deviate and log-odds residual types. Both models was compared using lungs cancer data that processed by S-Plus 2000 software. Simulation was used because getting conclusion can’t be done using just one data set. Generally, if the distributions are known, than parametric model gives better result. For residual analyzes, normal-deviate and log-odds residual can be used to choosing matched model for some data. Key Words : Cox Proportional Hazard Model, Parametric Model, Residual
ABSTRAK
Muthmainnah, Perbandingan Model Cox Proportional Hazard dan Model Parametrik Berdasarkan Analisis Residual (Studi Kasus pada Data Kanker Paru-Paru yang Diperoleh dari Contoh Data pada Software S-Plus 2000 dan Simulasi untuk Distribusi Eksponensial dan Weibull) (Dibawah bimbingan Sarini Abdullah, M.Stats dan Suma’innah M.si)
Model Cox proportional hazard dipergunakan secara luas dalam analisis survival. Model Cox proportional hazard ini mempunyai keuntungan lebih dari model parametrik karena tidak memerlukan spesifikasi bentuk fungsional dari fungsi baseline hazard dan juga tidak memerlukan pengecekan asumsi-asumsi mengenai kelayakan bentuk distribusi yang diharuskan pada model parametrik. Walaupun memiliki beberapa kemudahan seperti yang disebutkan di atas, akan tetapi model Cox proportional hazard tidak selalu lebih baik daripada model parametrik. Jika distribusi dari survival time diketahui, maka model parametrik memberikan hasil yang lebih baik. Hal ini karena dari hasil model parametrik dapat dilakukan perhitungan-perhitungan kuantitas tertentu, misalnya nilai hazard maupun survival untuk suatu observasi dengan karakteristik tertentu. Dalam Skripsi ini dilakukan perbandingan antara model Cox proportional hazard dan model parametrik berdasarkan beberapa tipe residual (Cox-Snell, Martingale, dan deviance), serta dua residual baru yaitu, normal-deviate dan log-odds. Perbandingan kedua model dilakukan dengan menggunakan data kanker paru-paru yang diolah dengan menggunakan software S-Plus 2000. Karena pengambilan kesimpulan tidak cukup hanya dengan menggunakan satu set data, maka dalam skripsi ini dilakukan simulasi. Secara umum, jika distribusinya diketahui maka model parametrik memberikan hasil yang lebih baik. Untuk analisis residualnya, residual normal-deviate dan residual log-odds odds dapat digunakan untuk pemilihan model yang cocok untuk suatu data.
Kata kunci: Model Cox proportional hazard, model parametrik, residual
KATA PENGANTAR
Segala puji dan syukur penulis haturkan ke hadirat Allah swt yang telah
melimpahkan rahmat dan hidayah-Nya kepada penulis sehingga dapat menyelesaikan
skripsi yang berjudul “Perbandingan Model Cox Proportional Hazard dan Model
Parametrik Berdasarkan Analisis Residual (Studi Kasus pada Data Kanker Paru-
Paru yang Diperoleh dari Contoh Data pada Software S-Plus 2000 dan Simulasi
untuk Distribusi Eksponensial dan Weibull)” dengan baik.
Penulisan skripsi ini merupakan salah satu syarat kelulusan memperoleh gelar
Sarjana Sains di Program Studi Matematika, Fakultas Sains dan Teknologi, Universitas
Islam Negeri Syarif Hidayatullah Jakarta.
Pada kesempatan ini penulis ingin mengucapkan terima kasih yang tak terhingga
dan memberikan penghargaan yang sebesar-besarnya kepada:
1. Bapak Dr. Syopiansyah Jaya Putra, M.Sis, Dekan Fakultas Sains dan Teknologi.
2. Ibu Nur Inayah, M.Si, Ketua Program Studi Matematika. Terima kasih atas nasehat
dan bimbingan selama penulis kuliah di Fakultas Sains dan Teknologi Program
Studi Matematika.
3. Ibu Sarini Abdullah, M.Stats selaku pembimbing I dan ibu Suma’inna, M.Si selaku
pembimbing II. Terima kasih atas bimbingan, pengertian, ilmu yang sangat
bermanfaat dan waktu yang telah disisihkan demi selesainya skripsi ini.
4. Seluruh dosen yang telah mengajarkan ilmu-ilmu yang bermanfaat bagi penulis.
5. Bapak dan mama tercinta yang tak henti-hentinya memberikan doa dan semangat.
Mas Ruri dan adik-adikku ( Arif dan Khatim ), Mbah kakung dan Mbah putri,
Yayuk Susun, semua Om dan Tente. Sahabat-sahabatku yang paling setia dalam
suka dan duka (cewek-cewek dan cowok-cowok centil: Dini Anggraini, Rina
Yuanita, Yosy witasary, Zulfa Saida, Dennis Sugianto, Muhammad Iqbal, Rochdian
Sandhi). “Kake” (Aji Kalimasada) yang selalu setia mendengarkan keluh kesah
Angka acak yang berdistribusi Weibull dengan 40% tersensor
Pengecekan residual ini sangat penting dalam menentukan ketepatan pada
pencocokan model.
Suatu model dikatakan cocok untuk suatu data dan jenis residual mana yang
terbaik, jika distribusi dari suatu residualnya tertutup pada distribusi modelnya.
Satu set data yang digunakan tidak cukup untuk membuat kesimpulan atau
menggeneralisasi hasil perbandingan model Cox proportional hazard dan model
parametrik, karena setiap set data bergantung pada sifat dasar hasil yang ingin
didapat dari suatu penelitian. Karena itu dicoba melakukan simulasi dengan sampel
random dari distribusi eksponensial dan weibull. Setelah itu model yang dibentuk
dari sampel random tersebut dibandingkan, dan diharapkan diperoleh perbedaan
yang jelas antara model Cox proportional hazard dan model parametrik.
BAB IV
ANALISIS HASIL
4.1 Data Kanker Paru-paru
Data yang digunakan adalah data kanker paru-paru, yang terdiri dari 228
pengamatan. Ada 19 pengamatan dengan missing value dan 209 pengamatan tanpa
missing value. Pengamatan tanpa missing value inilah yang digunakan dalam
analisis. Dari 209 pengamatan terdapat 62,7% tersensor kanan. Terdapat 6 variabel
untuk membentuk model Cox proportional hazard dari data kanker paru-paru, yaitu
ph.ecog (perkiraan para dokter mengenai nilai pemeriksaan ECOG), sex (umur), inst
(kode untuk lembaga yang merawat pasien), wt.loss (Berkurangnya berat badan
pada 6 bulan terakhir), ph.karno (perkiraan para dokter mengenai nilai Karnofsky),
pat.karno (perkiraan pasien mengenai nilai Karnofskynya).
Gambar 4.1 Plot Residual Cox-Snell dan Residual Martingale Data Kanker Paru-Paru untuk Model Cox proportional hazard
Pada plot-plot pembentukan model Cox proportional hazard dengan
menggunakan 6 variabel yang telah disebutkan di atas, terlihat bahwa pada gambar
4.1 residual Cox-Snell dan Martingale menunjukan hasil yang tidak bagus.
Seharusnya jika model yang digunakan sesuai dengan data, maka plot residual Cox-
Snell akan menjadi garis lurus melewati titik asal serta melandai, sedangkan pada
gambar 4.1 tidak demikian. Begitupun untuk residual Martingale, seharusnya
residual Martingale bernilai ( )1,∞− dan kesimetrisan dari distribusi residual
martingale mendekati nol, namun pada gambar 4.1 tidak demikian.
Gambar 4.2 Plot Residual Deviance, Normal-deviate, dan Log-odds Data Kanker Paru-Paru untuk Model Cox Proportional hazard
Pada gambar 4.2, residual normal-deviate dan residual log-odds menunjukkan
hasil yang baik. Hal ini ditunjukkan dengan penyebaran plot yang tidak berpola
dan memusat sekitar nol, walaupun terlihat ada outlier.
Gambar 4.3 Histogram Residual Cox-Snell dan Martingale Data Kanker Paru-Paru untuk Model Cox Proportional hazard
Kurva tebal pada histogram menunjukan density secara teori. Sedangkan kurva
halus menunjukan density dari hasil pengamatan (data kenker paru-paru). Pada
gambar 4.3 kedua kurva pada residual Cox-Snell dan Martingale tidak berimpit, ini
menunjukan bahwa model tidak cocok sama seperti hasil dari plot.
Gambar 4.4 Histogram Residual Deviance, Normal-deviate dan Log-odds Data Kanker Paru-Paru untuk Model Cox Proportional hazard
Dari gambar 4.4 semakin memperkuat hasil dari plot, bahwa untuk data kanker
paru-paru cocok menggunakan model Cox proportional hazard dengan analisis
residual menggunakan residual log-odds dan normal-deviate. Kedua kurva pada
histogram residual log-odds dan normal-deviate saling berimpit, namun residual
log-odds lah yang lebih berimpit.
Seperti halnya dalam pembentukan model Cox proportional hazard untuk
data kenker paru-paru, pembentukkan model parametrik untuk data kanker paru-
paru juga dilakukan dengan menggunakan 6 variabel.
Gambar 4.5 Plot Residual Cox-Snell, Martingale dan Deviance Data Kanker
Paru-Paru unruk Model Parametrik
Dari gambar 4.5, sulit ditentukan mana yang lebih baik antara model
eksponensial atau model Weibull, karena hasil plot hampir sama.
Gambar 4.6 Plot Residual Log-odds dan Normal-deviante Data Kanker Paru-Paru unruk Model Parametrik
Gambar 4.6 pun sama seperti gambar 4.5, yaitu sulit untuk menentukan model
mana yang lebih baik. Namun pada histogram lebih bisa terlihat perbedaannya,
seperti yang akan dijelaskan pada gambar 4.7, 4.8, 4.9, 4.10, dan 4.11.
Gambar 4.7 Histogram Residual Cox-Snell Model Eksponensial (atas) dan Model Weibull (bawah) Data Kanker Paru-Paru
Pada gambar 4.7 terlihat bahwa, untuk residual Cox-Snell hasil yang diperoleh
tidak baik. Namun jika dibandingkan antara model eksponensial dan model Weibull,
maka model eksponensial yang lebih baik karena kedua kurva pada model
eksponensial yang lebih berimpit.
Gambar 4.8 Histogram Residual Martingale Model Eksponensial (bawah) dan Model Weibull (atas) Data Kanker Paru-Paru
Pada gambar 4.8 terlihat bahwa, untuk residual Martingale hasil yang
diperoleh juga tidak baik. Namun jika dibandingkan antara model eksponensial dan
model Weibull, maka model Weibull yang lebih baik karena kedua kurva pada
model Weibull yang lebih berimpit.
Gambar 4.9 Histogram Residual Deviance Model Eksponensial (atas) dan Model Weibull (bawah) Data Kanker Paru-Paru
Sama seperti pada residual Cox-Snell dan Martingale, gambar 4.9 menunjukan
bahwa hasil yang diperoleh dari residual deviance tidak terlalu baik. Namun jika
dibandingkan antara model eksponensial dan model Weibul, maka model
eksponensial yang lebih baik karena kedua kurva pada model eksponensial yang
lebih berimpit.
Gambar 4.10 Histogram Residual Normal-deviante Model Eksponensial (atas) dan Model Weibull (bawah) Data Kanker Paru-Paru
Pada gambar 4.10, jika dibandingkan antara model eksponensial dengan model
weibull, maka model eksponensial yang lebih baik. Tetapi ini masih belum
menunjukan hasil yang baik
Gambar 4.11 Histogram Residual Log-odds Model Eksponensial (atas) dan Model Weibull (bawah) Data Kanker Paru-Paru
Pada gambar 4.10, residual log-odds model Weibul sudah menunjukan hasil
yang baik. Namun hasil yang diperoleh tidak sebaik hasil dari model Cox
Proportional hazard.
Hasil dari Cox proportional hazard dan model parametrik terangkum pada
tabel 4.1. Dari tabel terlihat bahwa dari keenam variabel yang digunakan pada
pembentukan model Cox proportional hazard semua variabelnya signifikan, pada
model eksponensial tidak ada satupun variabel yang signifikan dan pada model
Weibull hanya log (scale) yang signifikan.
Kesignifikanan z-value pada log (scale) dalam model Weibull menunjukkan
bahwa model eksponensial diperbaiki oleh model Weibull. Tetapi hasil yang
diperoleh dari kedua model parametrik tersebut tidak terlalu berbeda, dan
berdasarkan prinsip parsimony “pilih model yang lebih sederhana“ maka pilihannya
adalah model eksponensial.
Tabel 4.1 Analisis Data Kanker Paru-Paru
Cox-PH Eksponensial Weibull Faktor z-value
(p-value) rr z-value (p-value)
Estimate Accelerations
z-value (p-value)
Estimate Accelerations
ph.ecog 3.76 (0.00017)* 2.22 -3.12
(0.090) -0.64 -3.91 (0.061 ) -0.55
sex -3.38 (0.00073 )* 0.55 3.02
(0.127) 0.53 3.34 (0.155) 0.41
inst -2.12 (0.03400)* 0.98 1.93
(0.717) 0.02 2.13 (0.452) 0.01
wt.loss -2.04 (0.04100)* 0.99 1.63
(0.382) 0.01 2.03 (0.572) 0.01
ph.karno 2.00 (0.04600)* 1.02 -1.45
(0.537) -0.01 -2.19 (0.390) -0.01
pat.karno -1.98 (0.04800)* 0.99 1.52
(0.475) 0.01 2.03 (0.572) 0.01
log(scale) -5.83 (0.007)* -0.38
rr : relative risk
Dari hasil tersebut, terlihat bahwa model Cox proportional hazard jauh lebih
baik digunakan untuk memodelkan data kanker paru-paru dibandingkan dengan
model parametrik.
4.2 Simulasi
Satu set data yang digunakan seperti analisis di atas tidak cukup untuk
menggeneralisasi pengujian sifat-sifat residual, karena setiap set data bergantung
pada sifat dasar penelitian yang dilakukan. Selain itu kita juga tidak dapat
mengontrol setiap kasus dengan missing value atau penelitian dengan angka
penyensoran yang besar.
Oleh karena itu, kita hasilkan sampel random dari distribusi eksponensial dan
distribusi Weibull untuk pembentukan model Cox proportional hazard dan model
accelerated failure time. Residual normal-deviate dan residual log-odds
dibandingkan antar model untuk menghasilkan model yang terbaik.
Sampel dengan ukuran 200 dihasilkan menggunakan pembangkit angka acak
pada software S-plus. Sebuah kovariat dan grup diasumsikan mengikuti distribusi
binomial dengan peluang ½ untuk grup 1 atau grup 0. Rata-rata dari subjek yang
dimasukkan dalam penelitian adalah konstan dengan waktu diasumsikan mengikuti
distribusi uniform pada interval (0,1).
Untuk distribusi eksponensial survival time T dibangkitkan dengan hazard h(t |
grup = 0) = 1 dan h(t | grup = 1) = 1/2. Sampel random tanpa penyensoran yang
dihasilkan digunakan dalam analisis.
Untuk distribusi Weibull survival time T dibangkitkan dengan parameter shape
(λ) = 2 dan scale (γ) = 0,5 untuk grup 0 dan shape (λ) = 2 dan scale (γ) = 2
untuk grup 1. Sampel random dengan 40% penyensoran kanan yang dihasilkan
digunakan dalam analisis.
Setelah pembentukan model Cox proportional hazard dan model parametrik
(eksponensial dan Weibull), residual normal-deviate dan residual log-odds
dibandingkan. Hanya kedua jenis residual ini yang digunakan karena pada hasil dari
data kanker paru-paru, kedua jenis residual inilah yang dapat mengidentifikasikan
kecocokan model dengan baik. Hal ini diperoleh dari hasil analisis statistik yang
biasa digunakan untuk melihat kecocokan mode, yaitu uji parsial parameter dalam
model. Hasil dari penelitian tanpa penyensoran yang tadi telah diperoleh
ditunjukkan seperti gambar 4.5 dan 4.6 dan 4.7.
Gambar 4.12 Histogram dan QQ-Plot Residual Normal-deviate (atas) dan Residual Log-odds (bawah) Model Cox proportional hazard dari Data yang Berdistribusi Eksponensial
Dari gambar 4.12 terlihat bahwa berdasarkan residual normal-deviate dan
residual log-odds, model Cox proportional hazard cukup baik untuk diterapkan
pada data. Hal ini ditunjukkan dari berimpitnya kurva density yang diperoleh dari
model Cox proportional hazard dengan kurva density yang seharusnya (distribusi
normal untuk residual normal-deviate dan distribusi logistik untuk residual log-
odds).
Gambar 4.13 Histogram dan QQ-Plot Residual Normal-deviate Model Eksponensial (atas) dan Model Weibull (bawah) dari Data yang Berdistribusi Eksponensial
Akan tetapi, berdasarkan gambar 4.13 density dari residual normal-deviate
untuk model eksponensial lebih berimpit dengan density secara teoritis.
Gambar 4.14 Histogram dan QQ-Plot Residual Log-odds Model Eksponensial (atas) dan Model Weibull (bawah) dari Data yang Berdistribusi Eksponensial
Gambar 4.14 pun memberikan indikasi yang serupa, walaupun tidak terlalu
jelas perbedaan antara hasil dari model eksponensial dan model Weibull. Model
eksponensial lebih bagus dibandingkan dengan model Weibull, sesuai dengan yang
diharapkan.
Gambar 4.15 Histogram Model Eksponensial dan Model Weibul dari Data yang Berdistribusi Weibull dengan 40% Data Tersensor Kanan
Dari gambar 4.8 terlihat bahwa density dari residual normal-deviate model
Weibull yang lebih mendekati density secara teoritis dibandingkan model
eksponensial. Namun hasil yang diperoleh tidak terlalu bagus. Hal ini disebabkan
karena sebanyak 40% data tersensor kanan.
BAB V
KESIMPULAN DAN SARAN
5.1 Kesimpulan
1) Dari hasil contoh data kanker paru-paru dapat disimpulkan, jika distribusi dari
survival time tidak diketahui, maka model Cox proportional hazard lebih baik
dibandingkan dengan model parametrik.
2) Dari hasil simulasi :
a. Jika distribusi diketahui maka model parametrik (dengan distribusi yang
sesuai) memberikan hasil yang lebih baik dibandingkan model Cox
proportional hazard.
b. Walaupun tidak lebih baik daripada model parametrik, tetapi model Cox
proportional hazard tetap cocok untuk memodelkan data.
c. Untuk data yang tersensor sama seperti pada poin a dan b di atas, namun
hasil yang diperoleh tidak terlalu baik.
3) Residual normal deviate dan log-odds dapat digunakan untuk pemilihan model
yang cocok untuk suatu data.
5.2 Saran
Model Cox proportional hazard lebih baik diterapkan jika tidak diketahui
dengan pasti distribusi dari survival time. Akan tetapi ini hanya berdasarkan satu set
data (yaitu data penderita kanker paru-paru) dan simulasi pada dua distribusi
(eksponensial dan Weibull). Untuk data dengan distribusi lainnya belum diperiksa.
Selain itu simulasi untuk data yang berdistribusi eksponensial hanya dicoba dengan
1=λ untuk grup 1 dan 21
=λ untuk grup 2. Sedangkan untuk data yang berdistribusi
Weibull hanya dicoba dengan 2=λ , 21
=γ untuk grup 1 dan 2=λ , 2=γ untuk
grup 2. Untuk nilai yang lain belum dicoba oleh karena itu cobalah untuk penelitian
lebih lanjut.
DAFTAR PUSTAKA
[1] Abdullah, Sarini, New residuals and Their Application in Model Selection,
Thesis The University of New South Wales Departement of Statistics, New
South Wales, 2004.
[2] Hanke, John E., Business Forcasting, Prentice Hall, New Jersey, 1998
[3] Kalbfleisch, J. D. dan Prentice, R. L. The Statistical analysis of Failure Time
Data, John Wiley and Sons, 1980.
[4] Klein, John P., Moeschberger, Melvin L. Survival Analysis Techniques for
Censored and Truncated Data, Spinger, New York, 1997.
[5] Nardi, A. dan Schemper, M., New Residual for Cox Regression and Their
Application to Outlier screening, Biometrics,1999.
[6] Nardi, A. dan Schemper, M., Comparing Cox and Parametric Models in
Clinical Studies, Springer: New York, 2000.
[7] Therneau, T. M. dan Grambsch, P. M., Modelling Survival Data. Extending
The Cox Model, Spinger:New York, 2000.
[8] Walpole, R. E., Pengantar Statistik,. Gramedia Pustaka Utama. Jakarta, 1995.
[9] Weibull, W., A statistical distribution function of wide applicability, J.
Appl.Mech.-Trans. ASME 18(3), 293-297, 1951.
[10] http://en.wikipedia.org/wiki/Exponential Distribution, 27 Maret 2007
[11] http://en.wikipedia.org/wiki/Survival Analysis, 31 Maret 2007
[12] http://en.wikipedia.org/wiki/Probability_density_function, 2 April 2007
[13] http://en.wikipedia.org/wiki/Survival or Failure Time, 11 April 2007
[14] http://en.wikipedia.org/wiki/Weibull_distribution, 11 April 2007
LAMPIRAN
1. Data Penderita Kanker Paru-Paru
1 inst sex ph.ecog ph.karno pat,karno wt.loss2 3.00 1.00 1.00 90.00 100.00 NA
2. Program S-Plus 2000 Model Cox Proportional Hazard Data Penderita Kanker Paru-
Paru #Cox-Ph model untuk data kanker paru #Status=indikator kematian (2) atau pensensoran (1)
#Mencocokkan model Cox-Ph dan mendapatkan model cox-Ph terbaik inst<-lung$v1 time<-lung$v2 status<-lung$v3 age<-lung$v4 sex<-lung$v5 ph.ecog<-lung$v6 ph.karno<-lung$v7 pat.karno<-lung$v8 meal.cal<-lung$v9 wt.loss<-lung$v10 #Model akhir untuk model cox-ph lung.cox<-
ar predictor",ylab="residual") points(pre.exp[status1==0],rci.exp[status1==0],type="p",pch="*") title(main="Residual Cox-Snell Model Eksponensial",cex=.6) plot(pre.weib[status1==1],rci.weib[status1==1],type="p",pch=".",
points(pre.weib[status1==0],rci.weib[status1==0],type="p",pch="*") title(main="Residual Cox-Snell Model Weibull",cex=.6) plot(pre.exp[status1==1],rmi1.exp[status1==1],type="p",pch=".", xlim=c(min(pre.exp),max(pre.exp)),ylim=c(min(rmi1.exp),max(rmi1.exp)),xlab="li
near predictor",ylab="residual") points(pre.exp[status1==0],rmi1.exp[status1==0],type="p",pch="*") title(main="Residual Martingale Model Eksponensial ",cex=.6) plot(pre.weib[status1==1],rmi1.weib[status1==1],type="p",pch=".", xlim=c(min(pre.weib),max(pre.weib)),ylim=c(min(rmi1.weib),max(rmi1.weib)),xlab
="linear predictor",ylab="residual") points(pre.weib[status1==0],rmi1.weib[status1==0],type="p",pch="*") title(main="Residual Martingale Model Weibull ",cex=.6) plot(pre.exp[status1==1],rdi1.exp[status1==1],type="p",pch=".", xlim=c(min(pre.exp),max(pre.exp)),ylim=c(min(rdi1.exp),max(rdi1.exp)),xlab="li
near predictor",ylab="residual") points(pre.exp[status1==0],rdi1[status1==0],type="p",pch="*") title(main="Residual Deviance model Eksponensial",cex=.6) abline(h=c(qnorm(0.025),qnorm(0.975)),lty=2) plot(pre.weib[status1==1],rdi1.weib[status1==1],type="p",pch=".", xlim=c(min(pre.weib),max(pre.weib)),ylim=c(min(rdi1.weib),max(rdi1.weib)),xlab
="linear predictor",ylab="residual") points(pre.weib[status1==0],rdi1[status1==0],type="p",pch="*") title(main="Residuals Deviance Model Weibull",cex=.6) abline(h=c(qnorm(0.025),qnorm(0.975)),lty=2) plot(pre.exp[status1==1],nmi.exp[status1==1],type="p",pch=".", xlim=c(min(pre.exp),max(pre.exp)),ylim=c(min(nmi.exp),max(nmi.exp)),xlab="line
ar predictor",ylab="residual") points(pre.exp[status1==0],nmi.exp[status1==0],type="p",pch="*") title(main="Residual Normal Deviate Model Eksponensial",cex=.6) abline(h=c(qnorm(0.025),qnorm(0.975)),lty=2) plot(pre.weib[status1==1],nmi.weib[status1==1],type="p",pch=".", xlim=c(min(pre.weib),max(pre.weib)),ylim=c(min(nmi.weib),max(nmi.weib)),xlab="
linear predictor",ylab="residual") points(pre.weib[status1==0],nmi.weib[status1==0],type="p",pch="*") title(main="Residual Normal Deviate Model Weibull",cex=.6) abline(h=c(qnorm(0.025),qnorm(0.975)),lty=2) plot(pre.exp[status1==1],lmi.exp[status1==1],type="p",pch=".", xlim=c(min(pre.exp),max(pre.exp)),ylim=c(min(lmi.exp),max(lmi.exp)),xlab="line
ar predictor",ylab="residual") points(pre.exp[status1==0],lmi.exp[status1==0],type="p",pch="*") title(main="Residual Log-Odds Model Eksponensial",cex=.6) abline(h=c(qnorm(0.025),qnorm(0.975)),lty=2) plot(pre.weib[status1==1],lmi.weib[status1==1],type="p",pch=".", xlim=c(min(pre.weib),max(pre.weib)),ylim=c(min(lmi.weib),max(lmi.weib)),xlab="
linear predictor",ylab="residual") points(pre.weib[status1==0],lmi.weib[status1==0],type="p",pch="*") title(main="Residual Log-Odds Model Weibull",cex=.6) abline(h=c(qnorm(0.025),qnorm(0.975)),lty=2) #Histogram Residual Cox-Snell Model Eksponensial hist(rci.exp,xlab="Residual Cox-Snell Model Eksponensial")
4. Program S-Plus 2000 Untuk Simulasi set.seed(373) npat<-100 rate1<-1 rmult<-1/2 stimes1<-rexp(npat,rate=rate1) #menghasilkan sampel random pada survival time
berukuran 100 dari distribusi eksponensial stimes2<-rexp(npat,rate=rmult)