Penerapan Metode K-Means Clustering Dalam Sistem Informasi Geografis Cuaca Dengan Framework MS4W (Studi Kasus: Data Curah Hujan Dan Hari Hujan Di Jawa Tengah) Artikel Ilmiah Peneliti: Griyan Rizky Atmaja (672013198) Dr. Sri Yulianto Joko Prasetyo, S.Si., M.Kom. Program Studi Teknik Informatika Fakultas Teknologi Informasi Universitas Kristen Satya Wacana Salatiga Agustus 2017
25
Embed
Penerapan Metode K-Means Clustering Dalam Sistem ......diagram, Activity diagram, dan Sequence diagram serta perancangan arsitektur aplikasi. c. Perancangan aplikasi, pada tahap ini
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
Penerapan Metode K-Means Clustering Dalam Sistem Informasi
Geografis Cuaca Dengan Framework MS4W
(Studi Kasus: Data Curah Hujan Dan Hari Hujan Di Jawa Tengah)
Artikel Ilmiah
Peneliti:
Griyan Rizky Atmaja (672013198)
Dr. Sri Yulianto Joko Prasetyo, S.Si., M.Kom.
Program Studi Teknik Informatika
Fakultas Teknologi Informasi
Universitas Kristen Satya Wacana
Salatiga
Agustus 2017
ii
iii
iv
v
1
1. Pendahuluan
Cuaca merupakan keadaan rata-rata udara pada periode waktu sesaat dan salah satu
variable yang menentukan kondisi iklim. Iklim merupakan rata-rata cuaca pada periode
waktu tertentu dan faktor yang mempengaruhi terhadap tipe atau variasi iklim yaitu
curah hujan. Curah hujan adalah air hujan yang berkumpul dalam satu daerah yang
datar, yang memiliki asumsi yaitu tidak menguap, meresap dan mengalir. Rata-rata
curah hujan perbulan didapat dari nilai rata-rata dengan minimal periode 10 (sepuluh)
tahun dan curah hujan normal per bulan didapat dari nilai rata-rata curah hujan selama
periode 30 (tiga puluh) tahun[3].
Indonesia berada di wilayah tropis dan memiliki curah hujan per tahun yang cukup
tinggi. Curah hujan berpengaruh terhadap aktifitas kehidupan seperti keselamatan
masyarakat, produksi pertanian, perikanan, perkebunan dan lain-lainnya sesuai dengan
keadaan di daerah masing-masing. Selain bermanfaat, curah hujan juga dapat
menyebabkan bencana tanah longsor dan banjir[2]. Selain itu hama pertanian tumbuh
sangat banyak di curah hujan yang tinggi. Untuk dapat merencanakan pertanian dengan
tepat, mengoptimalkan produktivitas teknologi dan industri yang erat kaitannya dengan
curah hujan, dan mengantisipasi dampak curah hujan, maka harus mengetahui seberapa
tinggi rendahnya curah hujan disetiap daerah.
Mengetahui tinggi rendahnya curah hujan maka dapat dilakukan dengan cara
mengelompokkan data menjadi beberapa kategori. Pengelompokan data akan akurat
jika dengan menggunakan metode yang akurat. Salah satu metode yang dapat
diterapkan pada kasus ini adalah metode K-Means[2]. Metode K-Means diterapkan
pada aplikasi sistem informasi geografis cuaca pada data curah hujan yang bertujuan
untuk memperlihatkan pemetaan hasil pengelompokan curah hujan dan hari hujan
setiap Kabupaten dan Kota di Jawa Tengah dalam bentuk geografis, sehingga
mempermudah dalam mengetahui seberapa tinggi dan rendahnya curah hujan disetiap
daerah. Tujuan utama penelitian ini adalah penambahan metode K-Means pada sistem
informasi geografis menggunakan MS4W (Map Server).
Metode K-Means bekerja dengan cara membagi data dalam cluster dan membuat
data tepat dalam satu cluster. Nilai hasil cluster dapat dilihat dari jarak terdekat antara
data dengan centroid. Kemudian hasil dari penghitungan metode K-Means di terapkan
dalam menetukan perwaranaan pada pemetaan. Tujuan utama dari aplikasi ini
diharapkan sistem informasi geografis dengan metode K-Means dapat membantu
masyarakat dalam mencari informasi curah hujan di daerah Jawa Tengah selama satu
bulan, terutama masyarakat yang tergantung kepada informasi curah hujan.
2. Tinjauan Pustaka
Penelitian terdahulu yang berjudul “Penerapan Metode K-Means Dalam
Pengelompokan Curah Hujan Di Kalimantan Timur” membahas tentang informasi
curah hujan dalam satu wilayah. Penelitian tersebut menggunakan metode K-Means
2
untuk mengolah data curah hujan per tahun pada stasiun pengamatan di Provinsi
Kalimantan Tengah. Metode K-Means mampu mengelompokkan curah hujan
berdasarkkan tiga kategori rendah, sedang, dan tinggi[2].
Penelitian yang berjudul “Clustering Data Cuaca Untuk Pengenalan Pola
Perioditas Iklim Wilayah Pelaihari Dengan Metode Fuzzy K-Mens” membahas tentang
proses pengolahan data menggunakan algoritma fuzzy c-mens data tersebut berupa data
kecepatan angin, kelembapan udara, penguapan, temperatur, dan curah hujan. Data
tersebut diperoleh 4 klaster dan kondisi cuaca tahun 1990-1999 dari data tersebut akan
di dapatkan kondisi priode setiap tahunnya menjadi semakin panas, dan pergeseran
musim kemarau[3].
Penelitian sebelumnya “Integrasi Perangkat Lunak Arcgis 9.3, Xampp, Mapserver
for Windows dan Geoserver dalam Rangka Penyusunan Peta Geologi Pulau Bangka
Digital Berbasis Web” membahas tentang aplikasi sistem informasi geografis
menggunakan beberapa perangkat lunak yang bertujuan untuk mengelola data spasial
yang berupa wilayah geografis dan berupa informasi non-spasial yang berhubungan
dengan geologi pada pengguna sistem informasi geografis web-Bassed[6].
Perbedaan penelitian ini dengan sebelumnya adalah penyempurnaan dalam
mengolah data curah hujan dan mengoptimalkan metode K-Means pada sistem
informasi geografis cuaca pada data curah hujan dan hai hujan di Jawa Tengah.
Manfaat adanya optimalisasi tersebut diharapkan dapat membantu dalam pengolahan
data curah hujan yang akan dibuat dalam bentuk pemetaan di wilayah Jawa Tengah.
Penelitian MS4W menggunakan metode K-Means atau pengelompokan data
digunakan pada data mining yang berguna untuk mengelompokkan data-data yang
telah ada ke dalam cluster atau mengelompokkan data sesuai dengan kemiringan atau
atribut data. Metode K-Means menggunakan teknik atau rumus Euclidean Distance.
Metode Euclidean Distance sangat baik untuk menghitung jarak dengan pusat cluster,
selanjutnya akan didapatkan matriks jarak yaitu berupa centroid 1 dan centroid 2[9].
Rumus Euclidean Distance sebagai berikut :
𝑑𝑒 = ∑ √∑ (𝑓𝑑ᵢ, ₖ − 𝑘ⱼ)²𝑚𝑘=1
𝑚
𝑘=1……(1)
Keterangan :
𝑑𝑒 = jarak euclidien
𝑓𝑑ᵢ = data curah hujan
𝑘ⱼ = data hari hujan
𝑚 = jumlah data
3
3. Metode Penelitian Dalam proses penelitian yang menggunakan metode K-Means dilakukan beberapa
tahapan yang saling berkaitan satu sama lain. Penelitian ini diterapkan metodologi
penelitian seperti pada gambar 1.
Gambar 1. Tahapan Penelitian
Gambar 1 menunjukkan tahapan-tahapan penelitian yang ada. Tahapan–
tahapannya adalah sebagai berikut:
a. Identifikasi Masalah, pada tahap ini peneliti mengidentifikasi permasalahan curah
hujan di Kabupaten dan Kota di Jawa Tengah yang menjadi acuan dalam
pembuatan sistem informasi geografis yang bertujuan untuk mengelompokan
menjadi beberapa kategori dan melihat pemetaan dari hasil pengelompokan dalam
bentuk geografis.
b. Perancangan Sistem, pada tahap ini dilakukan perancangan sistem dengan
membuat Unified Modelling Language (UML), meliputi Use Case diagram, Class
diagram, Activity diagram, dan Sequence diagram serta perancangan arsitektur
aplikasi.
c. Perancangan aplikasi, pada tahap ini dilakukan pembuatan aplikasi sistem
informasi geografis berupa pemetaan iklim hujan yang ada di daerah Jawa Tengah
berdasarkan data yang diperoleh dari Pusat Studi Sistem Informasi Pemodelan dan
Mitigasi Tropis (SIMITRO).
d. Implementasi dan pengujian sistem, pada tahap ini adalah proses penerapan dari
rancangan aplikasi pada tahap sebelumnya setelah itu dilakukan proses pengujian
dan analisa terhadap hasil pengujuan.
e. Penulisan hasil penelitian, dalam tahap ini pada tahap ini dilakukan penulisan
terhadap penelitian yang telah dilakukan dalam bentuk laporan.
Metode yang digunakan dalam pembuatan sistem ini adalah metode prototype.
Metode prototype adalah metode yang cocok untuk digunakan membangun sistem
4
tersebut berdasarkan kebutuhan user yang tidak mengidentifikasi secara detail input
dan output. Metode prototype dapat dilihat seperti gambar berikut :
Gambar 2. Metode Prototype
Gambar 2 merupakan gambar metode prototype diawali dengan pengumpulan data
curah hujan di Jawa Tengah yang diperoleh dari Pusat Studi Sistem Informasi
Pemodelan dan Mitigasi Tropis (SIMITRO). Pencarian informasi untuk menentukan
kebutuhan, tujuan dan gambaran suatu sistem. Tahap-tahap yang dilakukan pada
metode prototype dalam membuat aplikasi sistem informasi geografis cuaca pada data
curah hujan adalah:
a. Tahap pengumpulan data, Data yang digunakan dalam penelitian ini adalah data
sekunder yang yang diperoleh dari Pusat Studi Sistem Informasi Pemodelan dan
Mitigasi Tropis (SIMITRO) untuk periode tahun 2008-2011 dimana data yang
digunakan adalah data per bulan. Penelitian ini yang dijadikan unit observasi adalah
Kabupaten dan Kota di Provinsi Jawa Tengah. Data yang digunakan adalah data
curah hujan dan hari hujan.
b. Tahap pengujian metode ini bertujuan menguji metode K-Means Clustering.
Pengujian metode ini dilakukan perhitungan sesuai rumus dengan media excel untuk
melihat apakah benar metode tersebut cocok dan layak untuk digunakan dan
diterapkan pada sistem penyeleksian ini. Tahap pengujian metode ini diharapkan
dapat memberikan informasi kepada masyarakat mengenai tinggi rendahnya curah
hujan setiap bulan di Jawa Tengah.
c. Tahap perancangan sistem ini dibuat perancangan desain sistem dimana nantinya
terdapat 2 user yang dibedakan antara admin dan user. Admin yang mengatur semua
5
sistem pada website sistem informasi geografis yang menampung data curah hujan.
User bertugas untuk melihat data curah hujan yang telah diinput oleh admin.
perancangan sistem ini mulai dibuat dengan menggunakan Unified Modelling
Language (UML).
d. Setelah tahap demi tahap selesai, kemudian dilakukan evaluasi untuk mengetahui
kekurangan dari sistem dan kelebihan dari sistem. Jika terdapat kekuarangan maka
sistem akan diperbaiki, jika tidak ada kekurangan maka tahap selesai.
Selanjutnya dalam tahap ini dilakukan perancangan sistem serta perancangan
user interface dari model yang akan dibangun. Adapun diagram yang dibuat yaitu Use
Case diagram. Use Case diagram dari model yang akan dibangun dapat dilihat di
gambar 3.
Gambar 3. Use Case Diagram pada Sistem Informasi Geografis Iklim Hujan
Gambar 3 merupakan use case diagram pada sistem informasi geografis Iklim
Hujan di Jawa Tengah. Use-case menjelaskan sistem yang sedang dibangun memiliki
user yang hanya bisa melihat data hujan, dan hasil pemetaan saja, yang telah diolah
sebelumnya oleh admin, manipulasi data atau menghapus sejumlah data, dan
mengelola csv hanya bisa dilakukan oleh admin.
Hapus Data Tambah Data Edit Data
Pengolahan Data Curah Hujan
View Data Curah Hujan
Hasil Pemetaan
Tampilan Utama UserUser
Login AdminAdmin
Tampilan Utama Admin
Mengolah CSV
6
Gambar 4. Activity Diagram Login Admin
Gambar 4 menjelaskan tentang Activity diagram login admin yaitu menjelaskan
aktivitas admin dan aplikasi saat pertama kali dijalankan hingga masuk ke menu utama.
Gambar 4 menunjukan jika masuk ke menu utama admin harus melakukan login
terlebih dahulu, langkang awal admin mengisi username dan password lalu system
akan request ke database jika password dan username invalid maka admin akan
kembali ke menu login, sedangkan jika admin telah login dengan benar atau valid,
secara otomatis admin langsung masuk ke menu utama (admin).
mengisi username
dan password
menu utama
request
login valid
validasi
benar
salah
databasesystemadmin
7
Gambar 5. Activity Diagram pada Sistem Informasi Curah Hujan
Gambar 5 merupakan activity diagram sistem informasi geografis iklim cuaca di
Jawa Tengah. Admin melakukan login dari mulai input username dan password sampai
dengan memanipulasi data, proses manipulasi data terbagi menjadi 3 yaitu insert data,
update data, dan delete data. secara umum gambaran fungsionalitasnya dibuat dalam
bentuk activity diagram ditunjukkan pada gambar 5.
Arsitektur sistem menjelaskan konsep desain arsitektur sistem yang akan
dirancang dan dibangun. Program apa saja yang digunakan serta arus alur yang terjadi
pada program serta relasi antar program tersebut. Berikut gambar 6 akan menjelaskan
mengenai arsitektur sistem.
Masukkan Username
dan Password
Mengolah CSV
Melihat
Pemetaan
end
Memilih Menu
hapus data
edit data
Mengolah Data
tambah data
mengulang
aktifitas
Proses Login
ValidasiNo
Menu Utama
Admin
Ya
Hasil pengolahan
data manual
SystemAdmin
8
Gambar 6. Sequence Diagram Login Admin
Gambar 6 menunjukan bagaimana proses login pada admin yang harus melewati
tahapan-tahapan, admin harus form untuk login setelah itu admin mengisi username
dan password setelah itu database akan validasi data kemudian menampilakan pesan
kesalahan jika username dan password tidak sesuai. Selanjutnya, jika valid maka
database akan menampilkan halaman utama web dan admin dapat mengelola data
kemudian admin kemabali ke halaman utama web setelah selesai mengolah data lalu
logout.
Gambar 7. Sequence Diagram Admin Input Data
Admin : AdminAdmin : AdminLoginLogin Halaman UtamaHalaman Utama Form input dataForm input data databasedatabase
1 : Akses Login ()
2 : Halaman Utama admin
3 : Form input data
4 : Simpan
5 : Tampilkan hasil Inputan
9
Gambar 7 menjelaskan bagaimana admin masuk kehalamn web dengan login
terlebih dahulu jika login sukses selanjutnya admin menuju ke halaman utama
kemudian admin menampilkan bagian form input data curah hujan setelah data terisi
semua simpan form data inputan ke data database secara otomatis data inputan yang
telah di isi admin akan muncul ke tabel hasil inputan .
Gambar 8. Class Diagram
Gambar 8 menujukan bahwa adanya relasi antara tabel kab dengan tabel cc yang
relasinya berupa kode kab yang merupakan primary key dari tabel kab dengan kode
kab yang ada pada tabel cc, yang nantinya akan menghasilkan berupa nama kab. yang
nantinya akan muncul di interface user dan admin.
Gambar 9. Design Arsitektur pada Sistem Informasi Geografis Iklim Hujan
10
Gambar 9 menjelaskan tentang arsitektur sistem yang ada pada aplikasi ini.
Dari pengguna mulai dengan request informasi yang ada pada aplikasi sistem informasi
yang ada pada aplikasi web. Jika user ingin melihat data maka aplikasi sistem informasi
ini akan request data-data curah hujan yang ada pada database kemudian ditampilkan
pada menu lihat data. Menu mengolah data admin juga sama, jika input, edit, dan delete
data makan sistem informasi ini akan megolah data dan secara otomatis metode K-
Means bekerja kemudian dimasukkan ke dalam database yang nantinya akan
ditampilkan pada menu lihat data. Untuk menu lihat peta aplikasi request data 30
Kabuaten Kota ke database. Data dari database akan dicocokkan dengan 30 Kabuaten
Kota yang ada pada shape file dan source file (SHP) yang ada. MapServer (MS4W)
menjadi jembatan antara aplikasi web php dengan SHP. MapServer terdapat fungsi-
fungsi dapat membaca database SHP kemudian menkonfersikan kedalam bentuk peta.
Jika data dari 30 Kabupaten dan Kota yang ada pada SHP sesuai maka dilakukan
pewarnaan berdasarkan nilai metode curah hujan tiap daerah. Warna yang ada pada
peta Jawa Tengah menjadi acuan untuk pemberian informasi curah hujan tiap bulan.
4. Hasil dan Pembahasan
Hasil sistem yang dibangun adalah penerapan dari metode K-means pada sistem
informasi geografis curah hujan di Jawa Tengah menggunakan php. Pengguna sistem
ini dibagi menjadi dua, yang pertama adalah admin yang berperan untuk mengola
keseluruhan data dan yang kedua adalah user yang berperan untuk melihat hasil dari
pemetaan berupa geografis seperti gambar 13. Seperti yang sudah dijelaskan
sebelumnya tentang metode K-Means, dimana nantinya akan berperan dalam
mengelompokan data curah hujan.
Gambar 10. Menu Login Admin
11
Gambar 10 merupakan gambar menu login admin dimana sebelum masuk ke menu
utama admin dan melakukan pengolahan data curah hujan dimana admin harus login
terlebih dahulu.
Gambar 11. Grafik Curah Hujan dan Hari Hujan Bulan Desember Tahun 2008
Gambar 11 data hujan merupakan data hujan pada bulan desember tahun 2008
pada data tersebut terdapat 30 Kabupaten atau Kota di Jawa Tengah, data yang terdapat
di gambar 11 yaitu data curah hujan dan hari hujan. Data pada gambar 11 selalu
mengalami fluktuasi data yang beragam, dengan data curah hujan tertinggi terdapat
pada Kabupaten Jepara dengan nilai 548 dan data hari hujan tertinggi pada Kabupaten
Wonosobo dengan nilai 23. Data curah hujan terendah terdapat pada Kabupaten Blora
dengan nilai 140 dan data hari hujan terendah terdapat di Kabupaten Klaten dengan
nilai 9.
Tahap ini di jelaskan langkah-langkah pengoprasian algoritma K-Means secara
manual. Dari banyak data Kota dan Kabupaten di Jawa Tengah untuk penerapan
metode K-Means dalam data hujan di lakukan dengan parameter-parameter berikut ini
jumlah cluster = 2, jumlah data = 30, jumlah atribut = 2.
Tabel 1. Pusat Awal Cluster
Variable Cluster
1 (Maksimum) 2 (Minimum)
Curah Hujan 548 140
Hari Hujan 17 12
0
100
200
300
400
500
600
Bre
bes
Teg
al
Pem
alan
g
Pek
alon
gan
Bat
ang
Ko
ta S
emar
ang
Sem
aran
g
Ken
dal
Dem
ak
Gro
bo
gan
Pat
i
Ku
du
s
Jep
ara
Rem
ban
g
Blo
ra
Ban
yu
mas
Cil
acap
Purb
alin
gga
Ban
jarn
egar
a
Mag
elan
g
Tem
ang
gu
ng
Won
oso
bo
Purw
ore
jo
Keb
um
en
Suk
oh
arjo
Kar
ang
anyar
Won
og
iri
Sra
gen
Kla
ten
Bo
yo
lali
Data Hujan Bulan Desember Tahun 2008
Curah Hujan HariHujan
12
Rumus mencari cluster:
Nilai tertinggi curah hujan = Max (curah hujan) …….(2)
Nilai terendah curah hujan = Min (curah hujan) …….(3)
Tabel 1 Merupakan tabel pusat awal cluster, pada bagian ini di cari dulu titik awal
cluster yang yang nanti akan di hitung untuk mencari centroid pada cluster 1 di
dapatkan dengan cara mencari nilai maksimum dari data curah hujan pada bulan
desember tahun 2008 dan di dapatkan cluster 1 dengan nilai 548 dan 17 di ambil dari
data ke 13, selanjutnya pada cluster 2 di cari data minimum dan di dapatkan cluster 2
Kode program pseudocode merupakan algoritma metode K-Means, pada baris 2-
5 berfungsi untuk mencari data x tertinggi pada database, baris 7-10 berfungsi untuk
mencari data x terendah. Baris 12-14 untuk menginputkan manual data x dan data y.
Baris ke 16 untuk mengambil semua data yang di inputkan di database tiap per bulan,
baris 17-23 mencari nilai C₁, baris 25-31 mencari nilai C₂ dan baris terakhir 33-34
untuk mencari data terendah dari C₁ dan C₂.
Pengujian proses penghitungan metode K-Means digunakan untuk
mengelompokkan data. Pertama kita mengambil data curah hujan dan hari hujan dari
tabel cc untuk mencari data maksimum dan minimum. Selanjutnya setelah mendapat
17
nilai maksimum dan minimum menghitung dengan menggunakan rumus dari
Euclidean Distance untuk menghasilkan C₁ dan C₂, setelah itu nilai C₁ dan C₂ dihitung untuk mencari nilai minimum. Selanjutnya nilai minimum tersebut digunakan
dalam mengelompokkan data curah hujan untuk mencari tinggi rendahnya curah
hujan.
Gambar 15. Hasil Pemetaan
Gambar 15 merupakan tampilan dari pemetaan curah hujan di daerah Jawa
Tengah. Peta yang digunakan adalah peta Kabupaten dan Kota di Jawa Tengah.
Sebelah kanan peta adalah keterangan pewarnaan. Terdapat 3 jenis warna yang
menunjukkan level curah hujan tiap daerah yaitu jika nilai curah hujan 0-70 berwarna
hijau, jika nilai curah hujan antara 71-155 berwana kuning, dan nilai curah hujan antara
156-400 berwarna merah. Misal pada daerah Rembang mempunyai mempunyai nilai 6
masuk pada kategori rendah maka pewarnaan akan hijau. Daerah Temanggung
memiliki nilai 140 masuk pada kategori sedang maka perwarnaan kuning. Daerah
Wonosobo memiliki nilai 203 masuk pada kategori tinggi dan perwarnaan merah.