KLASIFIKASI BAWANG BERBASIS CITRA DIGITAL MENGGUNAKAN METODE
NAIVE BAYES CLASSIFIERPitaloka (125150200111091), Fatimah Nadia
Zanzabila (125150201111051) ,Setia Harti (125150201111060), Iis
Setyarini(125150201111062), Ika Nurrohmah(125150201111069)Teknik
Informatika, Program Teknologi Informasi dan Ilmu Komputer,
Universitas BrawijayaJl. Veteran No.8 Malang, Informatika, Gedung A
PTIIK UBEmail : [email protected], [email protected],
[email protected], [email protected],
[email protected]
ABSTRAKKemajuan teknologi komputer saat ini sangatlah pesat.
Teknologi komputer dikembangkan agar dapat melakukan proses
pengenalan suatu pola, sebagaimana kemampuan yang dimiliki manusia.
Sistem pengenalan pola banyak dimanfaatkan saat ini, contohnya
seperti pengenalan sidik jari dan telapak tangan. Disini kami
mencoba mengklasifikasikan jenis bawang dengan menggunakan metode
naive bayes classifier. Bawang merupakan sesuatu yang selalu kita
jumpai dalam kehidupan sehari-hari lebih tepatnya dalam dunia dapur
atau untuk memasak. Metode teori keputusan naive bayes adalah
metode pengklasifikasian paling sederhana dari model
pengklasifikasian yang ada dengan menggunakan konsep peluang,
dimana diasumsikan bahwa setiap atribut contoh (data sampel)
bersifat saling lepas satu sama lain berdasarkan atribut kelas.
Mengklasifikasikan jenis bawang dengan menggunakan metode naive
bayes classifier ini diharapkan dapat menggantikan cara mendeteksi
jenis bawang secara manual. Pengklasifikasian ini akan
mengklasifikasikan jenis bawang berdasarkan fitur-fitur yang
dimiliki oleh bawang tersebut. Dalam melakukan pengklasifikasian
ini, ada lima fitur yang digunakan yaitu warna R (Red), G (Green),
B (Blue), Diameter, dan Panjang dari bawang tersebut.
Pengklasifikasian jenis bawang yang kami lakukan ini berbasis citra
yang mempunyai dataset 100 dengan empat kelas yaitu kelas bawang
merah, kelas bawang putih, kelas bawang bombay, dan kelas bawang
prei. Selanjutnya data-data tersebut diolah dengan menggunakan
metode Naive Bayes Classifier yaitu dengan menghitung Probabilitas
Prior, Probabilitas Likelihood dan yang terakhir Probabilitas
Posterior. Disini pengklasifikasian jenis bawang di bagi menjadi
tiga skenario, skenario 1 yaitu perbandingannya 80 : 20, 80% data
training dan 20% data testing, skenario 2 yaitu perbandingannya 70
: 30, 70% data training dan 30% data testing, dan skenario 3 yaitu
perbandingannya 50 : 50, 50% data training dan 50% data testing.
Data pengujian di bagi menjadi 2 yaitu secara urut dan random.
Hasil akurasi skenario 1 secara urut adalah 95.0% dan secara random
adalah 95% , hasil akurasi skenario 2 secara urut adalah 93,33% dan
secara random adalah 96,67%, dan hasil akurasi skenario 3 secara
urut adalah 90.0% dan secara random 92,0%. Hasil akurasi ini bisa
berubah-ubah pada setiap percobaan,tetapi tidak begitu banyak
perubahan yang terjadi. Kata kunci : metode teori naive bayes
classifier, berbasis citra, klasifikasi bawang1. PENDAHULUAN
Saat ini perkembangan teknologi sangatlah pesat, terutama dalam
pemanfaatan komputerisasi dalam menyelesaikan masalah agar lebih
efektif. Salah satunya pembuatan sistem informasi dalam proses
pengenalan suatu pola. Sistem pengenalan pola banyak dimanfaatkan
saat ini, seperti pengenalan sidik jari dan telapak tangan yang
berupa citra, pengelompokan umbi-umbi an (dalam kasus ini bawang)
yang berbasis citra. Bawang merupakan istilah umum bagi sekelompok
tumbuhan penting bagi manusia yang termasuk dalam genus Allium.
Umbi, daun, atau bunga bawang dimanfaatkan sebagai sayuran atau
sebagai rempah-rempah, tergantung bagaimana kita memandangnya.
Bawang sendiri memiliki spesies yang beragam seperti bawang merah,
bawang putih, bawang bombay, bawang dayak, bawang lanang dll. Namun
dalam hal ini kami hanya mengklasifikasikan bawang kedalam empat
kelas, yaitu bawang merah, bawang putih, bawang bombay, dan bawang
prei.Warna menjadi salah satu ciri yang mudah diketahui untuk
membedakan jenis bawang. Dalam penelitian ini menerapkan
pengkasifikasian objek. Klasifikasi bertujuan untuk menetapkan
kelas yang telah ditetapkan untuk setiap contoh. Salah satu metode
pengklasifikasian yang digunakan adalah algoritma Nave Bayes
Classifier untuk mengklasifikasikan bawang dalam kelas bawang
merah, kelas bawang putih,kelas bawang Bombay atau kelas bawang
Prei.Kelebihan menggunakan metode Nave Bayes Classifier diantaranya
metode yang relatif mudah untuk diimplemetasikan karena tidak
menggunakan optimasi numerik, perhitungan matriks dan
lainnya,efisien dalam pelatihan dan penggunaannya,bisa menggunakan
data binary atau polinom dan akurasi yang dihasilkan relatif
tinggi.Sehingga dengan adanya metode pengklasifikasian ini, kami
ingin mengembangkan suatu program yang berguna untuk mendeteksi
jenis bawang.
2. MODEL, ANALISIS, DESAIN, DAN IMPLEMENTASI
Pada penelitian ini metode yang digunakan dalam
mengklasifikasikan bawang merah, bawang putih,bawang bombay dan
bawang prei yaitu dengan mengunakan metode algoritma Nave
Bayes.Naive bayes classifier adalah suatu klasifikasi berpeluang
sederhana berdasarkan aplikasi teorema Bayes dengan asumsi antar
variabel penjelas saling bebas (independen). Dalam hal ini,
diasumsikan bahwa kehadiran atau ketiadaan dari suatu kejadian
tertentu dari suatu kelompok tidak berhubungan dengan kehadiran
atau ketiadaan dari kejadian lainnya. Ada dua proses penting yang
dilakukan saat melakukan klasifikasi. Proses yang pertama adalah
learning (training) yaitu proses pembelajaran menggunakan training
set dan proses yang kedua adalah proses testing yaitu menguji model
menggunakan data training.Sebelum menjelaskan Nave Bayes Classifier
ini, akan dijelaskan terlebih dahulu Teorema Bayes yang menjadi
dasar dari metode tersebut. Pada teorema Bayes, bila terdapat dua
kejadian yang terpisah (misalkan A dan B), maka teorema Bayes
dirumuskan sebagai berikut:
Menghitung Probabilitas Prior
Menghitung Probabilitas Likelihood
Menghitung Probabilitas Posterior
d = {A1, A2, , An} data (d) dengan fitur (A1 sampai An) C
merupakan kelas .
Setelah probabilitas posterior ditemukan selanjutnya yaitu
menentukan kelas yang sesuai dengan data uji dengan melihat
perhitungan hasil kelas mana yang memiliki nilai terbesar.
1.1 Citra DigitalCitra digital adalah gambar dua dimensi yang
dapat ditampilkan pada layar monitor computer sebagai himpunan
berhingga (diskrit) nilai digital yang disebut pixel (picture
elements). Pixel adalah elemen citra yang memiliki nilai yang
menunjukkanintensitaswarna.Banyaknya nilai yang dapat digunakan
dalam kuantisasi citra bergantung kepada kedalaman pixel, yaitu
banyaknya bit yang digunakan untuk merepresentasikan intensitas
warna pixel. Kedalaman pixel sering disebut juga kedalaman warna.
Citra digital yang memiliki kedalaman pixel n bit disebut juga
citra n-bit.1.2 Gray ScaleGray scaling adalah proses mengubah warna
citra kesisi keabu-abuanya atau mengubah derajat keabuan
citra.Metode standar untuk melakukan ini adalah dengan
merata-ratakan niai Red (R), Green (G), dan Blue (B) dari tiap
warna pada pixel.Citra dalam skala abu-abu memiliki variasi warna 0
255, dan berukuran 1x8 bit. Tentu saja berbeda dengan citra biner
yang hanya memiliki warna hitam dan putih hanya memiliki komponen
warna 0 dan 1 saja.1.3 Max FilterMax filter berfungsi untuk
mengurangi noisi pada citra. Pada saat proses capture (pengambilan
gambar), ada beberapa gangguan yang mungkin terjadi, seperti kamera
tidak fokus atau munculnya bintik-bintik yang bisa jadi disebabkan
oleh proses capture yang tidak sempurna. Setiap gangguan pada citra
dinamakan dengan noise. Noise pada citra tidak hanya terjadi karena
ketidak-sempurnaan dalam proses capture, tetapi bisa juga
disebabkan oleh kotoran-kotoran yang terjadi pada citra.
1.4 ThresholdThresholding digunakan untuk mengatur jumlah
derajat keabuan yang ada pada citra. Dengan menggunakan
thresholding maka derajat keabuan bisa diubah sesuai keinginan.
Misalkan diinginkan menggunakan derajat keabuan 16, maka tinggal
membagi nilai derajat keabuan dengan 16. Proses thresholding ini
pada dasarnya adalah proses pengubahan kuantisasi pada suatu gambar
citra digital menjadi 0 dan 255 (two level image), sehingga untuk
melakukan thresholding dengan derajat keabuan dapat digunakan
rumus:
dimana :w = nilai derajat keabuan sebelum thresholdingx = nilai
derajat keabuan setelah thresholding
1.5 KELAS OBJEK1. Bawang Merah
Gambar 1. bawang merahBawang merah (Allium cepa L. Kelompok
Aggregatum) adalah sejenis tanaman yang menjadi bumbu berbagai
masakan Asia Tenggara dan dunia. Bawang merah merupakan bawang yang
berwarna merah keunguan. Bawang merah dipercaya memiliki kandungan
zat yang sangat berguna bagi tubuh kita seperti kalsium, zat besi
dan vitamin C yang berguna dalam penyembuhan gangguan kesehatan
seperti demam, batuk dan kencing manis.2. Bawang Putih
Gambar 2. bawang putihBawang putih adalah nama tanaman dari
genus Allium sekaligus nama dari umbi yang dihasilkan. Bawang putih
berwarna putih dan memiliki berbagai kandungan zat yang berguna
bagi kesehatan. Bawang putih dipercaya memiliki kandungan
potassium, kalsium, vitamin A,B,C dan zat antioksidan. Semua
kandungan ini meningkatkan kekebalan tubuh sebagai penawar racun,
mengurangi serangan kanker, menghambat penuaan tubuh dan
meningkatkan insulin darah.3. Bawang Bombay
Gambar 3. Bawang bombayBawang Bombay (Latin: Allium Cepa
Linnaeus) adalah jenis bawang yang paling banyak dan luas
dibudidayakan, dipakai sebagai bumbu maupun bahan masakan,
berbentuk bulat besar dan berdaging tebal. Bawang bombay merupakan
jenis bawang yang memiliki perpaduan bawang merah dan bawang putih.
Dari bentuknya menyerupai bawang merah namun ukurannya lebih besar.
Tetapi dari warna maupun aromanya menyerupai bawang putih. Bawang
bombay berguna meningkatkan kolesterol baik, menekan kolesterol
darah, mencegah penggumpalan antitrombotik.4. Bawang Prei
Gambar 4. Bawang preiBawang Prei / Daun Bawang merupakan jenis
sayuran dari kelompok bawang yang banyak digunakan dalam masakan.
Daun bawang sebenarnya istilah umum yang dapat terdiri dari
spesiesyang berbeda. Jenis yang paling umum dijumpai adalah bawang
daun (Allium fistulosum).
1.6 FITUR OBJEK
Bawang akan diklasifikasikan menjadi 4 kelas yaitu Bawang Merah,
Bawang Putih, Bawang Bombay dan Bawang Prei. Fitur yang akan
digunakan adalah fitur diameter, fitur panjang dan fitur warna
(RGB) bawang.
Biasanya ukuran bawang putih utuh akan lebih besar daripada
bawang merah karena 1 bawang putih bisa terdiri dari beberapa siung
bawang sehingga dalam penelitian ini citra bawang putih kita buat 2
macam yaitu bawang putih utuh dan bawang putih siungan. Untuk
bawang bombay ukurannya bisa sama atau lebih besar dan lebih
daripada yang lain sehingga fitur ukuran dan tidak bisa menjadi
pembeda antara bawang merah,bawang putih,bawang bombay. Untuk fitur
ukuran hanya bawang prei yang paling mudah dibedakan karena bawang
prei memiliki ukuran yang lebih panjang dari yang lainnya.
Warna bawang merah adalah lebih kemerah merahan dibanding bawang
Bombay, bawang Bombay berwarna coklat kemerah-merahan. Sedangkan
warna bawang putih adalah dominan putih dan bawang bombay memiliki
warna putih di akarnya dan hijau dibagian batangny sehingga fitur
warna dapat digunakan.
3. SCENARIO UJI COBA
Langkah langkah pemrosesan:1. Pengambilan gambarMengambil gambar
bawang , disarankan gambar bawang dengan ukuran minimal 100*100
pixel agar warnanya bisa terlihat dengan jelas.
2. Pengelompokan gambar bawangBawang dikelompokkan sesuai
jenisnya yaitu bawang putih, bawang merah, bawang bombay atau
bawang prei.
3. Pembagian ratio datasetDalam percobaan ini terdapat 100 data
gambar bawang yang selanjutnya akan dijadikan data Training dan
data Testing.perbandingan ratio ada 3 macam yaitu: Ratio 80:2080%
sebagai data training dan 20% sebagai data testing. Sehingga dari
dataset 100 kita bagi menjadi 80 data training dan 20 data testing.
Ratio70:30 70% sebagai data training dan 30% sebagai data testing.
Sehingga dari dataset 100 kita bagi menjadi 70 data training dan 30
data testing. Ratio 50:5050% sebagai data training dan 50% sebagai
data testing. Sehingga dari dataset 100 kita bagi menjadi 50 data
training dan 50 data testing.
4. Pencatatan fitur-fitur bawang Ada beberapa fitur yang kita
gunakan untuk membedakan jenis bawang yaitu diameter,panjang dan
warna RGB.Dataset yang sudah kita siapkan selanjutnya kita cari
fitur-fiturnya yaitu dengan mengukur panjang, diameter dan RGB
gambar.
Tabel 1. Perhitungan fitur pada 80 dataset training .
5. Menghitung Probabilitas PriorAda empat kelas yang kita
gunakan yaitu bawang merah, putih, bombay dan prei, dan setiap
kelas dihitung probabilitas Priornya.Contoh pada salah satu data
pada skenario 1:Prob. Prior P(merah) = 20/80P(putih) =
20/80P(bombay) = 20/80P(prei) = 20/80
6. Menghitung Probabilitas LikelihoodAda empat kelas yang kita
gunakan yaitu bawang merah, putih, bombay dan prei, dan setiap
kelas dihitung probabilitas Likelihoodnya.Contoh pada salah satu
data pada skenario 1:Prob. LikelihoodP(x|merah) =
0.008479337662095916 0.014770795541149954 0.012735385404615098
0.006987077891621734 0.009422447371415905P(x|putih)
=5.323151629014583E-7 1.803419918345637E-10 5.951268655739503E-7
0.005502996810130748 0.007728094771325075P(x|bombay)
=3.9488676521940983E-7 1.2762404750751938E-6 0.005058662218953606
0.007461698578396929 0.007315418543278945P(x|prei)
=0.008613791379511534 2.6189325280326818E-6 0.0016994283514097284
0.002474130736571475 0.004205187698990955
7. Menghitung Probabilitas PosteriorAda empat kelas yang kita
gunakan yaitu bawang merah, putih, bombay dan prei, dan setiap
kelas dihitung probabilitas Posteriornya.Contoh pada salah satu
data pada skenario 1:Prob. PosteriorP(merah|x) =
2.7225225774464423E-11P(putih|x) = 5.999180545323852E-28P(bombay|x)
= 3.436074967410917E-20P(prei|x) = 9.848600590900304E-17
8. Menentukan keputusanHasil klasifikasi data yang di testing
contoh : data yang diuji masuk kelas bawang merah.
9. Menghitung hasil akurasiHasil akurasi tiap skenario
didapatkan dari perbandingan antara persepsi manusia ( human
perception) dengan hasil klasifikasi sistem.
4. HASIL UJI COBA
Pada uji coba ini kita melakukan kombinasi rasio perbandingan
data training dan testing. Skenario 1 yaitu 80:20 , Skenario 2
yaitu 70:30 dan Skenario 3 yaitu 50:50 dengan metode data secara
urut dan random. Hal ini kami lakukan untuk menguji apakah metode
yang digunakan tersebut tetap bisa handal pada berbagai situasi
data keluhan. Berikut beberapa hasil proses pelatihan yang
didapatkan.
Gambar 5. Hasil Testing Skenario 1 [80:20] secara urut
Gambar 6. Hasil Testing Skenario 2 [70:30] secara urut
Gambar 7. Hasil Testing Skenario 3 [50:50] secara urut
Hasil diatas yaitu pengklasifikasian data secara urut dimana
data yang di Training dan Testing kita ambil secara urut
berdasarkan penamaaan/ penomoran gambar sehingga dari beberapa
percobaan program yang dijalankan menghasilkan akurasi data yang
relatif sama.
Gambar 8. Hasil Testing Skenario 1 [80:20] secara random
Gambar 9. Hasil Testing Skenario 2 [70:30] secara random
Gambar 10. Hasil Testing Skenario 3 [50:50] secara random
Hasil diatas yaitu pengklasifikasian data secara random dimana
data yang di Training dan Testing kita ambil secara sehingga dari
beberapa percobaan program yang dijalankan menghasilkan akurasi
data yang berbeda-beda.
Gambar 11. Hasil seluruh Testing secara urut dan random pada
percobaan pertama
Gambar 12. Hasil seluruh Testing secara urut dan random pada
percobaan kedua
Gambar 13. Kurva hasil percobaan pertama
Gambar 14. Kurva hasil percobaan keduaSalah satu faktor yang
mempengaruhi besar kecilnya nilai akurasi adalah semakin banyaknya
data training yang digunakan dalam setiap proses pengujian dan juga
metode yang digunakan yaitu urut atau random. Dari pengujian
tersebut didapatkan rasio terbaiknya adalah [80:20]. Kemudian untuk
rata-rata keseluruhan nilai akurasinya adalah 95,6 %. Nilai
rata-rata ini dapat dikatakan masih sangat optimal dan layak untuk
digunakan sebagai rekomendasi bahwa sistem yang dibuat tersebut
memiliki tingkat persepsi yang hampir mendekati dengan analisis
persepsi manusia.
5. KESIMPULAN DAN SARAN
1.1 Kesimpulan
Pada beberapa kali percobaan, ternyata hasil akurasi data yang
dihasilkan bisa berubah-ubah. Ini dikarenakan jumlah data Training
dan Testing yang berbeda-beda yaitu dengan ratio 80:20, 70:30 dan
50:50. Selain itu, faktor metode pemasukan data juga mempengaruhi
hasil dari akurasi data. Metode pemasukan data secara urut relatif
menghasilkan akurasi data yang sama sedangkan metode secara random/
acak lebih menghasilkan akurasi yang berbeda-beda tiap percobaan.
Akan tetapi, dari hasil rata-rata akurasi yang dihasilkan dari
program ini dapat dikatakan masih sangat optimal dan layak untuk
digunakan sebagai rekomendasi bahwa system/program yang kita buat
tersebut memiliki tingkat persepsi yang hampir mendekati dengan
analisis persepsi manusia.
1.2 Saran
Karena dalam penelitian ini, kami hanya menggunakan 100 dataset
maka diharapkan untuk penelitian selanjutnya dapat menambahkan
dataset bawang sebagai data training dan testing dalam jumlah yang
cukup / lebih besar untuk pengujian yang lebih optimal. Selain itu,
juga diharapkan menggunakan kombinasi metode pengkalasifikasian
yang lain misalnya naive bayes clasifier dengan PCA atau Naive
Bayes clasifier dengan PDA.
6. DAFTAR PUSTAKA
http://en.wikipedia.org/wiki/Naive_Bayes_classifier diakses pada
30 Mei 2014
http://users3.jabry.com/luxky/Bayes.aspdiakses pada 30 Mei
2014
www.informatika.unsyiah.ac.id/tfa/dm/dm-bayesian-classifier.pdfdiakses
pada 31 Mei 2014
http://repository.usu.ac.id/bitstream/123456789/20106/4/Chapter%20I.pdf
diakses pada tanggal 31 Mei 2014
http://repository.usu.ac.id/bitstream/123456789/16877/4/Chapter%20II.pdf
diakses pada tanggal 31 Mei 2014
http://www.pps.unud.ac.id/thesis/pdf_thesis/unud-211-1184866289-tesis.pdf
diakses pada tanggal 31 Mei 2014
http://id.wikipedia.org/wiki/Bawang_merahdiakses pada 30 Mei
2014
http://id.wikipedia.org/wiki/Bawang_putihdiakses pada 30 Mei
2014
http://id.wikipedia.org/wiki/Daun_bawangdiakses pada 30 Mei
2014
http://id.wikipedia.org/wiki/Bawang_bombai diakses pada 30 Mei
2014