KLASIFIKASI BAWANG BERBASIS CITRA DIGITAL MENGGUNAKAN METODE NAIVE BAYES CLASSIFIER

KLASIFIKASI BAWANG BERBASIS CITRA DIGITAL MENGGUNAKAN METODE NAIVE BAYES CLASSIFIERPitaloka (125150200111091), Fatimah Nadia Zanzabila (125150201111051) ,Setia Harti (125150201111060), Iis Setyarini(125150201111062), Ika Nurrohmah(125150201111069)Teknik Informatika, Program Teknologi Informasi dan Ilmu Komputer, Universitas BrawijayaJl. Veteran No.8 Malang, Informatika, Gedung A PTIIK UBEmail : [email protected], [email protected], [email protected], [email protected], [email protected]

ABSTRAKKemajuan teknologi komputer saat ini sangatlah pesat. Teknologi komputer dikembangkan agar dapat melakukan proses pengenalan suatu pola, sebagaimana kemampuan yang dimiliki manusia. Sistem pengenalan pola banyak dimanfaatkan saat ini, contohnya seperti pengenalan sidik jari dan telapak tangan. Disini kami mencoba mengklasifikasikan jenis bawang dengan menggunakan metode naive bayes classifier. Bawang merupakan sesuatu yang selalu kita jumpai dalam kehidupan sehari-hari lebih tepatnya dalam dunia dapur atau untuk memasak. Metode teori keputusan naive bayes adalah metode pengklasifikasian paling sederhana dari model pengklasifikasian yang ada dengan menggunakan konsep peluang, dimana diasumsikan bahwa setiap atribut contoh (data sampel) bersifat saling lepas satu sama lain berdasarkan atribut kelas. Mengklasifikasikan jenis bawang dengan menggunakan metode naive bayes classifier ini diharapkan dapat menggantikan cara mendeteksi jenis bawang secara manual. Pengklasifikasian ini akan mengklasifikasikan jenis bawang berdasarkan fitur-fitur yang dimiliki oleh bawang tersebut. Dalam melakukan pengklasifikasian ini, ada lima fitur yang digunakan yaitu warna R (Red), G (Green), B (Blue), Diameter, dan Panjang dari bawang tersebut. Pengklasifikasian jenis bawang yang kami lakukan ini berbasis citra yang mempunyai dataset 100 dengan empat kelas yaitu kelas bawang merah, kelas bawang putih, kelas bawang bombay, dan kelas bawang prei. Selanjutnya data-data tersebut diolah dengan menggunakan metode Naive Bayes Classifier yaitu dengan menghitung Probabilitas Prior, Probabilitas Likelihood dan yang terakhir Probabilitas Posterior. Disini pengklasifikasian jenis bawang di bagi menjadi tiga skenario, skenario 1 yaitu perbandingannya 80 : 20, 80% data training dan 20% data testing, skenario 2 yaitu perbandingannya 70 : 30, 70% data training dan 30% data testing, dan skenario 3 yaitu perbandingannya 50 : 50, 50% data training dan 50% data testing. Data pengujian di bagi menjadi 2 yaitu secara urut dan random. Hasil akurasi skenario 1 secara urut adalah 95.0% dan secara random adalah 95% , hasil akurasi skenario 2 secara urut adalah 93,33% dan secara random adalah 96,67%, dan hasil akurasi skenario 3 secara urut adalah 90.0% dan secara random 92,0%. Hasil akurasi ini bisa berubah-ubah pada setiap percobaan,tetapi tidak begitu banyak perubahan yang terjadi. Kata kunci : metode teori naive bayes classifier, berbasis citra, klasifikasi bawang1. PENDAHULUAN

Saat ini perkembangan teknologi sangatlah pesat, terutama dalam pemanfaatan komputerisasi dalam menyelesaikan masalah agar lebih efektif. Salah satunya pembuatan sistem informasi dalam proses pengenalan suatu pola. Sistem pengenalan pola banyak dimanfaatkan saat ini, seperti pengenalan sidik jari dan telapak tangan yang berupa citra, pengelompokan umbi-umbi an (dalam kasus ini bawang) yang berbasis citra. Bawang merupakan istilah umum bagi sekelompok tumbuhan penting bagi manusia yang termasuk dalam genus Allium. Umbi, daun, atau bunga bawang dimanfaatkan sebagai sayuran atau sebagai rempah-rempah, tergantung bagaimana kita memandangnya. Bawang sendiri memiliki spesies yang beragam seperti bawang merah, bawang putih, bawang bombay, bawang dayak, bawang lanang dll. Namun dalam hal ini kami hanya mengklasifikasikan bawang kedalam empat kelas, yaitu bawang merah, bawang putih, bawang bombay, dan bawang prei.Warna menjadi salah satu ciri yang mudah diketahui untuk membedakan jenis bawang. Dalam penelitian ini menerapkan pengkasifikasian objek. Klasifikasi bertujuan untuk menetapkan kelas yang telah ditetapkan untuk setiap contoh. Salah satu metode pengklasifikasian yang digunakan adalah algoritma Nave Bayes Classifier untuk mengklasifikasikan bawang dalam kelas bawang merah, kelas bawang putih,kelas bawang Bombay atau kelas bawang Prei.Kelebihan menggunakan metode Nave Bayes Classifier diantaranya metode yang relatif mudah untuk diimplemetasikan karena tidak menggunakan optimasi numerik, perhitungan matriks dan lainnya,efisien dalam pelatihan dan penggunaannya,bisa menggunakan data binary atau polinom dan akurasi yang dihasilkan relatif tinggi.Sehingga dengan adanya metode pengklasifikasian ini, kami ingin mengembangkan suatu program yang berguna untuk mendeteksi jenis bawang.

2. MODEL, ANALISIS, DESAIN, DAN IMPLEMENTASI

Pada penelitian ini metode yang digunakan dalam mengklasifikasikan bawang merah, bawang putih,bawang bombay dan bawang prei yaitu dengan mengunakan metode algoritma Nave Bayes.Naive bayes classifier adalah suatu klasifikasi berpeluang sederhana berdasarkan aplikasi teorema Bayes dengan asumsi antar variabel penjelas saling bebas (independen). Dalam hal ini, diasumsikan bahwa kehadiran atau ketiadaan dari suatu kejadian tertentu dari suatu kelompok tidak berhubungan dengan kehadiran atau ketiadaan dari kejadian lainnya. Ada dua proses penting yang dilakukan saat melakukan klasifikasi. Proses yang pertama adalah learning (training) yaitu proses pembelajaran menggunakan training set dan proses yang kedua adalah proses testing yaitu menguji model menggunakan data training.Sebelum menjelaskan Nave Bayes Classifier ini, akan dijelaskan terlebih dahulu Teorema Bayes yang menjadi dasar dari metode tersebut. Pada teorema Bayes, bila terdapat dua kejadian yang terpisah (misalkan A dan B), maka teorema Bayes dirumuskan sebagai berikut:

Menghitung Probabilitas Prior

Menghitung Probabilitas Likelihood

Menghitung Probabilitas Posterior

d = {A1, A2, , An} data (d) dengan fitur (A1 sampai An) C merupakan kelas .

Setelah probabilitas posterior ditemukan selanjutnya yaitu menentukan kelas yang sesuai dengan data uji dengan melihat perhitungan hasil kelas mana yang memiliki nilai terbesar.

1.1 Citra DigitalCitra digital adalah gambar dua dimensi yang dapat ditampilkan pada layar monitor computer sebagai himpunan berhingga (diskrit) nilai digital yang disebut pixel (picture elements). Pixel adalah elemen citra yang memiliki nilai yang menunjukkanintensitaswarna.Banyaknya nilai yang dapat digunakan dalam kuantisasi citra bergantung kepada kedalaman pixel, yaitu banyaknya bit yang digunakan untuk merepresentasikan intensitas warna pixel. Kedalaman pixel sering disebut juga kedalaman warna. Citra digital yang memiliki kedalaman pixel n bit disebut juga citra n-bit.1.2 Gray ScaleGray scaling adalah proses mengubah warna citra kesisi keabu-abuanya atau mengubah derajat keabuan citra.Metode standar untuk melakukan ini adalah dengan merata-ratakan niai Red (R), Green (G), dan Blue (B) dari tiap warna pada pixel.Citra dalam skala abu-abu memiliki variasi warna 0 255, dan berukuran 1x8 bit. Tentu saja berbeda dengan citra biner yang hanya memiliki warna hitam dan putih hanya memiliki komponen warna 0 dan 1 saja.1.3 Max FilterMax filter berfungsi untuk mengurangi noisi pada citra. Pada saat proses capture (pengambilan gambar), ada beberapa gangguan yang mungkin terjadi, seperti kamera tidak fokus atau munculnya bintik-bintik yang bisa jadi disebabkan oleh proses capture yang tidak sempurna. Setiap gangguan pada citra dinamakan dengan noise. Noise pada citra tidak hanya terjadi karena ketidak-sempurnaan dalam proses capture, tetapi bisa juga disebabkan oleh kotoran-kotoran yang terjadi pada citra.

1.4 ThresholdThresholding digunakan untuk mengatur jumlah derajat keabuan yang ada pada citra. Dengan menggunakan thresholding maka derajat keabuan bisa diubah sesuai keinginan. Misalkan diinginkan menggunakan derajat keabuan 16, maka tinggal membagi nilai derajat keabuan dengan 16. Proses thresholding ini pada dasarnya adalah proses pengubahan kuantisasi pada suatu gambar citra digital menjadi 0 dan 255 (two level image), sehingga untuk melakukan thresholding dengan derajat keabuan dapat digunakan rumus:

dimana :w = nilai derajat keabuan sebelum thresholdingx = nilai derajat keabuan setelah thresholding

1.5 KELAS OBJEK1. Bawang Merah

Gambar 1. bawang merahBawang merah (Allium cepa L. Kelompok Aggregatum) adalah sejenis tanaman yang menjadi bumbu berbagai masakan Asia Tenggara dan dunia. Bawang merah merupakan bawang yang berwarna merah keunguan. Bawang merah dipercaya memiliki kandungan zat yang sangat berguna bagi tubuh kita seperti kalsium, zat besi dan vitamin C yang berguna dalam penyembuhan gangguan kesehatan seperti demam, batuk dan kencing manis.2. Bawang Putih

Gambar 2. bawang putihBawang putih adalah nama tanaman dari genus Allium sekaligus nama dari umbi yang dihasilkan. Bawang putih berwarna putih dan memiliki berbagai kandungan zat yang berguna bagi kesehatan. Bawang putih dipercaya memiliki kandungan potassium, kalsium, vitamin A,B,C dan zat antioksidan. Semua kandungan ini meningkatkan kekebalan tubuh sebagai penawar racun, mengurangi serangan kanker, menghambat penuaan tubuh dan meningkatkan insulin darah.3. Bawang Bombay

Gambar 3. Bawang bombayBawang Bombay (Latin: Allium Cepa Linnaeus) adalah jenis bawang yang paling banyak dan luas dibudidayakan, dipakai sebagai bumbu maupun bahan masakan, berbentuk bulat besar dan berdaging tebal. Bawang bombay merupakan jenis bawang yang memiliki perpaduan bawang merah dan bawang putih. Dari bentuknya menyerupai bawang merah namun ukurannya lebih besar. Tetapi dari warna maupun aromanya menyerupai bawang putih. Bawang bombay berguna meningkatkan kolesterol baik, menekan kolesterol darah, mencegah penggumpalan antitrombotik.4. Bawang Prei

Gambar 4. Bawang preiBawang Prei / Daun Bawang merupakan jenis sayuran dari kelompok bawang yang banyak digunakan dalam masakan. Daun bawang sebenarnya istilah umum yang dapat terdiri dari spesiesyang berbeda. Jenis yang paling umum dijumpai adalah bawang daun (Allium fistulosum).

1.6 FITUR OBJEK

Bawang akan diklasifikasikan menjadi 4 kelas yaitu Bawang Merah, Bawang Putih, Bawang Bombay dan Bawang Prei. Fitur yang akan digunakan adalah fitur diameter, fitur panjang dan fitur warna (RGB) bawang.

Biasanya ukuran bawang putih utuh akan lebih besar daripada bawang merah karena 1 bawang putih bisa terdiri dari beberapa siung bawang sehingga dalam penelitian ini citra bawang putih kita buat 2 macam yaitu bawang putih utuh dan bawang putih siungan. Untuk bawang bombay ukurannya bisa sama atau lebih besar dan lebih daripada yang lain sehingga fitur ukuran dan tidak bisa menjadi pembeda antara bawang merah,bawang putih,bawang bombay. Untuk fitur ukuran hanya bawang prei yang paling mudah dibedakan karena bawang prei memiliki ukuran yang lebih panjang dari yang lainnya.

Warna bawang merah adalah lebih kemerah merahan dibanding bawang Bombay, bawang Bombay berwarna coklat kemerah-merahan. Sedangkan warna bawang putih adalah dominan putih dan bawang bombay memiliki warna putih di akarnya dan hijau dibagian batangny sehingga fitur warna dapat digunakan.

3. SCENARIO UJI COBA

Langkah langkah pemrosesan:1. Pengambilan gambarMengambil gambar bawang , disarankan gambar bawang dengan ukuran minimal 100*100 pixel agar warnanya bisa terlihat dengan jelas.

2. Pengelompokan gambar bawangBawang dikelompokkan sesuai jenisnya yaitu bawang putih, bawang merah, bawang bombay atau bawang prei.

3. Pembagian ratio datasetDalam percobaan ini terdapat 100 data gambar bawang yang selanjutnya akan dijadikan data Training dan data Testing.perbandingan ratio ada 3 macam yaitu: Ratio 80:2080% sebagai data training dan 20% sebagai data testing. Sehingga dari dataset 100 kita bagi menjadi 80 data training dan 20 data testing. Ratio70:30 70% sebagai data training dan 30% sebagai data testing. Sehingga dari dataset 100 kita bagi menjadi 70 data training dan 30 data testing. Ratio 50:5050% sebagai data training dan 50% sebagai data testing. Sehingga dari dataset 100 kita bagi menjadi 50 data training dan 50 data testing.

4. Pencatatan fitur-fitur bawang Ada beberapa fitur yang kita gunakan untuk membedakan jenis bawang yaitu diameter,panjang dan warna RGB.Dataset yang sudah kita siapkan selanjutnya kita cari fitur-fiturnya yaitu dengan mengukur panjang, diameter dan RGB gambar.

Tabel 1. Perhitungan fitur pada 80 dataset training .

5. Menghitung Probabilitas PriorAda empat kelas yang kita gunakan yaitu bawang merah, putih, bombay dan prei, dan setiap kelas dihitung probabilitas Priornya.Contoh pada salah satu data pada skenario 1:Prob. Prior P(merah) = 20/80P(putih) = 20/80P(bombay) = 20/80P(prei) = 20/80

6. Menghitung Probabilitas LikelihoodAda empat kelas yang kita gunakan yaitu bawang merah, putih, bombay dan prei, dan setiap kelas dihitung probabilitas Likelihoodnya.Contoh pada salah satu data pada skenario 1:Prob. LikelihoodP(x|merah) = 0.008479337662095916 0.014770795541149954 0.012735385404615098 0.006987077891621734 0.009422447371415905P(x|putih) =5.323151629014583E-7 1.803419918345637E-10 5.951268655739503E-7 0.005502996810130748 0.007728094771325075P(x|bombay) =3.9488676521940983E-7 1.2762404750751938E-6 0.005058662218953606 0.007461698578396929 0.007315418543278945P(x|prei) =0.008613791379511534 2.6189325280326818E-6 0.0016994283514097284 0.002474130736571475 0.004205187698990955

7. Menghitung Probabilitas PosteriorAda empat kelas yang kita gunakan yaitu bawang merah, putih, bombay dan prei, dan setiap kelas dihitung probabilitas Posteriornya.Contoh pada salah satu data pada skenario 1:Prob. PosteriorP(merah|x) = 2.7225225774464423E-11P(putih|x) = 5.999180545323852E-28P(bombay|x) = 3.436074967410917E-20P(prei|x) = 9.848600590900304E-17

8. Menentukan keputusanHasil klasifikasi data yang di testing contoh : data yang diuji masuk kelas bawang merah.

9. Menghitung hasil akurasiHasil akurasi tiap skenario didapatkan dari perbandingan antara persepsi manusia ( human perception) dengan hasil klasifikasi sistem.

4. HASIL UJI COBA

Pada uji coba ini kita melakukan kombinasi rasio perbandingan data training dan testing. Skenario 1 yaitu 80:20 , Skenario 2 yaitu 70:30 dan Skenario 3 yaitu 50:50 dengan metode data secara urut dan random. Hal ini kami lakukan untuk menguji apakah metode yang digunakan tersebut tetap bisa handal pada berbagai situasi data keluhan. Berikut beberapa hasil proses pelatihan yang didapatkan.

Gambar 5. Hasil Testing Skenario 1 [80:20] secara urut



Hasil diatas yaitu pengklasifikasian data secara urut dimana data yang di Training dan Testing kita ambil secara urut berdasarkan penamaaan/ penomoran gambar sehingga dari beberapa percobaan program yang dijalankan menghasilkan akurasi data yang relatif sama.

Gambar 8. Hasil Testing Skenario 1 [80:20] secara random



Hasil diatas yaitu pengklasifikasian data secara random dimana data yang di Training dan Testing kita ambil secara sehingga dari beberapa percobaan program yang dijalankan menghasilkan akurasi data yang berbeda-beda.

Gambar 11. Hasil seluruh Testing secara urut dan random pada percobaan pertama

Gambar 12. Hasil seluruh Testing secara urut dan random pada percobaan kedua

Gambar 13. Kurva hasil percobaan pertama

Gambar 14. Kurva hasil percobaan keduaSalah satu faktor yang mempengaruhi besar kecilnya nilai akurasi adalah semakin banyaknya data training yang digunakan dalam setiap proses pengujian dan juga metode yang digunakan yaitu urut atau random. Dari pengujian tersebut didapatkan rasio terbaiknya adalah [80:20]. Kemudian untuk rata-rata keseluruhan nilai akurasinya adalah 95,6 %. Nilai rata-rata ini dapat dikatakan masih sangat optimal dan layak untuk digunakan sebagai rekomendasi bahwa sistem yang dibuat tersebut memiliki tingkat persepsi yang hampir mendekati dengan analisis persepsi manusia.

5. KESIMPULAN DAN SARAN

1.1 Kesimpulan

Pada beberapa kali percobaan, ternyata hasil akurasi data yang dihasilkan bisa berubah-ubah. Ini dikarenakan jumlah data Training dan Testing yang berbeda-beda yaitu dengan ratio 80:20, 70:30 dan 50:50. Selain itu, faktor metode pemasukan data juga mempengaruhi hasil dari akurasi data. Metode pemasukan data secara urut relatif menghasilkan akurasi data yang sama sedangkan metode secara random/ acak lebih menghasilkan akurasi yang berbeda-beda tiap percobaan. Akan tetapi, dari hasil rata-rata akurasi yang dihasilkan dari program ini dapat dikatakan masih sangat optimal dan layak untuk digunakan sebagai rekomendasi bahwa system/program yang kita buat tersebut memiliki tingkat persepsi yang hampir mendekati dengan analisis persepsi manusia.

1.2 Saran

Karena dalam penelitian ini, kami hanya menggunakan 100 dataset maka diharapkan untuk penelitian selanjutnya dapat menambahkan dataset bawang sebagai data training dan testing dalam jumlah yang cukup / lebih besar untuk pengujian yang lebih optimal. Selain itu, juga diharapkan menggunakan kombinasi metode pengkalasifikasian yang lain misalnya naive bayes clasifier dengan PCA atau Naive Bayes clasifier dengan PDA.

6. DAFTAR PUSTAKA

http://en.wikipedia.org/wiki/Naive_Bayes_classifier diakses pada 30 Mei 2014

http://users3.jabry.com/luxky/Bayes.aspdiakses pada 30 Mei 2014

www.informatika.unsyiah.ac.id/tfa/dm/dm-bayesian-classifier.pdfdiakses pada 31 Mei 2014

http://repository.usu.ac.id/bitstream/123456789/20106/4/Chapter%20I.pdf diakses pada tanggal 31 Mei 2014

http://repository.usu.ac.id/bitstream/123456789/16877/4/Chapter%20II.pdf diakses pada tanggal 31 Mei 2014

http://www.pps.unud.ac.id/thesis/pdf_thesis/unud-211-1184866289-tesis.pdf diakses pada tanggal 31 Mei 2014

http://id.wikipedia.org/wiki/Bawang_merahdiakses pada 30 Mei 2014

http://id.wikipedia.org/wiki/Bawang_putihdiakses pada 30 Mei 2014

http://id.wikipedia.org/wiki/Daun_bawangdiakses pada 30 Mei 2014

http://id.wikipedia.org/wiki/Bawang_bombai diakses pada 30 Mei 2014

KLASIFIKASI BAWANG BERBASIS CITRA DIGITAL MENGGUNAKAN METODE NAIVE BAYES CLASSIFIER

Documents