Page 1
PERINGKASAN TEKS SECARA OTOMATIS BERBASIS
MOBILE MENGGUNAKAN METODE TF-ISF PADA
BERITA ONLINE BERBAHASA INDONESIA
TUGAS AKHIR
Sebagai Persyaratan Guna Meraih Sarjana Strata 1
Teknik Informatika Universitas Muhammadiyah Malang
Oleh:
AGUS AKHYARI
07560437
JURUSAN TEKNIK INFORMATIKA
FAKULTAS TEKNIK
UNIVERSITAS MUHAMMADIYAH MALANG
2014
Page 5
LEMBAR PERSEMBAHAN
Tugas Akhir ini penulis menyadarai bahwa penyusunan dan pembuatan karya
sederhana ini tidak lepas dari bantuan berbagai pihak, oleh karena itu dengan segala
kerendahan hati, penulis menyampaikan terima kasih kepada:
1. Allah Subhanahu Wa Ta’ala yang tiada henti memberikan rahmat dan hidayah-
Nya serta menerangi setiap langkah saya.
2. Rasulullah Muhammad SAW, suri tauladanku, panutan terbaikku, dan tokoh
idolaku.
3. Ibu dan Ayah yang saya sayangi, doa tulus kepada ananda seperti air dan tak
pernah berhenti yang terus mengalir, pengorbanan, motivasi, kesabaran,
ketabahan dan tetes air matamu yang terlalu mustahil untuk dinilai,
walaupun jauh, engkaulah sebaik – baik panutan meski tidak selalu sempurna.
4. Bapak Yuda Munarko, S,Kom., MSc. selaku dosen pembimbing I dan Gita
Indah Martahasari, ST. selaku dosen pembimbing II yang senantiasa telah
banyak memberikan pengarahan dan bimbingannya selama dalam penyelesaian
penulisan Tugas Akhir ini.
5. Seluruh dosen pengajar di Jurusan Teknik Informatika yang telah membimbing
saya dalam menuntut ilmu sehingga saya bisa menjadi seseorang yang lebih
baik.
6. Regina Septiningsih selaku pemberi semangat, motivasi, pengingat sekaligus
pendamping setia dalam saya mengerjakan Tugas Akhir ini.
7. Keluarga Kontrakan Villa Sengakaling Gg J No.95. Ian Pratiko, Hendry Tri
Jatmiko yang selalu memberikan motivasi dan dorongan untuk menyelesaikan
skripsi yang saya susun.
8. Keluarga Besar Kost Zam Zam, Budhe selaku pemilik kost, Septian Andhika,
Kiki, Ogis, Bayu, Aces, Anwari, dan semua sesepuh kost yang masih di Zam-
Page 6
Zam dan yang sudah melanjutkan kehidupan di luar, kebahagiaan dan keluh
kesah yang selalu saya bagikan dan saya dapatkan dikeluarga besar kost.
9. Teman-teman seperjuangan di Universitas Muhammadiyah Malang, khususnya
jurusan Teknik Informatika.
Page 7
KATA PENGANTAR
Assalamu'alaikum Wr. Wb.
Dengan memanjatkan puji syukur kehadirat Allah SWT atas limpahan rahmat yang
telah diberikan sehingga Penulis dapat menyelesaikan Tugas Akhir yang berjudul
“Peringkasan Teks Secara Otomatis Bebasis Mobile Menggunakan Metode TS-
ISF Pada Berita Online Berbahasa Indonesia”.
Pada penelitian ini dibuat sebuah sistem peringkasan teks otomatis pada berita
online yang diimplementasikan pada mobile device. Dengan menggunakan sistem ini
user/pembaca dapat membaca berita/artikel secara ringkas dan praktis.
Penulis menyadari sepenuhnya bahwa penulis Tugas Akhir ini masih banyak
kekurangan, oleh karena itu penulis mengharapkan saran dan kritik yang membangun
agar tulisan ini bermanfaat bagi perkembangan ilmu kedepannya.
Akhir kata penulis mengucapkan terima kasih kepada semua pihak yang telah
membantu sehingga tugas akhir ini terselesaikan.
Wassalamu’alaikum Wr. Wb
Malang, 15 Juli 2014
Penulis
Agus akhyari
Page 8
DAFTAR ISI
Halaman Judul
Lembar Persetujuan
Lembar Pengesahan
Lembar Pernyataan
Abstraksi ........................................................................................................... i
Abstract ............................................................................................................. ii
Lembar Persembahan ...................................................................................... iii
Kata Pengantar ................................................................................................ v
Daftar Isi ........................................................................................................... vi
Daftar Gambar ................................................................................................. x
Daftar Tabel ...................................................................................................... xii
Daftar Lampiran .............................................................................................. xiii
BAB I PENDAHULUAN ................................................................................ 1
1.1 Latar Belakang ................................................................................... 1
1.2 Rumusan Masalah ............................................................................. 3
1.3 Tujuan Penelitian ................................................................................ 3
1.4 Batasan Masalah ................................................................................ 3
1.5 Metodologi ........................................................................................ 4
1.6 Sistematika Pembahasan .................................................................... 6
BAB II TINJAUAN PUSTAKA ...................................................................... 8
2.1 Konsep Automated Text Summarization ............................................ 8
2.1.1 Pendekatan Ekstraksi .................................................................. 9
2.1.2 Pendekatan Abstraksi .................................................................. 9
2.1.3 Proses Text Summarization.......................................................... 10
2.1.3.1 Topic Identification ......................................................... 10
2.1.3.2 Interpretation ................................................................... 10
2.1.3.3 Generation ....................................................................... 11
Page 9
2.1.4 Tipe Evaluasi ............................................................................... 11
2.2 Morfologi Bahasa Indonesia .............................................................. 13
2.3 Pengertian Kata................................................................................... 15
2.4 Pengertian Kalimat ............................................................................. 16
2.5 Paragraf dalam Bahasa Indonesia ....................................................... 17
2.2.1 Macam-macam Paragraf ............................................................. 18
2.5.1.1 Paragraf Deduktif ............................................................ 18
2.5.1.2 Paragraf Induktif .............................................................. 19
2.5.1.3 Paragraf Campuran .......................................................... 19
2.6 Berita .................................................................................................. 20
2.7 Text Preprocessing ............................................................................. 21
2.7.1 HTML Parsing ........................................................................... 22
2.7.2 Pemcehan Kalimat (Split Into Sentence) ................................... 22
2.7.3 Case Folding ............................................................................. 23
2.7.4 Tokening Kata ............................................................................ 23
2.7.5 Filteringk Kata ........................................................................... 24
2.7.6 Stemming ................................................................................... 24
2.8 Confix Striping Stemmer ..................................................................... 25
2.9 Enhanced Confix Striping Stemmer .................................................... 29
2.10 Pembobotan Kata dan Kalimat .......................................................... 31
2.10.1 TF-IDF (Term Frequecy-Invesrse Dokument Frequency) ...... 31
2.10.2 TF-ISF (Term Frequency-Inverse Sentence Frequency) ......... 32
2.10.3 Pembobotan TF Kalimat .......................................................... 32
2.11 Android .............................................................................................. 35
2.11.1 The Dalvik Virtual Machine (DVM) ....................................... 36
2.11.2 Android SDK (Software Development Kit) .............................. 37
2.11.3 Arsitektur Android .................................................................. 38
BAB III ANALISA DAN PERANCANGAN SISTEM ................................. 41
3.1 Analisa Sistem ................................................................................... 41
Page 10
3.1.1 Deskripsi Umum Sistem ............................................................ 41
3.1.2 Analisa Use Cace ...................................................................... 43
3.1.3 Lingkungan Operasi ................................................................. 45
3.1.4 Analisa Perangkat Lunak .......................................................... 46
3.2 Perancangan Sistem ........................................................................... 46
3.2.2 Activity Diagram ..................................................................... 46
3.2.2.1 Activity Diagram HTML Parsing ................................. 47
3.2.2.2 Activity Diagram Text Preprocessing ........................... 47
3.2.2.3 Activity Diagram Pemecahan Kalimat ......................... 48
3.2.2.4 Activity Diagram Case Folding .................................... 49
3.2.2.5 Activity Diagram Filtering .......................................... 50
3.2.2.6 Activity Diagram Tokening ........................................... 51
3.2.2.7 Activity Diagram Stemming .......................................... 52
3.2.2.8 Activity Diagram Pembobotan Kalimat ........................ 53
3.2.2.9 Activity Diagram Sorting Lima Kalimat Tertinggi ....... 54
3.2.2.10 Activity Diagram Pengurutan Kalimat ....................... 55
3.2.3 Sequence Diagram .................................................................... 55
3.2.3.1 Sequence Diagram Level Analisis Input/Load Web Page
Berita Online ................................................................. 56
3.2.3.2 Sequence Diagram Level Analisis Summarization
(Meringkas Berita) ........................................................ 57
3.2.4 Class Diagram .......................................................................... 58
3.3 Perancangan Antar Muka .................................................................. 61
3.4 Perancangan Uji Coba ....................................................................... 61
3.4.1 Bahan Pengujian ....................................................................... 62
3.4.2 Tujuan Pengujian ...................................................................... 62
3.4.3 Skenario dan Kriteria Pengujian ............................................... 62
3.4.3.1 Pengujian Fungsional Sistem ........................................ 62
3.4.3.2 Evaluasi Hasil Ringkasan ............................................. 62
Page 11
BAB IV IMPLEMENTASI DAN PENGUJIAN ........................................... 64
4.1 Implementasi Software pada Device................................................... 64
4.1.1 Implementasi Desain di Android atau Layout ........................... 64
4.1.2 Implementasi Kode di Android ................................................ 66
4.1.2.1 HTML Parsing ............................................................... 67
4.1.2.2 Pemecahan Kalimat ....................................................... 68
4.1.2.3 Class Case Folding ........................................................ 69
4.1.2.4 Tokening Kata ................................................................ 69
4.1.2.5 Class Filtering ............................................................... 70
4.1.2.6 Class Stemming.............................................................. 71
4.1.2.7 Class EnhancedCS ......................................................... 72
4.1.2.8 Pembobotan Kalimat ..................................................... 74
4.1.2.9 Sorting Bobot ................................................................. 78
4.1.2.10 Sorting Urutan Kalimat ............................................... 79
4.2 Pengujian ............................................................................................ 80
4.3.1 Pengujian Aplikasi .................................................................... 80
4.2.1.1 Fitur Share Into pada Android ....................................... 81
4.2.1.2 Halam Awal Interface Untuk Informasi Teks
(HTML Parsing) ............................................................ 82
4.2.1.3 Proses Summarization.................................................... 82
4.2.1.4 Halaman hasil Ringkasan .............................................. 83
4.3.2 Pengujian Fungsional ................................................................ 84
4.3.3 Evaluasi Hasil Ringkasan .......................................................... 87
BAB V KESIMPULAN DAN SARAN .......................................................... 89
5.1 Kesimpulan ........................................................................................ 89
5.2 Saran .................................................................................................. 89
DAFTAR PUSTAKA ....................................................................................... 90
Page 12
DAFTAR GAMBAR
Gambar 2.1 : Matrix Perhitungan Recall dan Precision .................................... 12
Gambar 2.2 : Diagram Alur Preprocessing ....................................................... 22
Gambar 3.1 : Gambaran Umum Sistem .............................................................. 43
Gambar 3.2 : Use Case Diagram ATS................................................................ 43
Gambar 3.3 : Activity Diagram HTML Parsing ................................................ 47
Gambar 3.4 : Activity Diagram Text Preprocessing .......................................... 48
Gambar 3.5 : Activity Diagram Pemecahan Kalimat .......................................... 48
Gambar 3.6 : Activity Diagram Case Folding .................................................... 49
Gambar 3.7: Activity Diagram Filtering ............................................................. 50
Gambar 3.8 : Activity Diagram Tokenizing......................................................... 51
Gambar 3.9 : Activity Diagram Stemming .......................................................... 52
Gambar 3.10 : Activity Diagram Pembobotan Kalimat ...................................... 53
Gambar 3.11 : Activity Diagram Sorting Lima Kalimat ..................................... 54
Gambar 3.12 : Activity Diagram Pengurutan Kalimat ........................................ 55
Gambar 3.13 : Squence Diagram Level Analisis Input/Load Web Page Berita.. 56
Gambar 3.14 : Sequence Diagram Level Analisis Summarization (Meringkas
Berita) .......................................................................................... 57
Gambar 3.15 : Class Diagram ............................................................................ 60
Gambar 3.16 : Desain Interface aplikasi ............................................................. 61
Gambar 4.1 : Outline Layout activity_main.xml ................................................. 64
Gambar 4.2 : Tampilan Interface Aplikasi ......................................................... 66
Gambar 4.3 : Method DownloadWebPageTask (HTML Parsing) ...................... 67
Gambar 4.4 : Class PemecahanKalimat .............................................................. 68
Gambar 4.5 : Method CaseFolding ..................................................................... 69
Gambar 4.6 : Method TokenizingKata ................................................................ 69
Gambar 4.7 : Class Filtering ............................................................................... 70
Gambar 4.8 : Class Stemming ............................................................................. 71
Gambar 4.9 : Class EnchantedCS ....................................................................... 72
Page 13
Gambar 4.10 : Class Kalimat .............................................................................. 74
Gambar 4.11 : Class Utility ................................................................................. 76
Gambar 4.12 : Method Compare (Kalimat, Kalimat) ........................................ 78
Gambar 4.13 : Web Page Percobaan Fungsi ....................................................... 80
Gambar 4.14 : Menu Fitur Share Into Pada Browser ........................................ 81
Gambar 4.15 : Aplikasi ATS di Menu Share Into ............................................... 81
Gambar 4.16 : Halaman Awal Interface ATS...................................................... 82
Gambar 4.17 : Button Summarize ....................................................................... 83
Gambar 4.18 : Halaman Hasil Ringkasan ........................................................... 84
Page 14
DAFTAR TABEL
Tabel 2.1 : Pembentukan konfiks yang tidak diperbolehkan .............................. 14
Tabel 2.2 : Aturan Pembentukan Prefiks Ganda ................................................. 15
Tabel 2.3 : Contoh Pemecahan Kalimat .............................................................. 23
Tabel 2.4 : Contoh Case Folding ........................................................................ 23
Tabel 2.5 : Contoh Tokening Kata ...................................................................... 24
Tabel 2.6 : Contoh Filtering Kalimat .................................................................. 24
Tabel 2.7 : Contoh Stemming .............................................................................. 25
Tabel 2.8 : Kombinasi Imbuhan Terlarang ......................................................... 28
Tabel 2.9 : Aturan Pemenggalan Awalan ........................................................... 28
Tabel 2.10 : Revisi untuk Tabel 2.9 .................................................................... 30
Tabel 3.1 : Skenario Load Web Page Berita ....................................................... 44
Tabel 3.2 : Skenario Meringkas Dokumen ......................................................... 45
Tabel 4.1 : Use Case Load Web Page Berita ...................................................... 85
Tabel 4.2 : Use Case Summarize......................................................................... 86
Tabel 4.3 : Hasil Recall dan Precison ................................................................. 88
Page 15
DAFTAR LAMPIRAN
Lampiran : Lembar Uji Coba Perbandingan Ringkasan Antara Manual
Dengan Sistem ................................................................................. 92
Page 16
DAFTAR PUSTAKA
[1]. Arifin, A. Zainal., Mahendra, I Putu A.K., dan Ciptaningtyas, Henning Titi.
2009. “Enhanced Confix Stripping Stemmer And Ants Algorithm For
Classifying News Document In Indonesian.
[2]. Arifin, Zaenal, dan Junaiyah. 2009. “Morfologi Bentuk dan Fungsi”.
Jakarta : Gramedia Widiasarana Indonesia.
[3]. Asian, Jelita. 2007. “Effective Techniques for Indonesian Text Retrieval”.
Australia : School of Computer Science and Information Technology,
Science, Engineering, and Technology Portfolio, RMIT University.
[4]. Budiman, K. 2005. “Dasar-Dasar Jurnalistik. Pelatihan Jurnalistik-info
jawa 12-15 Desember 2005”. http://pelitaku.sabda.org/dasar-dasar
jurnalistik. Diakses tanggal 1 Juni 2014.
[5]. Gorys, Keraf. Dr. 1984. “Diksi dan Gaya Bahasa”. Jakarta : PT Gramedia
Pustaka Utama.
[6]. Hovy. 2001. “Automated Text Summarization in SUMMARIST”.
Information Sciences Institute of the University of Southern California
4676 Admiralty Way Marina del Rey, CA 90292-6695 U.S.A.
[7]. Kadhim, Alaa. “Personal text summarization in mobile device”.
[8]. Kridalaksana. (2001 : 92). “Pengertian Kalimat Menurut Para Ahli”.
http://www.trigonalworld.com/2013/07/pengertian-kalimat-menurut-para
ahli.html. Diakses tanggal 1 juni 2014.
[9]. Ladekar, A., Mujumdar, A., Nipane, P., Titar, S., Guide Mrs. Kavitha S.
2012. “Automatic Text Summarization Using Fuzzy GA-GP”. International
Journal of Engineering Research and Applications (IJERA).
[10]. Micheal, Siregar Ivan. “Membongkar Source Code berbagai Aplikasi
Android”. Gava Media.
Page 17
[11]. Mine, B., Gungor, Tunga. “Using Genetic Algorithms with Lexical Chains
for Automatic Text Summarization”. Spain : Universitat Politècnica de
Catalunya, TALP Research Center, Barcelona.
[12]. Mustaqhfiri, Muhammad. 2011. “Peringkasan Teks Otomatis Berita
Berbahasa Indonesia”. Jurusan Teknik Informatika, Fakultas Sains dan
Teknologi Universitas Islam Negeri Maulana Malik Ibrahim Malang.
[13]. Purnanto, Danang Arif. “Peringkasan Dokumen Berita Bahasa Indonesia
Menggunakan Algoritma Genetika”. Ilmu Komputer Universitas
Brawijaya.
[14]. Purwasih, Nurzaitun. “Sistem Peringkas Teks Otomatis Untuk Dokumen
Tunggal Berita Berbahasa Indonesia dengan Menggunakan Graph-based
Summarization Algorithm dan Similarity”. Departemen Teknik Informatika
Institut Teknologi Telkom Bandung.
[15]. Rosidi, Imron. 2009. “Menulis Siapa Takut”. Yogyakarta : Kasnisius.
[16]. Safaat, H. Nazruddin. 2011. “Pemrograman Aplikasi Mobile Smartphone
[17]. Tala, Fadzila Z. “A Study of Stemming Effects on Information Retrieval in
Bahasa Indonesia Institute for Logic”. Language and Computation
Universiteit van Amsterdam The Netherlands.
[18]. Tan, Pang Ning., Steinbach, Michael., Kumar, Vipin. 2006. “Introduction
to Data Mining”. Boston : Pearson Education, Inc.
[19]. Yu, Lei. “A Chinese Automatic Text Summarization system for mobile
devices”.