1 Rekayasa USUL PENELITIAN HIBAH BERSAING VISION BASED FUZZY Q LEARNING PADA NAVIGASI TELEAUTONOMOUS MOBILE ROBOT MENGGUNAKAN FPGA UNTUK APLIKASI SEARCH AND RESCUE Peneliti Utama: Handy Wicaksono, S.T., M.T. Peneliti Anggota: Indar Sugiarto, S.T., M.Sc. UNIVERSITAS KRISTEN PETRA SURABAYA MARET 2010
36
Embed
Handy Wicaksono, Indar Sugiarto. VISION BASED FUZZY Q ...
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
1
Rekayasa
USUL PENELITIAN
HIBAH BERSAING
VISION BASED FUZZY Q LEARNING PADA NAVIGASI TELEAUTONOMOUS MOBILE ROBOT MENGGUNAKAN FPGA
UNTUK APLIKASI SEARCH AND RESCUE
Peneliti Utama: Handy Wicaksono, S.T., M.T.
Peneliti Anggota:
Indar Sugiarto, S.T., M.Sc.
UNIVERSITAS KRISTEN PETRA SURABAYA MARET 2010
2
HALAMAN PENGESAHAN 1. Judul Penelitian : Vision based Fuzzy Q Learning pada Navigasi
Teleautonomous Mobile Robot menggunakan FPGA untuk Aplikasi Search and Recue
2. Ketua Peneliti a. Nama Lengkap : Handy Wicaksono, S.T., M.T. b. Jenis Kelamin : Laki-laki c. NIP : 04-004 d. Jabatan Struktural : - e. Jabatan Fungsional : Lektor f. Fakultas/Jurusan : Teknologi Industri / Teknik Elektro g. Pusat Penelitian : - h. Alamat : Jurusan Teknik Elektro, UK Petra, Jl.
Siwalankerto 121-131, Surabaya 60236 i. Telpon/Faks : (031) 2983115 j. Alamat Rumah : Sukolilo Park Regency K7, Keputih, Surabaya k. Telpon/Faks/E-mail : 0852 310 39493 / - / [email protected] ,
- Prototipe robot SAR dengan dilengkapi kamera, sensor benturan, sensor
ultrasonik, sensor pendeteksi suhu tubuh.
- Program vision based Fuzzy Q Learning pada FPGA.
- Publikasi ilmiah pada jurnal terakreditasi
- Laporan penelitian
9. Institusi lain yang terlibat :
Kelompok studi Robotics and Automation Based on Biologically-Inspired
Technology (RABBIT) dari Politeknik Elektronika Negeri Surabaya (PENS)
10. Keterangan lain yang dianggap perlu :
- Penelitian ini merupakan penelitian lanjutan dari penelitian yang
mendapatkan Hibah Penelitian Dosen Muda periode 2010, dengan judul :
”Implementasi Adaptive Potensial Field Behaviour Coordination and
Compact Q-Learning untuk Sistem Navigasi Autonomous Mobile Robot”.
- Penelitian ini akan dilakukan bekerja sama dengan Robotics and
Automation Based on Biologically-Inspired Technology (RABBIT)
research group dari Politeknik Elektronika Negeri Surabaya (PENS) yang
dipimpin oleh Dr. Ir. Son Kuswadi. Kerja sama yang dilakukan meliputi :
perancangan program, pengujian/eksperimen, diskusi dan share hasil
penelitian.
5
ABSTRAK
Dalam beberapa tahun terakhir gempa bumi sering terjadi di Indonesia, misalnya di Aceh, Yogyakarta, dan Padang. Proses penyelamatan korban gempa sulit dilakukan karena kemungkinan terjadinya gempa susulan yang dapat membahayakan tim penyelamat. Untuk itu robot dapat membantu tim SAR untuk mengidentifikasi adanya korban.
Aplikasi robot di bidang SAR membutuhkan arsitektur robot yang tepat. Behavior based architecture yang bersifat reaktif dan cepat akan digunakan pada penelitian ini. Pengaturan behavior pada robot perlu dilakukan mengingat robot hanya bersifat semi otonom sebagai alat bantu manusia.
Robot akan dikendalikan oleh manusia secara teleoperasi melalui user interface pada komputer. Meski demikian robot tetap perlu memiliki kecerdasan sehingga dalam batasan tertentu robot dapat mengambil keputusan sendiri. Hal ini membantu operator manusia untuk fokus pada tujuan utama SAR.
Untuk itu, robot akan dilengkapi dengan algoritma Fuzzy Q Learning (FQL) yang bersifat off policy, konvergen dan dapat bekerja pada continuous state/action. Mengingat algoritma FQL cukup kompleks, akan digunakan FPGA sebagai pengendali robot.
Sebagai sensor untuk mendeteksi ada tidaknya obyek (baik halangan maupun korban) akan digunakan kamera. Dengan teknik image processing tertentu, informasi dari kamera akan digunakan sebagai inputan dari algoritma FQL yang telah ada, sehingga keputusan yang diambil robot lebih akurat.
6
BAB I
PENDAHULUAN
Latar Belakang
Dalam beberapa tahun terakhir bencana gempa bumi sering terjadi di Indonesia.
Mulai dari tsunami berakibat gempa di Aceh (menelan korban sekitar 220.000 jiwa),
gempa di Yogyakarta (menelan korban sekitar 6000 jiwa), dan gempa di Padang yang
baru terjadi beberapa bulan yang lalu (menelan korban sekitar 1.100 jiwa).
Setelah bencana gempa terjadi, sangat penting untuk melakukan pencarian dan
penyelamatan (Search and Recue). Hasil dari pengamatan Kobe Fire Department,
proses Search and Recue (SAR) yang cepat sangat penting karena survival rate
korban selamat terus menurun seiring waktu. Menurut Tokyo Fire Department, proses
search (pencarian) ialah yang paling sulit dilakukan. Banyak penolong pertama
menyatakan bahwa mereka dapat menyelamatkan korban jika posisinya telah
diketahui. Seringkali, search berada di luar kemampuan manusia, sehingga
dibutuhkan sistem pembantu untuk melakukan operasi ini (Tadokoro, 2009).
Tadokoro (2009) menyimpulkan bahwa tujuan dari robot dalam aplikasi SAR :
1. Membantu operasi SAR yang sulit dilakukan oleh manusia.
2. Mengurangi resiko dari kerusakan sekunder.
3. Meningkatkan kecepatan operasi supaya tingkat keselamatan korban naik.
Pada penelitian ini akan dibuat prototipe robot sebagai alat bantu tim SAR.
Robot yang digunakan sebagai alat bantu akan bersifat teleautonomous, artinya
robot bisa dikendalikan secara teleoperasi (operasi jarak jauh) oleh manusia namun
juga masih memiliki tingkat otonomi tertentu. Perpaduan ini penting mengingat robot
sulit untuk bekerja mandiri dalam aplikasi SAR yang kompleks, namun robot juga
perlu memiliki otonomi untuk membantu operator manusia menjalankan tugasnya.
Saat robot berada dalam fase otonom, robot perlu dilengkapi dengan
kemampuan belajar mandiri (tanpa guru) supaya robot dapat mengantisipasi berbagai
perubahan yang tidak terduga. Penggunaan kamera sebagai vision sensor juga dapat
membantu meningkatkan akurasi masukan bagi algoritma pembelajaran robot.
Penerapan algoritma pembelajaran (yang umumnya kompleks) pada robot
merupakan masalah tersendiri. Perlu dilakukan beberapa modifikasi dalam algoritma
dan pemilihan perangkat keras yang mendukung sehingga algoritma tersebut dapat
7
digunakan pada robot nyata. Hal ini penting dilakukan karena algoritma yang canggih
sekalipun menjadi tidak berarti jika tidak dapat diterapkan pada robot nyata.
Tujuan Khusus
Mengingat sangat diperlukannya penerapan robot di bidang SAR, maka melalui
penelitian ini akan dibuat prototipe robot sebagai alat bantu tim SAR. Robot ini akan
dirancang dengan arsitektur teleautonomous, gabungan antara teleoperasi dan
otonomi.
Dari aspek otonomi, robot akan dilengkapi dengan sensor – sensor berikut :
bump sensor, ultrasonic sensor, sensor panas dan tubuh. Hal ini dimaksudkan supaya
dalam batas tertentu robot masih dapat menghindari halangan bahkan menemukan
target (korban bencana).
Selain itu robot akan dilengkapi dengan kemampuan belajar dari lingkungan
menggunakan metode Reinforcement Learning (RL). Metode ini memungkinkan
robot belajar mandiri tanpa guru, melainkan hanya mengandalkan reward dari
lingkungan. Metode RL yang populer dan efektif pada continuous state/action ialah
Fuzzy Q Learning (FQL), sehingga metode tersebut akan digunakan pada penelitian
ini.
Karena metode pembelajaran di atas cukup kompleks, untuk menerapkannya
pada robot sebenarnya akan digunakan Field Programmable Gate Array (FPGA) dari
Xilinx. FPGA memiliki kemampuan pemrosesan tinggi dan kapasitas memori yang
sangat besar jika dibandingkan dengan mikrokontroler biasa.
Sedang untuk menunjang aspek teleoperasi pada robot, maka robot akan
dilengkapi dengan kamera. Gambar yang didapat dari kamera akan dikirimkan secara
wireless kepada komputer yang dioperasikan operator. Untuk itu robot juga akan
dilengkapi dengan modul komunikasi wireless. Sedangkan pada komputer harus
dilengkapi dengan program Graphical User Interface yang memadai untuk
mempermudah operator melakukan tugasnya.
Penggunaan kamera pada robot juga memungkinkan digunakannya vision based
reinforcement learning pada mode otonom robot. Dengan metode tersebut, robot
dapat mengambil keputusan setelah belajar dari gambar yang dikirimkan oleh kamera.
Hal ini diharapkan dapat meningkatkan akurasi pengambilan keputusan robot.
8
Urgensi Penelitian
Penyelamatan Korban Bencana (Penerapan Nyata di Lapangan)
Penelitian ini penting untuk dilakukan karena frekuensi gempa yang cukup
sering terjadi di Indonesia dalam 5 tahun terakhir. Penggunaan robot sebagai alat
bantu tim SAR belum dilakukan di Indonesia, padahal di negara lain (Jepang,
Amerika Serikat) hal ini sudah mulai dilakukan. Dengan menggunakan alat bantu
berupa robot, sangat diharapkan nantinya makin banyak korban gempa yang dapat
diselamatkan.
Dengan membuat sendiri robot SAR, tentunya Pemerintah tidak perlu membeli
robot SAR dari negara lain dengan harga yang tinggi. Hal ini tentunya dapat
mengurangi ketergantungan bangsa Indonesia dari negara lain dalam hal teknologi
robotika, dan pada akhirnya dapat meningkatkan daya saing bangsa.
Pengembangan IPTEKS
Di sisi lain, melalui penelitian ini akan dibuat prototipe robot SAR yang akan
dikendalikan dari jarak jauh oleh operator. Melalui berbagai eksperimen tentunya
aspek – aspek yang penting dari teleautonomy (gabungan dari teleoperasi dan robot
otonom) dapat digali di sini, sehingga dapat membantu dalam penerapan sebenarnya
di masa mendatang.
Dari sisi teknis, penerapan robot dalam aplikasi SAR ini cukup menantang,
mengingat sifat dari medan bencana yang berubah – ubah dan tidak menentu. Hal
tersebut juga menimbulkan kebutuhan robot untuk dapat belajar secara mandiri
(dalam batas tertentu). Sehingga dalam penelitian ini, akan diterapkan algoritma
pembelajaran Fuzzy Q Learning.
Algoritma pembelajaran robot sebagian besar masih dilakukan dalam bentuk
simulasi komputer karena algoritmanya yang kompleks dan pada penelitian ini akan
digunakan FPGA sebagai pengendali robot yang memiliki kemampuan pemrosesan
tinggi dan kapasitas memori besar. Melalui penelitian ini algoritma FQL akan
diprogram menggunakan media FPGA dan performa yang dihasilkan robot akan
diamati.
Sering kali informasi yang didapat robot kurang akurat. Sehingga pada
penelitian ini, inputan dari algoritma pembelajaran akan menggunakan gambar yang
direkam kamera. Hal ini penting karena dalam penerapan robot SAR, peran kamera
dalam memandu operator jarak jauh ataupun sebagai media pendeteksi obyek (baik
halangan maupun korban) sangat penting.
9
Pengembangan Kelembagaan
Akhirnya, melalui penelitian ini, diharapkan Jurusan Teknik Elektro (JTE) –
Universitas Kristen Petra (UKP) dapat menjadi center of excellence di bidang robotika
pada umumnya, dan robot SAR pada khususnya.
Saat ini JTE – UKP memiliki Automation and Robotics Research Group
(ARRG) yang bertujuan untuk meningkatkan atmosfer ilmiah serta melakukan
penelitian bersama di bidang Otomasi & Robotika. Melalui Hibah Bersaing ini
diharapkan akan muncul penelitian – penelitian bermutu di bidang robotika oleh
dosen & mahasiswa melalui ARRG di masa mendatang.
Peningkatan Kerja Sama Riset
Penelitian yang akan dilakukan dengan Hibah Bersaing ini juga akan
meningkatkan kerja sama riset antara ARRG dari JTE – UKP dengan Robotics and
Automation Based on Biologically-Inspired Technology (RABBIT) research group
dari Politeknik Elektronika Negeri Surabaya (PENS) yang dipimpin oleh Dr. Ir. Son
Kuswadi.
Kerja sama yang dilakukan meliputi : perancangan perangkat lunak dan
perangkat keras, pengujian/eksperimen, diskusi dan share hasil penelitian. Melalui
kerja sama ini diharapkan mutu penelitian yang dilakukan meningkat. Selain itu
diharapkan terjadi sharing of knowledge antar peneliti dari 2 kelompok studi tersebut
sehingga mutu peneliti – penelitinya juga akan mengalami peningkatan.
10
BAB II
STUDI PUSTAKA
Aplikasi robot dalam operasi Search And Rescue (SAR) mulai dilakukan
pada bencana WTC di Amerika Serikat. Kondisi area bencana yang berbahaya bagi
manusia pekerja maupun anjing membuat robot dipilih sebagai sarana pembantu.
Untuk memenuhi tugasnya menemukan dan membantu proses lokalisasi korban, robot
harus memiliki ukuran kecil, memiliki mobilitas tinggi, fleksibel dan dilengkapi
dengan sensor – sensor yang diperlukan (Murphy dkk., 2000).
Gambar 1. Contoh rescue robot dari SOLEM dan URBOT (Carlson, 2005)
Di Indonesia penelitian tentang robot SAR diantaranya dilakukan oleh
ABBIT (Robotics and Automation Based on Biologically Inspired Technology)
research group dari PENS-ITS dimana penulis ikut bergabung selama penyelesaian
tesis. Penelitian yang dilakukan meliputi mekanisme robot dengan menggunakan
robot berkaki lima (Prihastono et. al., 2009) dan mekanisme gabungan roda – kaki
(Kuswadi et. al., 2009). Selain itu penelitian tentang pembelajaran robot dengan
Reinforcement Learning (Anam et. al., 2009) juga aktif dilakukan.
Untuk mewujudkan robot untuk aplikasi SAR diperlukan arsitektur robot
yang tepat. Arsitektur robot yang pertama kali dikemukakan ialah arsitektur
deliberative / hirarki. Contohnya ialah robot Shakey yang dikembangkan oleh
Stanford Research Institute. Prinsip kerja dari arsitektur ini ialah robot merasa
kemudian berpikir sebelum dapat bergerak (sense – plan – act ). Kelemahan dari
arsitektur ini ialah waktu untuk perencanaan yang lama sehingga tidak cocok untuk
aplikasi dalam real robot.
11
Gambar 2. Skema Arsitektur Deliberative (Brooks, 1986)
Kelemahan itu dapat diatasi dengan arsitektur reactive / behavior based
control. Arsitektur ini memiliki struktur behavior horizontal yang bekerja bersama
secara paralel, bersamaan dan asinkronus. Keuntungan dari arsitektur ini ialah
kecepatan real robot karena tidak perlu “berencana” dan langsung “bereaksi”. Namun
demikian, masih ada kelemahan yang ada yaitu robot tidak mampu melakukan
perencanaan global (Brooks, 1986).
Gambar 3. Skema Arsitektur Reactive (Brooks, 1986)
Selain arsitektur yang tepat, untuk mengatasi hal – hal yang tidak
direncanakan sebelumnya, perlu dilakukan mekanisme pembelajaran yang tepat pada
robot. Pada mekanisme supervised learning diperlukan “guru”, sedang pada
unsupervised learning (yang lebih cocok untuk aplikasi robot) suatu agent harus
belajar sendiri. Reinforcement learning adalah metode unsupervised learning yang
dapat belajar dari kritik/reward secara langsung (online) dari lingkungan (Glorennec,
2000).
12
Gambar 4. Skema Umum Reinforcement Learning (Perez, 2003)
Ada berbagai metode untuk penyelesaian masalah reinforcement learning,
salah satu yang paling populer ialah Temporal Difference Algorithm, dan lebih khusus
lagi ialah Q Learning Algorithm (Watkins, 1992). Kelebihan dari Q Learning ialah
sifatnya yang off policy (dapat mengikuti policy apapun), algoritma yang sederhana,
dan konvergen terhadap optimal policy. Namun demikian juga ada kelemahan yang
dimilikinya yaitu hanya dapat digunakan untuk discrete state/action, tabel Q
(state/action) terlalu besar sehingga memakan waktu lama untuk proses
pembelajarannya (Perez, 2003). Diagram alir dari Q Learning dapat dilihat pada
gambar 6 berikut.
Take State(t)
Choose action with
Exploration Exploitation
Policy (EEP)
Robot take action
Data Initialization
Examine reward(t)
Take State (t+1)
Find maximal value of Q
at (t+1)
Find Q value at (t)
Gambar 5. Diagram alir Q learning
Dimana persamaan untuk mendapatkan nilai Q ialah sebagai berikut :
[ ]),()','(max),(),( ' asQasQrasQasQ a −++← γα (2.1)
s ←←←← s’;
until s is terminal
13
dimana
Q(s,a) : component of Q table (state, action)
s : state s’ : next state a : action a’ : next action
r : reward α : learning rate γ : discount factor
Supaya Q learning dapat digunakan untuk continuous state/action perlu
dilakukan generalisasi menggunakan function approximator, di antaranya : Cerebellar
No Tahapan Mar Apr Mei Jun Jul Agt Sept Okt Nov Keterangan
1 Mempelajari image processing pada robot
2 Membuat simulasi program vision based FQL
3 Menambahkan kamera pada hardware
4 Menambahkan komunikasi jarak jauh pada hardware
5 Membuat sistem komunikasi & program user interface pada komputer untuk teloperasi
6 Menerapkan algoritma Vision based FQL dalam FPGA
7 Integrasi sistem
8 Pengujian di lapangan
9 Pembuatan laporan penelitian
23
BAB IV
PEMBIAYAAN
Rincian pembiayaan penelitian adalah sebagai berikut:
No Jenis Pengeluaran
Rincian Anggaran Yang Diusulkan Tahun I Tahun II
(Rp.) (Rp.) 1 Gaji dan Upah Pelaksana 14.592.000 14.592.000 2 Peralatan 27.000.000 25.450.000 3 Bahan Habis Pakai 2.040.000 2.040.000 4 Perjalanan 2.500.000 2.500.000 5 Lain - Lain 3.850.000 5.350.000 6 Total Anggaran per tahun 49.982.000 49.932.000
Total Anggaran Keseluruhan 99.914.000
24
DAFTAR PUSTAKA
1. Anam, K., Prihastono, Wicaksono, H., Kuswadi, S., Effendie, R., Jazidie, A.,
Sulistijono, I.A., Sampei M., (2009) “Hybridization of Fuzzy Q-Learning and
Behavior-Based Control for Autonomous Mobile Robot Navigation in
Cluttered Environment”, Proceeding of ICCAS-SICE 2009 (ICROS-SICE
International Joint Conference 2009). Fukuoka, Japan.
2. Argyros, A., Georgiadis, P., Trahanias, P., Tsakiris, D., (2002) “Semi-
autonomous Navigation of a Robotic Wheelchair”, Journal of Intelligent and