9 BAB II KAJIAN PUSTAKA 2.1 State of the art Penelitian yang berkaitan dengan text to speech yang telah dilakukan sebelumnya dengan menggunakan metode pengolahan prosodi dan dengan bahasa yang berbeda beda adalah sebagai berikut. O. Al-Dakkak, N. Ghneim, M. Abou Zliekha and S. Al-Moubayed dalam artikelnya yang berjudul Emotion Inclusion In An Arabic Text-To-Speech pada tahun 2004 membahas mengenai penerapan satuan emosi dalam text to speech bahasa arab. Jenis emosi yang digunakan antara lain marah, senang, sedih, takut dan terkejut. Digunakan masing-masing 20 kalimat dalam setiap emosi yang akan diukur parameternya. Parameter yang digunakan untuk menentukan emosi antara main FO Parameter, Durasi Parameter dan Intensitas Parameter. Nilai dari parameter ini digunakan dalam pembentukan prosodi untuk menciptakan emosi dan aplikasi text to speech dalam Bahasa Arab. Iwan Iwut Tritoasmoro dalam artikelnya yang berjudul Text-To-Speech Bahasa Indonesia Menggunakan Concatenation Synthesizer Berbasis Fonem pada tahun 2006 membahas mengenai aplikasi text to speech dalam Bahasa Indonesia dengan menggunakan fonem sebagai unit ucapan. Tiap fonem memiliki tiga bentuk, yakni fonem di awal suku, fonem di tengah suku, dan fonem di akhir suku. Kesimpulan dalam penelitian ini adalah hasil dalam implementasi secara umum dapat mengucapkan seluruh kata dalam Bahasa Indonesia dengan baik dan dapat
22
Embed
BAB II KAJIAN PUSTAKA - IMISSU Single Sign On of · PDF file · 2017-04-01Synthesis pada tahun 2010 membahas mengenai meningkatkan ekspresivitas Teks ... yakni daun yang masih muda.
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
9
BAB II
KAJIAN PUSTAKA
2.1 State of the art
Penelitian yang berkaitan dengan text to speech yang telah dilakukan
sebelumnya dengan menggunakan metode pengolahan prosodi dan dengan bahasa
yang berbeda beda adalah sebagai berikut.
O. Al-Dakkak, N. Ghneim, M. Abou Zliekha and S. Al-Moubayed dalam
artikelnya yang berjudul Emotion Inclusion In An Arabic Text-To-Speech pada
tahun 2004 membahas mengenai penerapan satuan emosi dalam text to speech
bahasa arab. Jenis emosi yang digunakan antara lain marah, senang, sedih, takut
dan terkejut. Digunakan masing-masing 20 kalimat dalam setiap emosi yang akan
diukur parameternya. Parameter yang digunakan untuk menentukan emosi antara
main FO Parameter, Durasi Parameter dan Intensitas Parameter. Nilai dari
parameter ini digunakan dalam pembentukan prosodi untuk menciptakan emosi
dan aplikasi text to speech dalam Bahasa Arab.
Iwan Iwut Tritoasmoro dalam artikelnya yang berjudul Text-To-Speech
Bahasa Indonesia Menggunakan Concatenation Synthesizer Berbasis Fonem pada
tahun 2006 membahas mengenai aplikasi text to speech dalam Bahasa Indonesia
dengan menggunakan fonem sebagai unit ucapan. Tiap fonem memiliki tiga
bentuk, yakni fonem di awal suku, fonem di tengah suku, dan fonem di akhir suku.
Kesimpulan dalam penelitian ini adalah hasil dalam implementasi secara umum
dapat mengucapkan seluruh kata dalam Bahasa Indonesia dengan baik dan dapat
10
dimengerti. Namun ucapan sintesis yang dihasilkan belum memiliki pola intonasi
(prosodi) sebagaimana ucapan asli.
Ghadeer Al-Said and Moussa Abdallah dalam artikelnya yang berjudul An
Arabic Text-To-Speech System Based on Artificial Neural Networks pada tahun
2009 membahas mengenai pengembangan aplikasi text to speech dalam Bahasa
Arab dengan menggunakan metode jaringan saraf tiruan. Jaringan saraf tiruan
digunakan dalam tahap presprocesing dimana kata yang sudah dinormalisasi akan
diubah ke dalam bentuk numerik sebelum diproses dalam jaringan saraf tiruan.
Dalam penelitian ini melakukan percobaan pada tiga pilihan model database
antara lain dengan database model kata dengan hasil akurasi 99%, model diphone
dengan hasil akurasi 99% dan model triphone dengan hasil akurasi 86,5%.
M.B.Chandak, Dr.R.V.Dharaskar dan Dr.V.M.Thakre dalam artikelnya
yang berjudul Text to speech Synthesis with Prosody feature: Implementation of
Emotion in Speech Output using Forward Parsing pada tahun 2011 membahas
mengenai pengembangan aplikasi text to speech dalam bahasa inggris dengan
meningkatkan kealamian emosi dengan menggunakan metode forward parsing.
Forward Parsing adalah metode pemindaian teks untuk menentukan berbagai titik
seperti isi teks, konteks teks, frekuensi kata tertentu dalam teks dimana emosi
dalam teks akan terlihat pada konteks teks.
Zhiyong WU, Lianhong CAI, Helen M. MENG pada artikel nya yang
berjudul Modeling Prosody Patterns for Chinese Expressive Text-to-Speech
Synthesis pada tahun 2010 membahas mengenai meningkatkan ekspresivitas Teks
to Speech dalam bahasa mandarin dimana ditemukan bahwa pembicaraan
11
biasanya cenderung lebih menekankan pada satu suku kata tertentu dalam sebuah
kalimat. Berdasarkan lokasi suku kata tersebut dicari kaitan dengan suku kata
sebelumnya, sesudahnya dan suku kata sisanya.
Tabel 2. 1 Penelitian yang Telah Dilakukan Sebelumnya
No Nama Judul Deskripsi
1 O. Al-Dakkak
dkk (2004)
Emotion Inclusion In
An Arabic Text-To-
Speech
Mencari Durasi Parameter dan
Intensitas Parameter dari
beberapa kalimat berbeda emosi
untuk menentukan mencipatakan
prosodi suatu emosi.
2 Iwan Iwut
Tritoasmoro
(2006)
Text-To-Speech Bahasa
Indonesia
Menggunakan
Concatenation
Synthesizer Berbasis
Fonem
Membagi fonem menjadi tiga
bentuk yaitu fonem di awal suku,
fonem di tengah suku, dan fonem
di akhir suku
3 Ghadeer Al-
Said and
Moussa
Abdallah
(2009)
An Arabic Text-To-
Speech System Based
on Artificial Neural
Networks
Tahap presprocesing
menggunakan metode jaringan
saraf tiruan dan dengan
menggunakan tiga model
database antara lain database
model kata, diphone dan triphone
4 M.B.Chandak
dkk (2011)
Text to speech Synthesis
with Prosody feature:
Implementation of
Emotion in Speech
Output using Forward
Parsing
Aplikasi text to speech
meningkatkan kealamian emosi
dengan menggunakan metode
forward parsing.
5 Zhiyong WU Modeling Prosody Meningkatkan ekspresivitas Teks
12
dkk (2010) Patterns for Chinese
Expressive Text-to-
Speech Synthesis
to Speech dalam bahasa mandarin
dengan memperhatikan posisi
suku kata inti dalam satu kalimat.
2.2 Dharma Gita / Gending Bali
Seni suara adalah suatu pernyataan atau gambaran dari jiwa atau perasaan
manusia, yang dinyatakan dalam bentuk deretan nada-nada, baik yang diciptakan
atau dicetak, maupun yang lanjut disuarakan secara vokal maupun instrumental
(Wayan Budha Gautama, 2007). Dharma gita merupakan salah satu bagian dari
Panca Gita yang dinyanyikan pada saat pelaksanaan yadnya. Panca Gita adalah
lima jenis suara atau bunyi yang mengiringi atau menunjang pelaksanaan yadnya.
Bagian dari panca gita antara lain getaran mantram, suara genta, suara kidung,
suara gamelan dan suara kentongan. Dharma gita berasal dari Bahasa Sansakerta
dan terdiri dari dua kata yakni Dharma dan Gita. Dharma artinya
kebenaran/kebaikan, kewajiban, hukum, aturan. Sedangkan Gita artinya nyanyian
atau lagu. Jadi, Dharma gita berarti suatu nyanyian kebenaran yang biasa
dilantunkan saat upacara keagamaan.
2.2.1 Unsur Tangga Nada
Dharma gita atau gending bali pada awalnya dibentuk tangga nada (titi
nada) tangga nada ventatonis (5 nada) yaitu : dang, ding, dong, deng , dung atau
dalam bentuk notasi angka menjadi do (1), mi (3), fa (4), sol (5), si (7) atau dalam
bentuk singkat menjadi a i o e u. Seiring dengan perkembangan jaman banyak
gending bali digubah memakai laras/nada diatonic (7 nada) terutama jenis
13
gending kreasi. Jenis laras/nada ventatonis dapat dibagi menjadi seperti berikut
(Wayan Budha Gautama, 2007).
a. Laras Pelog
Laras pelog adalah nada yang menggunakan patutan gong.
a i o e u = dang ding dong deng dung
1 3 4 5 7 = do mi fa sol si
b. Laras Slendro
Laras slendro adalah nada yang menggunakan patutan gender.
i o e u a = ding dong deng dung dang
1 2 3 5 6 = do re mi sol la
c. Laras Gambangan
Laras pelog adalah nada yang menggunakan patutan gambang.
a ai i o e eu u = dang daing ding dong deng
deung dung
1 1 3 4 5 5 7 = do di mi fa sol
sel si
2.2.2 Jenis Dharma Gita
Berdasarkan sifatnya Dharma gita dapat dibagi menjadi empat bagian sepertit
berikut :
14
2.2.2.1 Sekar Rare / Gegendingan
Sekar Rare adalah sekumpulan kalimat bebas tidak ada ikatan yang
dinyanyikan. Isinya pada umumnya pendek, sederhana dan menggunakan Bahasa
bali lumrah sehingga dapat dilagukan dengan mudah dalam suasana bermain dan
bergembira. Sekar Rare dinyanyikan sesuai dengan suara gong yang lebih banyak
menggunakan laras pelog. Sekar Rare dapat dibedakan menjadi tiga yaitu :
a. Gending Rare
Sifat dari gending rare adalah gembira, lucu, ceria dan bermain-main.
Gending Rare menggunakan patokan nada suara gong atau gender
sehingga dapat menggunakan laras pelog ataupun laras slendro. Contoh
dari Gending Rare antara lain : Goak Maling Taluh, Curik-curik, Sumping
Waluh dan lain-lain.
b. Gending Janger
Gending janger atau jejangeran adalah gending yang dibawakan oleh
penari Janger atau Kecak. Gending Janger dikatakan sebagai bagian dari
sekar rare karena sifat serta patokan nada seperti gending rare yaitu
patokan gong atau gender meskipun pelaku atau penarinya terdiri dari
orang dewasa. Contoh dari gending janger antara lain : Sarikonta, Biu
Kayu, Pangaksama dan lain-lain.
c. Gending Sang Hyang
Kata Sang Hyang pada Gending Sang Hyang berarti mulai atau yang
dimuliakan. Gending Sang Hyang ini dilantunkan pada saat upacara
Agama Hindu oleh penari Sang Hyang yang terdiri dari anak-anak
15
dibawah umur, artinya belum mengalami menstruasi. Selain anak wanita,
ada juga penari Sang Hyang dari anak laki-laki tergantung dari jenis
gending Sang Hyang yang dinyanyikan. Contoh dari gending Sang Hyang
antara lain : Sang Hyang Dedari, Sang Hyang Jaran, Sang Hyang Memedi
dan lain-lain.
2.2.2.2 Sekar Alit / Pupuh
Sekar alit biasa disebut dengan tembang mecepat, geguritan atau pupuh.
Sekar alit memiliki aturan dalam penulisannya yang disebut dengan padalingsa.
Aturan padalingsa pada pupuh antara lain guru wilangan yaitu jumlah suku kata
dalam setiap barisnya, guru dingdong yaitu huruf vokal pada kata terakhir setiap
barisnya dan guru gatra yaitu jumlah baris dalam satu baitnya. Beberapa jenis
pupuh atau Sekar Alit antara lain seperti berikut :
a. Pupuh Mijil
Pupuh Mijil menguraikan suatu nasehat serta dapat juga digubah untuk
melukiskan seseorang yang sedang dimabuk asmara. Padalingsa Pupuh
Mijil adalah seperti berikut, guru gatra terdiri dari 9 baris pada setiap
baris, guru wilangan dan guru gatra adalah 4u, 6i, 6o, 4e, 6e, 4u, 6i, 6i,
8/6u.
b. Pupuh Pucung
Pupuh Pucung menguraikan suatu cerita dongeng atau menyampaikan
suatu kisah atau falsafah agama dan nasehat. Pupuh Pucung memiliki sifat
serta watak kendur maka tidak cocok dipakai untuk melukiskan perasaan
16
yang bersifat semangat. Padalingsa Pupuh Pucung adalah seperti berikut,
guru gatra terdiri dari 6 baris pada setiap baris, guru wilangan dan guru
gatra adalah 4u, 8u, 6a, 8i, 4u, 8a.
c. Pupuh Kumambang
Pupuh Kumambang biasa disebut juga dengan Pupuh Maskumambang.
Kumambang berasal dari kata “kambang” yang berarti menerawang.
Pupuh Kumambang memiliki sifat sedih atau merana. Padalingsa Pupuh
Kumambang adalah seperti berikut, guru gatra terdiri dari 5 baris pada
setiap baris, guru wilangan dan guru gatra adalah 4a, 8i, 6a, 8i, 8a.
d. Pupuh Ginada
Pupuh Ginada meiliki sifat yang melukiskan hati kecewa. Ginada berasal
dari kata ‘gada’ mendapat sisipan ‘in’ menjadi Ginada yang berarti
terpukul dan akhirnya tertimpa oleh kekecewaan yang mendalam.
Padalingsa Pupuh Ginada adalah seperti berikut, guru gatra terdiri dari 7
baris pada setiap baris, guru wilangan dan guru gatra adalah 8a, 8i, 8a/o,
8u, 8a, 4i, 8a.
e. Pupuh Ginanti
Pupuh Ginanti memiliki sifat rasa kasih saying atau rasa cinta. Biasa
digunakan untuk menguraikan suatu filsafah atau cerita yang bernuansa
asmara. Padalingsa Pupuh Ginanti adalah seperti berikut, guru gatra
terdiri dari 6 baris pada setiap baris, guru wilangan dan guru gatra adalah
8u, 8i, 8a, 8i, 8a, 8i.
17
f. Pupuh Semarandana
Pupuh Semarandana biasa bisa disebut juga dengan Semaradahana atau
Asmaradaha (api asmara). Pupuh Semarandana biasa digunakan untuk
melukiskan hati dalam keadaan mabuk asmara. Padalingsa Pupuh
Semarandana adalah seperti berikut, guru gatra terdiri dari 6 baris pada
setiap baris, guru wilangan dan guru gatra adalah 8i, 8a, 8e/o, 8a, 8u, 8a.
g. Pupuh Sinom
Kata “sinom” adalah singkatan dari “sinuam” yang memiliki arti pucuk
yakni daun yang masih muda. Pupuh Sinom biasa dipakai untuk
menyampaikan suatu amanat, nasehat atau percakapan secara bersahabat
dan kekeluargaan. Padalingsa Pupuh Sinom adalah seperti berikut, guru
gatra terdiri dari 10 baris pada setiap baris, guru wilangan dan guru gatra
adalah 8a, 8i, 8a, 8i, 8i, 8u, 8a, 8i, 4u, 8a.
h. Pupuh Durma
Pupuh Durma memiliki sifat keras, sadis atau marah. Pupuh ini biasanya
dipakai untuk melukiskan situasi peperangan atau kekacauan. Padalingsa
Pupuh Durma adalah seperti berikut, guru gatra terdiri dari 7 baris pada
setiap baris, guru wilangan dan guru gatra adalah 12a, 7i, 6a, 7a, 8i, 5i,
7i.
i. Pupuh Pangkur
Pupuh Pangkur memiliki sifat perasaan hati memuncak. Pupuh ini cocok
untuk melukiskan cerita yang mengandung maksud kesungguhan.
Padalingsa Pupuh Pangkur adalah seperti berikut, guru gatra terdiri dari 9
18
baris pada setiap baris, guru wilangan dan guru gatra adalah 8a, 4a, 8i,
8u, 8a, 4a, 8u, 8a, 8i.
j. Pupuh Dandang Gula
Pupuh Dandang Gula memiliki watak yang halus, luwes atau lemas.
Pupuh ini biasa dipakai untuk menyudahi atau menutup suatu cerita.
Padalingsa Pupuh Dandang Gula adalah seperti berikut, guru gatra terdiri
dari 13 baris pada setiap baris, guru wilangan dan guru gatra adalah 4a,
8i, 4a, 8a, 8e, 8u, 8i, 8a, 8u, 8a, 4a, 8i, 8a.
Tabel 2. 2 Daftar Prosodi Sekar Alit
No Nama Pupuh Prosodi
1 2 3 4 5 6 7 8 9 10 11 12 13
1 Pupuh Mijil 4u 6i 6o 4e 6e 4u 6i 6i 8/6u
2 Pupuh Pucung 4u 8u 6a 8i 4u 8a
3 PupuhKumambang
4a 8i 6a 8i 8a
4 Pupuh Ginada 8a 8i 8a/o 8u 8a 4i 8a
5 Pupuh Ginanti 8u 8i 8a 8i 8a 8i
6 PupuhSemarandana
8i 8a 8e/o 8a 8u 8a
7 Pupuh Sinom 8a 8i 8a 8i 8i 8u 8a 8i 4u 8a
8 Pupuh Durma 12a 7i 6a 7a 8i 5i 7i
9 Pupuh Pangkur 8a 4a 8i 8u 8a 4a 8u 8a 8i
10 PupuhDandang
4a 8i 4a 8a 8e 8u 8i 8a 8u 8a 4a 8i 8a
2.2.2.3 Sekar Madya / Kidung
Sekar Madya sering juga disebut dengan istilah kidung yang digunakan
untuk menyebutkan puisi-puisi berbahasa Jawa Kuna, Jawa Tengahan dan Bahasa
Bali Alus. Sekar Madya merupakan jenis lagu pemujaan, umumnya dinyanyikan
19
dalam kaitan ucapara adat maupun agama. Sekar Madya memiliki ciri-ciri seperti
berikut :
a. Mempunyai kawitan, yang terdiri atas : dua (2) pada Tembang Bawak
(pemawak) dan dua (2) pada Tembang Panjang (pemanjang).
b. Ada yang disebut Pengawak, yang terdiri dari dua pada pemawak dan dua
pada pemanjang.
Hukum atau aturan yang terdapat pada Sekar Madya adalah seperti berikut :
a. Memiliki guru wilang, padalingsa dan labuh suara.
b. Purwakanti, yaitu pertautan suara akhir suku kata terdahulu dengan awal
suku kata berikutnya.
c. Pliring dan Wewiletan, Pliring melirik atau melihat pemenggalan suku
kata agar jelas dan tidak terputus-putus pada tengah kata.
d. Pengambilan onek-onekan (ejekan) dua suku kata dan tidak memutuskan
kata dan yang selanjutnya disambung.
e. Saptawindu dan Sutrasuara adalah teknik memperpanjang dan
mempendek suara.
Jenis-jenis kidung beserta kegunaannya dapat dibagi seperti berikut :
a. Kidung Wargasari, dipergunakan untuk iringan Upacara Dewa Yadnya
b. Kidung Asti, kidung Aji kembang dan sejenisnya dipergunakan untuk
iringan Upacara Pitra Yadnya.
c. Kidung Rarawangi, Kidung Palugangsa dan sejenisnya dipergunakan
sebagai iringan Upacara Rsi Yadnya.
20
d. Kidung Tantri, Kidung Malat dan Kidung Wilet dipergunakan sebagai
iringan Upacara Manusa Yadnya
e. Kidung Jerum dan Kidung Alis-alis Ijo dipergunakan sebagai iringan
Upacara Butha Yadnya
2.2.2.4 Sekar Agung / Kekawin
Kata Kekawin berasal dari kata “kawi” Yang artinya karangan, mendapat
reduplikasi (dwipurwa) ‘ka’ serta akhiran ‘an’ sehingga menjadi Kekawin yang
artinya aneka ragam atau aneka warna hasil karangan. Istilah-istilah dalam
Kekawin antara lain seperti berikut :
a. Wretta Matra
Wretta artinya suku kata yang membentuk kalimat atau jumlah suku kata
yang membentuk kalimat. Matra artinya ukuran atau letak. Wretta Matra
memiliki pengertian hubungan antara jumlah suku kata pada setiap kalimat
dan guru lagu yang memberikan perbedaan wirama yang dihasilkan.
b. Guru dan Lagu
Guru artinya suara berat, panjang, besar, bergetara dan berliku-liku.
Lagu artinya suara ringan, suara pendek, datar atau lemah.
c. Gana Matra
Gana Matra adalah letak guru dan lagu di dalam suatu kalimat pada satu
bait dari sebuah kekawin.
21
d. Purwa Kanti
Purwa kanti adalah pertauatan suara pada akhir kata dengan awal kata
berikutnya di dalam satu kalimat atau pertauatan akhir lata dengan awal
kata pada bait berikutnya.
2.3 Text to speech
Text to speech adalah sebuah program berbasis komputer dimana sistem
memproses teks dan membacanya. Perbedaan sistem text to speech dengan talking
machine biasa adalah keotomatisannya dalam mengucapkan kata-kata baru karena
sumber dari text to speech adalah berupa inputan teks (Iwan Iwut Tritoasmoro,
2006). Secara garis besar sistem Text to speech melakukan dua proses konversi,
yaitu konversi teks ke fonem dan konversi fonem ke ucapan, yang dilakukan
secara berurutan dengan input teks dan menghasilkan output ucapan.
2.3.1 Fonem
Fonem merupakan satuan bunyi bahasa yang terkecil yang dapat
membedakan makna. Cabang ilmu bahasa yang mempelajari satuan-satuan bunyi
bahasa yang terkecil yang membedakan makna itu disebut fonetik (phonemics)
dan sering pula disebut fonologi (phonology) (I Nyoman Sulaga dkk, 1996).
Bunyi-bunyi bahasa yang merupakan satuan bunyi terkecil memiliki fungsi
tersendiri dalam membedakan arti dan bunyi yang disebut dengan satuan bunyi
yang fungsional. Secara umum fonem dapat dibedakan menjadi dua antara lain
fonem segmental dimana fonem ini jelas terdengar ruasnya berupa bunyi dan
22
fonem suprasegmental dimana bunyi-bunyi yang sering ditulis dengan tanda baca
seperti diatas huruf atau disebelah kana huruf. Fonem bahasa bali sampai saat ini
hanya memiliki fonem segmental, sedangkan fonem suprasegmental yang berupa
tekanan, nada, perpanjangan dan jeda diaangap tidak ada karena kehadiran fonem
suprasegmental tersebut tidak bisa membedakan makna.
2.3.1.1 Fonem Vokal Bahasa Bali
Jumlah fonem vokal dalam bahasa bali berjumlah enam buah yaitu /i, e, a,
ê, u, o/. Fonem vokal bahasa bali hanya berupa fonem vokal tunggal sebab fonem
vokal yang berupa diftong (diphtong), yaitu gabungan dua vokal tunggal yang
memiliki puncak kenyaringan yang tunggal tidak ditemukan dalam bahasa bali.
Bahasa Indonesia mempunyai diftong yang cukup banyak seperti dalam kata
kerbau, danau, santai, balai dan sebagainya. Dalam bahasa bali kata-kata bahasa
Indonesia seperti diatas ditemukan dalam bentuk yang tidak berdiftong. Kata-kata
dalam bahasa bali akan menjadi kebo, dano, sante dan bale yang memiliki artis
sama persis dengan bahasa Indonesia. Namun tidak semua vokal rangkap itu
disebut dengan diftong. Ciri diftong yang utama adalah cara pengucapannya yang
terbentuk dari peluncuran satu vokal ke vokal lain yang membentuk satu puncak
kenyaringan. Bila vokal rangkap itu memiliki dua rangkap kenyaringan, maka
vokal rangkap itu bukan merupakan diftong. Contoh kata yang mempunyai vokal
rangkap tapi bukan merupakan diftong antara lain kauk, gauk, lait, maid dan rai.
23
Distribusi fonem vokal bahasa bali dapat dirumuskan seperti berikut :
a) Fonem vokal /i, e, u, o / memiliki distribusi yang lengkap bisa ditempatkan
di awal, ditengah dan di akhir kata.
b) Fonem vokal /a/ hanya memiliki distribusi di awal dan tengah kata. Kata-
kata bahasa bali tidak pernah berakhiran dengan fonem vokal /a/, kecuali
dialek bahasa bali aga dan kata serapan seperti wisata, Honda, pespa dan
aqua. Dialek bali aga justru tidak mempunyai kata-kata yang berakhir
dengan fonem vokal /ê/.
c) Fonem vokal /ê/ belum ditemukan mempunyai posisi pada awal kata atau
sangat langka sehingga sulit menemukan contohnya, tetapi pada posisi
tengah dan akhir cukup banyak kata yang didapatkan.
2.3.1.2 Fonem Konsonan Bahasa Bali
Fonem konsonan adalah suara yang pada saat udara keluar (dari paru-paru)
sebagian besar atau sepenuhnya mendapat hambatan. Oleh karena itu fonem
konsonan kadar kenyaringannya sangat kecil bila dibandingkan dengan fonem
vokal, hal ini menyebabkan fonem konsonan hampir tidak pernah menjadi puncak
suatu kata (I Nyoman Sulaga dkk, 1996).
Wujud alofon fonem konsonan bahasa bali tidak sejenis dengan fonem
vokal sehingga hampir kebanyakan fonem konsonan bahasa bali dianggap tidak
memiliki alofon. Alofon (alophone) adalah wujud fonem yang sesungguhnya
dalam lingkungan bunyi, alofon inilah yang merupakan wujud konkret sebuah
24
fonem. Distribusi fonem konsonan bahasa bali dapat dibagi menjadi seperti berikut
(I Nyoman Sulaga dkk, 1996).
a) Fonem konsonan letupan, sengau, sampingan, geseran dan geletar
memiliki distribusi yang lengkap. Artinya fonem itu dapat berposisi pada
awal, tengah dan akhir.
b) Fonem konsonan paduan dan semi vokal hanya memiliki distribusi pada
Tabel 2. 3 Tabel Distribusi Fonem Konsonan Bahasa Bali
No Nama Distribusi Fonem Konsonan Fonem Konsonan
1 Fonem Konsonan Letupan b, p, d, t, g, k
2 Fonem Konsonan Paduan c, j
3 Fonem Konsonan Sengau m, n, ň, ng
4 Fonem Konsonan Sampingan l, h
5 Fonem Konsonan Geseran s
6 Fonem Konsonan Geletar r
7 Fonem Konsonan Semi Vokal w, y
Gugus konsonan (kluster) adalah kumpulan dua buah fonem konsonan atau
lebih yang tedapat dalam satuan suku kata yang tunggal. Batasan ini memberi
ruang lingkup bahwa bila kelompok konsonan itu berada dalam satuan suku kata
yang lain, maka kelompok konsonan ini tidak disebut sebagai gugus konsonan.
Berikut beberapa contoh gugus konsonan dalam bahasa bali.
25
a) Gugus Konsonan /l/
Fonem konsonan ini dapat bergugus dengan fonem konsonan apa saja
selain konsonan sengau dan /y, r, l, w, h/. Distribusi nya hanya terdapat
pada awal dan tengah kata. Contoh pada awal kata antara lain plekor,
blengih, tledu, cluluk dan klungah. Contoh pada tengah kata antara lain
keplug, geblag, potlot dan sukla.
b) Gugus Konsonan /r/
Fonem konsonan ini dapat bergugus dengan kebanyakan fonem konsonan
selain konsonan nasal dan /y, r, l, w, h/. Dengan demikian fonem konsonan
ini mempunyai pasangan yang sama dengan fonem konsonan /l/.
Distribusinya juga dapat di awal dan di tengah kata, tetapi tidak bisa pada
akhir kata. Contoh pada awal kata antara lain pripit, truna, kruna dan
griya. Contoh pada tengah kata antara lain kapri, mantra, asri, bajra dan
sukra.
c) Gugus Konsonan /y/
Gugus konsonan ini terwujud dalam bentuk /by, py, dy, gy, ky/.
Keberadaannya hanya fonem /y/ bisa bergugus dengan konsonan letupan,
baik yang lembut maupun dengan konsonan tajam (bersuara dan dengan
yang tak bersuara). Distribusinya juga tidak selengkap gugus konsonan
sebelumnya. Contoh pada awal kata antara lain byah-byah, pyuh dan dyah.
Contoh pada tengah kata antara lain kebyah, krempyang dan madya.
26
d) Gugus Konsonan yang nasal seaalt (homorgan)
Gugus konsonan nasal terletak di depan sebagai unsur gugus yang
pertama, sedangkan konsonan lain yang diajak bergugus terletak di
belakang nya. Fonem konsonan nasal meliputi fonem konsonan /m, n, ň,
ng/ setiap konsonan itu memiliki pasangan konsonan yang sealat daerah
artikulasi. Contoh penggunaan konsonan nasal antara lain mpak, ntik, ncak
dan ngkah.
e) Gugus Konsonan /w/
Gugus konsonan ini sejalan dengan dengan gugus konsonan /y/. Hal itu
dapat dipahami karena kedua konsonan ini termasuk dalam satu cara
pengucapan yaitu konsonan semivokal. Gugus konsonan /w/ hanya dapat
bergugus dengan konsonan letupan yaitu /pw, bw, tw, dw, kw, gw/.
Contoh pada awal kata antara lain pwara, bwa dan dwi. Contoh pada
tengah kata antara lain tatwa, dadwa dan kekwa.
2.3.1.3 Kode Sampa Fonem Bahasa Indonesia
Bahasa Indonesia secara keseluruhan memiliki 26 jenis alfabet dan 29
jenis fonem. Tidak semua alfabet dalam Bahasa Indonesia memiliki representasi
fonem yang sama. Dalam mesin mbrola fonem akan direpresentasikan dengan
kode sampa fonem, durasi serta pitchnya. Aturan kode sampa fonem bahasa
Indonesia dalam mesin mbrola dapat dilihat seperti berikut.
27
Tabel 2. 4 Tabel Kode Sampa Mbrola Bahasa Indonesia
Fonem Kode Sampa Contoh
p p apab b abangt t atapd d tadik k akang g gilac tS carij dZ jadif f kafans s kasarz z zebrah h hitamm m amann n andang N angkar r armadal l alamatw w baway j bahayany nY kenyanga V bapaê @ petange E medani I bilao Q mohonu U bukanai aI santaioi OI amboiau aU lampau_ _ Jeda
2.3.2 Prosodi
Prosodi adalah perubahan nilai pitch (frekuensi dasar) selama pengucapan
dilakukan atau pitch sebagai fungsi waktu. Informasi pembentuk prosodi berupa
28
data pitch serta durasi pengucapannya untuk setiap fonem yang dibangkitkan.
Prosodi bersifat sangat spesifik untuk setiap bahasa, sehingga model yang
diperlukan untuk membangkitkan data prosodi menjadi sangat spesifik juga untuk
suatu bahasa. Beberapa model umum prosodi pernah dikembangkan, tetapi untuk
digunakan pada suatu bahasa masih perlu banyak penyesuaian yang harus
dilakukan. Dari sudut pandang pendengar, prosodi terdiri dari persepsi dan
pemulihan speaker berdasarkan berikut ini:
a. Pause : Untuk menunjukkan frase dan memisahkan dua kata
b. Pitch : Tingkat siklus lipat vokal sebagai fungsi waktu
c. Rate : durasi fonem dan waktu
d. Loudness : amplitudo relatif atau volume.
Dalam kenyataan nya prosodi tidak hanya tergantung pada konten kata
atau kalimat. Orang yang berbeda menghasilkan prosodi yang berbeda untuk
kalimat yang sama. Bahkan sama orang menghasilkan prosodi yang berbeda
karena dipengaruhi suasana hatinya.
Format penulisan parameter input yang dibutuhkan oleh mesin mbrola adalah:
<fonem> <durasi> <pitch pattern>
Pada format parameter diatas, gabungan antara durasi dan pitch pattern
adalah prosodi yang mengikuti fonem. Durasi merupakan lamanya pengucapan
fonem. Pitch pattern merupakan rangkaian intonasi yang memberikan nada pada
pengucapan fonem. Setiap input dapat terdiri dari rangkaian pitch pattern. Setiap
pitch pattern memiliki dua nilai yaitu durasi pitch dan besarnya frekuensi
29
2.3.3 Database Diphone
Diphone adalah suatu potongan kecil dari ucapan dari pertengahan ucapan
yang satu ke pertengahan ucapan yang lain. Diphone merupakan suara gabungan
dua buah fonem. Pertengahan dari suatu ucapan cenderung merupakan daerah
yang paling stabil secara akustik. Setiap segemen diphone merupakan gabungan
dua buah fonem. Database Diphone Bahasa Indonesia dikembangkan oleh Arry
Akhmad Arman pada tahun 2000 di belgia.
2.4 The Mbrola Project
Mbrola merupakan salah satu aplikasi text to speech yang di prakarsai oleh
TCTS Lab of the Faculté Polytechnique de Mons (Belgium). Proyek mbrola mulai
dikembangkan pada tahun 1996. Website resmi The Mbrola Project adalah di
http://tcts.fpms.ac.be/synthesis/mbrola.html. Update terakhir dari database
mbrola adalah tahun 2005 dan sudah memiliki enam puluh delapan database
diphone dalam berbagai bahasa. Tujuan dari dikembangkannya mbrola adalah
untuk menciptakan sintesis suara dengan pilihan bahasa sebanyak mungkin dan
memberikan secara gratis untuk aplikasi non komersial. Tujuan utama dari mbrola
adalah untuk meningkatkan penelitian akademis tentang sintesis suara dan
terutama pada generasi prosodi yang merupakan salah satu tantangan terbesar
dalam aplikasi text to speech.
Mbrola merupakan sistesis suara yang menggunakan diphone database
sebagai sumber suara. Inputan dari mbrola adalah berupa file berektensi .pho
30
dengan isi data berupa kode sampa durasi dan pitch pattern. Konfigurasi mbrola
pada aplikasi text to speech bahasa Indonesia dapat dilihat pada gambar berikut.
Gambar 2. 1 Konfigurasi IndoTTS (Arry Akhmad Arman, 2000)