BAB II KAJIAN PUSTAKA - IMISSU Single Sign On of · PDF file · 2017-04-01Synthesis pada tahun 2010 membahas mengenai meningkatkan ekspresivitas Teks ... yakni daun yang masih muda.

9

BAB II

KAJIAN PUSTAKA

2.1 State of the art

Penelitian yang berkaitan dengan text to speech yang telah dilakukan

sebelumnya dengan menggunakan metode pengolahan prosodi dan dengan bahasa

yang berbeda beda adalah sebagai berikut.

O. Al-Dakkak, N. Ghneim, M. Abou Zliekha and S. Al-Moubayed dalam

artikelnya yang berjudul Emotion Inclusion In An Arabic Text-To-Speech pada

tahun 2004 membahas mengenai penerapan satuan emosi dalam text to speech

bahasa arab. Jenis emosi yang digunakan antara lain marah, senang, sedih, takut

dan terkejut. Digunakan masing-masing 20 kalimat dalam setiap emosi yang akan

diukur parameternya. Parameter yang digunakan untuk menentukan emosi antara

main FO Parameter, Durasi Parameter dan Intensitas Parameter. Nilai dari

parameter ini digunakan dalam pembentukan prosodi untuk menciptakan emosi

dan aplikasi text to speech dalam Bahasa Arab.

Iwan Iwut Tritoasmoro dalam artikelnya yang berjudul Text-To-Speech

Bahasa Indonesia Menggunakan Concatenation Synthesizer Berbasis Fonem pada

tahun 2006 membahas mengenai aplikasi text to speech dalam Bahasa Indonesia

dengan menggunakan fonem sebagai unit ucapan. Tiap fonem memiliki tiga

bentuk, yakni fonem di awal suku, fonem di tengah suku, dan fonem di akhir suku.

Kesimpulan dalam penelitian ini adalah hasil dalam implementasi secara umum

dapat mengucapkan seluruh kata dalam Bahasa Indonesia dengan baik dan dapat

10

dimengerti. Namun ucapan sintesis yang dihasilkan belum memiliki pola intonasi

(prosodi) sebagaimana ucapan asli.

Ghadeer Al-Said and Moussa Abdallah dalam artikelnya yang berjudul An

Arabic Text-To-Speech System Based on Artificial Neural Networks pada tahun

2009 membahas mengenai pengembangan aplikasi text to speech dalam Bahasa

Arab dengan menggunakan metode jaringan saraf tiruan. Jaringan saraf tiruan

digunakan dalam tahap presprocesing dimana kata yang sudah dinormalisasi akan

diubah ke dalam bentuk numerik sebelum diproses dalam jaringan saraf tiruan.

Dalam penelitian ini melakukan percobaan pada tiga pilihan model database

antara lain dengan database model kata dengan hasil akurasi 99%, model diphone

dengan hasil akurasi 99% dan model triphone dengan hasil akurasi 86,5%.

M.B.Chandak, Dr.R.V.Dharaskar dan Dr.V.M.Thakre dalam artikelnya

yang berjudul Text to speech Synthesis with Prosody feature: Implementation of

Emotion in Speech Output using Forward Parsing pada tahun 2011 membahas

mengenai pengembangan aplikasi text to speech dalam bahasa inggris dengan

meningkatkan kealamian emosi dengan menggunakan metode forward parsing.

Forward Parsing adalah metode pemindaian teks untuk menentukan berbagai titik

seperti isi teks, konteks teks, frekuensi kata tertentu dalam teks dimana emosi

dalam teks akan terlihat pada konteks teks.

Zhiyong WU, Lianhong CAI, Helen M. MENG pada artikel nya yang

berjudul Modeling Prosody Patterns for Chinese Expressive Text-to-Speech

Synthesis pada tahun 2010 membahas mengenai meningkatkan ekspresivitas Teks

to Speech dalam bahasa mandarin dimana ditemukan bahwa pembicaraan

11

biasanya cenderung lebih menekankan pada satu suku kata tertentu dalam sebuah

kalimat. Berdasarkan lokasi suku kata tersebut dicari kaitan dengan suku kata

sebelumnya, sesudahnya dan suku kata sisanya.

Tabel 2. 1 Penelitian yang Telah Dilakukan Sebelumnya

No Nama Judul Deskripsi

1 O. Al-Dakkak

dkk (2004)

Emotion Inclusion In

An Arabic Text-To-

Speech

Mencari Durasi Parameter dan

Intensitas Parameter dari

beberapa kalimat berbeda emosi

untuk menentukan mencipatakan

prosodi suatu emosi.

2 Iwan Iwut

Tritoasmoro

(2006)

Text-To-Speech Bahasa

Indonesia

Menggunakan

Concatenation

Synthesizer Berbasis

Fonem

Membagi fonem menjadi tiga

bentuk yaitu fonem di awal suku,

fonem di tengah suku, dan fonem

di akhir suku

3 Ghadeer Al-

Said and

Moussa

Abdallah

(2009)

An Arabic Text-To-

Speech System Based

on Artificial Neural

Networks

Tahap presprocesing

menggunakan metode jaringan

saraf tiruan dan dengan

menggunakan tiga model

database antara lain database

model kata, diphone dan triphone

4 M.B.Chandak

dkk (2011)

Text to speech Synthesis

with Prosody feature:

Implementation of

Emotion in Speech

Output using Forward

Parsing

Aplikasi text to speech

meningkatkan kealamian emosi

dengan menggunakan metode

forward parsing.

5 Zhiyong WU Modeling Prosody Meningkatkan ekspresivitas Teks

12

dkk (2010) Patterns for Chinese

Expressive Text-to-

Speech Synthesis

to Speech dalam bahasa mandarin

dengan memperhatikan posisi

suku kata inti dalam satu kalimat.

2.2 Dharma Gita / Gending Bali

Seni suara adalah suatu pernyataan atau gambaran dari jiwa atau perasaan

manusia, yang dinyatakan dalam bentuk deretan nada-nada, baik yang diciptakan

atau dicetak, maupun yang lanjut disuarakan secara vokal maupun instrumental

(Wayan Budha Gautama, 2007). Dharma gita merupakan salah satu bagian dari

Panca Gita yang dinyanyikan pada saat pelaksanaan yadnya. Panca Gita adalah

lima jenis suara atau bunyi yang mengiringi atau menunjang pelaksanaan yadnya.

Bagian dari panca gita antara lain getaran mantram, suara genta, suara kidung,

suara gamelan dan suara kentongan. Dharma gita berasal dari Bahasa Sansakerta

dan terdiri dari dua kata yakni Dharma dan Gita. Dharma artinya

kebenaran/kebaikan, kewajiban, hukum, aturan. Sedangkan Gita artinya nyanyian

atau lagu. Jadi, Dharma gita berarti suatu nyanyian kebenaran yang biasa

dilantunkan saat upacara keagamaan.

2.2.1 Unsur Tangga Nada

Dharma gita atau gending bali pada awalnya dibentuk tangga nada (titi

nada) tangga nada ventatonis (5 nada) yaitu : dang, ding, dong, deng , dung atau

dalam bentuk notasi angka menjadi do (1), mi (3), fa (4), sol (5), si (7) atau dalam

bentuk singkat menjadi a i o e u. Seiring dengan perkembangan jaman banyak

gending bali digubah memakai laras/nada diatonic (7 nada) terutama jenis

13

gending kreasi. Jenis laras/nada ventatonis dapat dibagi menjadi seperti berikut

(Wayan Budha Gautama, 2007).

a. Laras Pelog

Laras pelog adalah nada yang menggunakan patutan gong.

a i o e u = dang ding dong deng dung

1 3 4 5 7 = do mi fa sol si

b. Laras Slendro

Laras slendro adalah nada yang menggunakan patutan gender.

i o e u a = ding dong deng dung dang

1 2 3 5 6 = do re mi sol la

c. Laras Gambangan

Laras pelog adalah nada yang menggunakan patutan gambang.

a ai i o e eu u = dang daing ding dong deng

deung dung

1 1 3 4 5 5 7 = do di mi fa sol

sel si

2.2.2 Jenis Dharma Gita

Berdasarkan sifatnya Dharma gita dapat dibagi menjadi empat bagian sepertit

berikut :

14

2.2.2.1 Sekar Rare / Gegendingan

Sekar Rare adalah sekumpulan kalimat bebas tidak ada ikatan yang

dinyanyikan. Isinya pada umumnya pendek, sederhana dan menggunakan Bahasa

bali lumrah sehingga dapat dilagukan dengan mudah dalam suasana bermain dan

bergembira. Sekar Rare dinyanyikan sesuai dengan suara gong yang lebih banyak

menggunakan laras pelog. Sekar Rare dapat dibedakan menjadi tiga yaitu :

a. Gending Rare

Sifat dari gending rare adalah gembira, lucu, ceria dan bermain-main.

Gending Rare menggunakan patokan nada suara gong atau gender

sehingga dapat menggunakan laras pelog ataupun laras slendro. Contoh

dari Gending Rare antara lain : Goak Maling Taluh, Curik-curik, Sumping

Waluh dan lain-lain.

b. Gending Janger

Gending janger atau jejangeran adalah gending yang dibawakan oleh

penari Janger atau Kecak. Gending Janger dikatakan sebagai bagian dari

sekar rare karena sifat serta patokan nada seperti gending rare yaitu

patokan gong atau gender meskipun pelaku atau penarinya terdiri dari

orang dewasa. Contoh dari gending janger antara lain : Sarikonta, Biu

Kayu, Pangaksama dan lain-lain.

c. Gending Sang Hyang

Kata Sang Hyang pada Gending Sang Hyang berarti mulai atau yang

dimuliakan. Gending Sang Hyang ini dilantunkan pada saat upacara

Agama Hindu oleh penari Sang Hyang yang terdiri dari anak-anak

15

dibawah umur, artinya belum mengalami menstruasi. Selain anak wanita,

ada juga penari Sang Hyang dari anak laki-laki tergantung dari jenis

gending Sang Hyang yang dinyanyikan. Contoh dari gending Sang Hyang

antara lain : Sang Hyang Dedari, Sang Hyang Jaran, Sang Hyang Memedi

dan lain-lain.

2.2.2.2 Sekar Alit / Pupuh

Sekar alit biasa disebut dengan tembang mecepat, geguritan atau pupuh.

Sekar alit memiliki aturan dalam penulisannya yang disebut dengan padalingsa.

Aturan padalingsa pada pupuh antara lain guru wilangan yaitu jumlah suku kata

dalam setiap barisnya, guru dingdong yaitu huruf vokal pada kata terakhir setiap

barisnya dan guru gatra yaitu jumlah baris dalam satu baitnya. Beberapa jenis

pupuh atau Sekar Alit antara lain seperti berikut :

a. Pupuh Mijil

Pupuh Mijil menguraikan suatu nasehat serta dapat juga digubah untuk

melukiskan seseorang yang sedang dimabuk asmara. Padalingsa Pupuh

Mijil adalah seperti berikut, guru gatra terdiri dari 9 baris pada setiap

baris, guru wilangan dan guru gatra adalah 4u, 6i, 6o, 4e, 6e, 4u, 6i, 6i,

8/6u.

b. Pupuh Pucung

Pupuh Pucung menguraikan suatu cerita dongeng atau menyampaikan

suatu kisah atau falsafah agama dan nasehat. Pupuh Pucung memiliki sifat

serta watak kendur maka tidak cocok dipakai untuk melukiskan perasaan

16

yang bersifat semangat. Padalingsa Pupuh Pucung adalah seperti berikut,

guru gatra terdiri dari 6 baris pada setiap baris, guru wilangan dan guru

gatra adalah 4u, 8u, 6a, 8i, 4u, 8a.

c. Pupuh Kumambang

Pupuh Kumambang biasa disebut juga dengan Pupuh Maskumambang.

Kumambang berasal dari kata “kambang” yang berarti menerawang.

Pupuh Kumambang memiliki sifat sedih atau merana. Padalingsa Pupuh

Kumambang adalah seperti berikut, guru gatra terdiri dari 5 baris pada

setiap baris, guru wilangan dan guru gatra adalah 4a, 8i, 6a, 8i, 8a.

d. Pupuh Ginada

Pupuh Ginada meiliki sifat yang melukiskan hati kecewa. Ginada berasal

dari kata ‘gada’ mendapat sisipan ‘in’ menjadi Ginada yang berarti

terpukul dan akhirnya tertimpa oleh kekecewaan yang mendalam.

Padalingsa Pupuh Ginada adalah seperti berikut, guru gatra terdiri dari 7

baris pada setiap baris, guru wilangan dan guru gatra adalah 8a, 8i, 8a/o,

8u, 8a, 4i, 8a.

e. Pupuh Ginanti

Pupuh Ginanti memiliki sifat rasa kasih saying atau rasa cinta. Biasa

digunakan untuk menguraikan suatu filsafah atau cerita yang bernuansa

asmara. Padalingsa Pupuh Ginanti adalah seperti berikut, guru gatra

terdiri dari 6 baris pada setiap baris, guru wilangan dan guru gatra adalah

8u, 8i, 8a, 8i, 8a, 8i.

17

f. Pupuh Semarandana

Pupuh Semarandana biasa bisa disebut juga dengan Semaradahana atau

Asmaradaha (api asmara). Pupuh Semarandana biasa digunakan untuk

melukiskan hati dalam keadaan mabuk asmara. Padalingsa Pupuh

Semarandana adalah seperti berikut, guru gatra terdiri dari 6 baris pada

setiap baris, guru wilangan dan guru gatra adalah 8i, 8a, 8e/o, 8a, 8u, 8a.

g. Pupuh Sinom

Kata “sinom” adalah singkatan dari “sinuam” yang memiliki arti pucuk

yakni daun yang masih muda. Pupuh Sinom biasa dipakai untuk

menyampaikan suatu amanat, nasehat atau percakapan secara bersahabat

dan kekeluargaan. Padalingsa Pupuh Sinom adalah seperti berikut, guru

gatra terdiri dari 10 baris pada setiap baris, guru wilangan dan guru gatra

adalah 8a, 8i, 8a, 8i, 8i, 8u, 8a, 8i, 4u, 8a.

h. Pupuh Durma

Pupuh Durma memiliki sifat keras, sadis atau marah. Pupuh ini biasanya

dipakai untuk melukiskan situasi peperangan atau kekacauan. Padalingsa

Pupuh Durma adalah seperti berikut, guru gatra terdiri dari 7 baris pada

setiap baris, guru wilangan dan guru gatra adalah 12a, 7i, 6a, 7a, 8i, 5i,

7i.

i. Pupuh Pangkur

Pupuh Pangkur memiliki sifat perasaan hati memuncak. Pupuh ini cocok

untuk melukiskan cerita yang mengandung maksud kesungguhan.

Padalingsa Pupuh Pangkur adalah seperti berikut, guru gatra terdiri dari 9

18

baris pada setiap baris, guru wilangan dan guru gatra adalah 8a, 4a, 8i,

8u, 8a, 4a, 8u, 8a, 8i.

j. Pupuh Dandang Gula

Pupuh Dandang Gula memiliki watak yang halus, luwes atau lemas.

Pupuh ini biasa dipakai untuk menyudahi atau menutup suatu cerita.

Padalingsa Pupuh Dandang Gula adalah seperti berikut, guru gatra terdiri

dari 13 baris pada setiap baris, guru wilangan dan guru gatra adalah 4a,

8i, 4a, 8a, 8e, 8u, 8i, 8a, 8u, 8a, 4a, 8i, 8a.

Tabel 2. 2 Daftar Prosodi Sekar Alit

No Nama Pupuh Prosodi

1 2 3 4 5 6 7 8 9 10 11 12 13

1 Pupuh Mijil 4u 6i 6o 4e 6e 4u 6i 6i 8/6u

2 Pupuh Pucung 4u 8u 6a 8i 4u 8a

3 PupuhKumambang

4a 8i 6a 8i 8a

4 Pupuh Ginada 8a 8i 8a/o 8u 8a 4i 8a

5 Pupuh Ginanti 8u 8i 8a 8i 8a 8i

6 PupuhSemarandana

8i 8a 8e/o 8a 8u 8a

7 Pupuh Sinom 8a 8i 8a 8i 8i 8u 8a 8i 4u 8a

8 Pupuh Durma 12a 7i 6a 7a 8i 5i 7i

9 Pupuh Pangkur 8a 4a 8i 8u 8a 4a 8u 8a 8i

10 PupuhDandang

4a 8i 4a 8a 8e 8u 8i 8a 8u 8a 4a 8i 8a

2.2.2.3 Sekar Madya / Kidung

Sekar Madya sering juga disebut dengan istilah kidung yang digunakan

untuk menyebutkan puisi-puisi berbahasa Jawa Kuna, Jawa Tengahan dan Bahasa

Bali Alus. Sekar Madya merupakan jenis lagu pemujaan, umumnya dinyanyikan

19

dalam kaitan ucapara adat maupun agama. Sekar Madya memiliki ciri-ciri seperti

berikut :

a. Mempunyai kawitan, yang terdiri atas : dua (2) pada Tembang Bawak

(pemawak) dan dua (2) pada Tembang Panjang (pemanjang).

b. Ada yang disebut Pengawak, yang terdiri dari dua pada pemawak dan dua

pada pemanjang.

Hukum atau aturan yang terdapat pada Sekar Madya adalah seperti berikut :

a. Memiliki guru wilang, padalingsa dan labuh suara.

b. Purwakanti, yaitu pertautan suara akhir suku kata terdahulu dengan awal

suku kata berikutnya.

c. Pliring dan Wewiletan, Pliring melirik atau melihat pemenggalan suku

kata agar jelas dan tidak terputus-putus pada tengah kata.

d. Pengambilan onek-onekan (ejekan) dua suku kata dan tidak memutuskan

kata dan yang selanjutnya disambung.

e. Saptawindu dan Sutrasuara adalah teknik memperpanjang dan

mempendek suara.

Jenis-jenis kidung beserta kegunaannya dapat dibagi seperti berikut :

a. Kidung Wargasari, dipergunakan untuk iringan Upacara Dewa Yadnya

b. Kidung Asti, kidung Aji kembang dan sejenisnya dipergunakan untuk

iringan Upacara Pitra Yadnya.

c. Kidung Rarawangi, Kidung Palugangsa dan sejenisnya dipergunakan

sebagai iringan Upacara Rsi Yadnya.

20

d. Kidung Tantri, Kidung Malat dan Kidung Wilet dipergunakan sebagai

iringan Upacara Manusa Yadnya

e. Kidung Jerum dan Kidung Alis-alis Ijo dipergunakan sebagai iringan

Upacara Butha Yadnya

2.2.2.4 Sekar Agung / Kekawin

Kata Kekawin berasal dari kata “kawi” Yang artinya karangan, mendapat

reduplikasi (dwipurwa) ‘ka’ serta akhiran ‘an’ sehingga menjadi Kekawin yang

artinya aneka ragam atau aneka warna hasil karangan. Istilah-istilah dalam

Kekawin antara lain seperti berikut :

a. Wretta Matra

Wretta artinya suku kata yang membentuk kalimat atau jumlah suku kata

yang membentuk kalimat. Matra artinya ukuran atau letak. Wretta Matra

memiliki pengertian hubungan antara jumlah suku kata pada setiap kalimat

dan guru lagu yang memberikan perbedaan wirama yang dihasilkan.

b. Guru dan Lagu

Guru artinya suara berat, panjang, besar, bergetara dan berliku-liku.

Lagu artinya suara ringan, suara pendek, datar atau lemah.

c. Gana Matra

Gana Matra adalah letak guru dan lagu di dalam suatu kalimat pada satu

bait dari sebuah kekawin.

21

d. Purwa Kanti

Purwa kanti adalah pertauatan suara pada akhir kata dengan awal kata

berikutnya di dalam satu kalimat atau pertauatan akhir lata dengan awal

kata pada bait berikutnya.

2.3 Text to speech

Text to speech adalah sebuah program berbasis komputer dimana sistem

memproses teks dan membacanya. Perbedaan sistem text to speech dengan talking

machine biasa adalah keotomatisannya dalam mengucapkan kata-kata baru karena

sumber dari text to speech adalah berupa inputan teks (Iwan Iwut Tritoasmoro,

2006). Secara garis besar sistem Text to speech melakukan dua proses konversi,

yaitu konversi teks ke fonem dan konversi fonem ke ucapan, yang dilakukan

secara berurutan dengan input teks dan menghasilkan output ucapan.

2.3.1 Fonem

Fonem merupakan satuan bunyi bahasa yang terkecil yang dapat

membedakan makna. Cabang ilmu bahasa yang mempelajari satuan-satuan bunyi

bahasa yang terkecil yang membedakan makna itu disebut fonetik (phonemics)

dan sering pula disebut fonologi (phonology) (I Nyoman Sulaga dkk, 1996).

Bunyi-bunyi bahasa yang merupakan satuan bunyi terkecil memiliki fungsi

tersendiri dalam membedakan arti dan bunyi yang disebut dengan satuan bunyi

yang fungsional. Secara umum fonem dapat dibedakan menjadi dua antara lain

fonem segmental dimana fonem ini jelas terdengar ruasnya berupa bunyi dan

22

fonem suprasegmental dimana bunyi-bunyi yang sering ditulis dengan tanda baca

seperti diatas huruf atau disebelah kana huruf. Fonem bahasa bali sampai saat ini

hanya memiliki fonem segmental, sedangkan fonem suprasegmental yang berupa

tekanan, nada, perpanjangan dan jeda diaangap tidak ada karena kehadiran fonem

suprasegmental tersebut tidak bisa membedakan makna.

2.3.1.1 Fonem Vokal Bahasa Bali

Jumlah fonem vokal dalam bahasa bali berjumlah enam buah yaitu /i, e, a,

ê, u, o/. Fonem vokal bahasa bali hanya berupa fonem vokal tunggal sebab fonem

vokal yang berupa diftong (diphtong), yaitu gabungan dua vokal tunggal yang

memiliki puncak kenyaringan yang tunggal tidak ditemukan dalam bahasa bali.

Bahasa Indonesia mempunyai diftong yang cukup banyak seperti dalam kata

kerbau, danau, santai, balai dan sebagainya. Dalam bahasa bali kata-kata bahasa

Indonesia seperti diatas ditemukan dalam bentuk yang tidak berdiftong. Kata-kata

dalam bahasa bali akan menjadi kebo, dano, sante dan bale yang memiliki artis

sama persis dengan bahasa Indonesia. Namun tidak semua vokal rangkap itu

disebut dengan diftong. Ciri diftong yang utama adalah cara pengucapannya yang

terbentuk dari peluncuran satu vokal ke vokal lain yang membentuk satu puncak

kenyaringan. Bila vokal rangkap itu memiliki dua rangkap kenyaringan, maka

vokal rangkap itu bukan merupakan diftong. Contoh kata yang mempunyai vokal

rangkap tapi bukan merupakan diftong antara lain kauk, gauk, lait, maid dan rai.

23

Distribusi fonem vokal bahasa bali dapat dirumuskan seperti berikut :

a) Fonem vokal /i, e, u, o / memiliki distribusi yang lengkap bisa ditempatkan

di awal, ditengah dan di akhir kata.

b) Fonem vokal /a/ hanya memiliki distribusi di awal dan tengah kata. Kata-

kata bahasa bali tidak pernah berakhiran dengan fonem vokal /a/, kecuali

dialek bahasa bali aga dan kata serapan seperti wisata, Honda, pespa dan

aqua. Dialek bali aga justru tidak mempunyai kata-kata yang berakhir

dengan fonem vokal /ê/.

c) Fonem vokal /ê/ belum ditemukan mempunyai posisi pada awal kata atau

sangat langka sehingga sulit menemukan contohnya, tetapi pada posisi

tengah dan akhir cukup banyak kata yang didapatkan.

2.3.1.2 Fonem Konsonan Bahasa Bali

Fonem konsonan adalah suara yang pada saat udara keluar (dari paru-paru)

sebagian besar atau sepenuhnya mendapat hambatan. Oleh karena itu fonem

konsonan kadar kenyaringannya sangat kecil bila dibandingkan dengan fonem

vokal, hal ini menyebabkan fonem konsonan hampir tidak pernah menjadi puncak

suatu kata (I Nyoman Sulaga dkk, 1996).

Wujud alofon fonem konsonan bahasa bali tidak sejenis dengan fonem

vokal sehingga hampir kebanyakan fonem konsonan bahasa bali dianggap tidak

memiliki alofon. Alofon (alophone) adalah wujud fonem yang sesungguhnya

dalam lingkungan bunyi, alofon inilah yang merupakan wujud konkret sebuah

24

fonem. Distribusi fonem konsonan bahasa bali dapat dibagi menjadi seperti berikut

(I Nyoman Sulaga dkk, 1996).

a) Fonem konsonan letupan, sengau, sampingan, geseran dan geletar

memiliki distribusi yang lengkap. Artinya fonem itu dapat berposisi pada

awal, tengah dan akhir.

b) Fonem konsonan paduan dan semi vokal hanya memiliki distribusi pada

awal dan tengah kata, tidak bisa pada akhir kata.

c) Fonem konsonan sampingan /h/, semi vokal /y/, konsonan sengau /ng, n/

agak langka contoh datanya pada distribusi awal.

Tabel 2. 3 Tabel Distribusi Fonem Konsonan Bahasa Bali

No Nama Distribusi Fonem Konsonan Fonem Konsonan

1 Fonem Konsonan Letupan b, p, d, t, g, k

2 Fonem Konsonan Paduan c, j

3 Fonem Konsonan Sengau m, n, ň, ng

4 Fonem Konsonan Sampingan l, h

5 Fonem Konsonan Geseran s

6 Fonem Konsonan Geletar r

7 Fonem Konsonan Semi Vokal w, y

Gugus konsonan (kluster) adalah kumpulan dua buah fonem konsonan atau

lebih yang tedapat dalam satuan suku kata yang tunggal. Batasan ini memberi

ruang lingkup bahwa bila kelompok konsonan itu berada dalam satuan suku kata

yang lain, maka kelompok konsonan ini tidak disebut sebagai gugus konsonan.

Berikut beberapa contoh gugus konsonan dalam bahasa bali.

25

a) Gugus Konsonan /l/

Fonem konsonan ini dapat bergugus dengan fonem konsonan apa saja

selain konsonan sengau dan /y, r, l, w, h/. Distribusi nya hanya terdapat

pada awal dan tengah kata. Contoh pada awal kata antara lain plekor,

blengih, tledu, cluluk dan klungah. Contoh pada tengah kata antara lain

keplug, geblag, potlot dan sukla.

b) Gugus Konsonan /r/

Fonem konsonan ini dapat bergugus dengan kebanyakan fonem konsonan

selain konsonan nasal dan /y, r, l, w, h/. Dengan demikian fonem konsonan

ini mempunyai pasangan yang sama dengan fonem konsonan /l/.

Distribusinya juga dapat di awal dan di tengah kata, tetapi tidak bisa pada

akhir kata. Contoh pada awal kata antara lain pripit, truna, kruna dan

griya. Contoh pada tengah kata antara lain kapri, mantra, asri, bajra dan

sukra.

c) Gugus Konsonan /y/

Gugus konsonan ini terwujud dalam bentuk /by, py, dy, gy, ky/.

Keberadaannya hanya fonem /y/ bisa bergugus dengan konsonan letupan,

baik yang lembut maupun dengan konsonan tajam (bersuara dan dengan

yang tak bersuara). Distribusinya juga tidak selengkap gugus konsonan

sebelumnya. Contoh pada awal kata antara lain byah-byah, pyuh dan dyah.

Contoh pada tengah kata antara lain kebyah, krempyang dan madya.

26

d) Gugus Konsonan yang nasal seaalt (homorgan)

Gugus konsonan nasal terletak di depan sebagai unsur gugus yang

pertama, sedangkan konsonan lain yang diajak bergugus terletak di

belakang nya. Fonem konsonan nasal meliputi fonem konsonan /m, n, ň,

ng/ setiap konsonan itu memiliki pasangan konsonan yang sealat daerah

artikulasi. Contoh penggunaan konsonan nasal antara lain mpak, ntik, ncak

dan ngkah.

e) Gugus Konsonan /w/

Gugus konsonan ini sejalan dengan dengan gugus konsonan /y/. Hal itu

dapat dipahami karena kedua konsonan ini termasuk dalam satu cara

pengucapan yaitu konsonan semivokal. Gugus konsonan /w/ hanya dapat

bergugus dengan konsonan letupan yaitu /pw, bw, tw, dw, kw, gw/.

Contoh pada awal kata antara lain pwara, bwa dan dwi. Contoh pada

tengah kata antara lain tatwa, dadwa dan kekwa.

2.3.1.3 Kode Sampa Fonem Bahasa Indonesia

Bahasa Indonesia secara keseluruhan memiliki 26 jenis alfabet dan 29

jenis fonem. Tidak semua alfabet dalam Bahasa Indonesia memiliki representasi

fonem yang sama. Dalam mesin mbrola fonem akan direpresentasikan dengan

kode sampa fonem, durasi serta pitchnya. Aturan kode sampa fonem bahasa

Indonesia dalam mesin mbrola dapat dilihat seperti berikut.

27

Tabel 2. 4 Tabel Kode Sampa Mbrola Bahasa Indonesia

Fonem Kode Sampa Contoh

p p apab b abangt t atapd d tadik k akang g gilac tS carij dZ jadif f kafans s kasarz z zebrah h hitamm m amann n andang N angkar r armadal l alamatw w baway j bahayany nY kenyanga V bapaê @ petange E medani I bilao Q mohonu U bukanai aI santaioi OI amboiau aU lampau_ _ Jeda

2.3.2 Prosodi

Prosodi adalah perubahan nilai pitch (frekuensi dasar) selama pengucapan

dilakukan atau pitch sebagai fungsi waktu. Informasi pembentuk prosodi berupa

28

data pitch serta durasi pengucapannya untuk setiap fonem yang dibangkitkan.

Prosodi bersifat sangat spesifik untuk setiap bahasa, sehingga model yang

diperlukan untuk membangkitkan data prosodi menjadi sangat spesifik juga untuk

suatu bahasa. Beberapa model umum prosodi pernah dikembangkan, tetapi untuk

digunakan pada suatu bahasa masih perlu banyak penyesuaian yang harus

dilakukan. Dari sudut pandang pendengar, prosodi terdiri dari persepsi dan

pemulihan speaker berdasarkan berikut ini:

a. Pause : Untuk menunjukkan frase dan memisahkan dua kata

b. Pitch : Tingkat siklus lipat vokal sebagai fungsi waktu

c. Rate : durasi fonem dan waktu

d. Loudness : amplitudo relatif atau volume.

Dalam kenyataan nya prosodi tidak hanya tergantung pada konten kata

atau kalimat. Orang yang berbeda menghasilkan prosodi yang berbeda untuk

kalimat yang sama. Bahkan sama orang menghasilkan prosodi yang berbeda

karena dipengaruhi suasana hatinya.

Format penulisan parameter input yang dibutuhkan oleh mesin mbrola adalah:

<fonem> <durasi> <pitch pattern>

Pada format parameter diatas, gabungan antara durasi dan pitch pattern

adalah prosodi yang mengikuti fonem. Durasi merupakan lamanya pengucapan

fonem. Pitch pattern merupakan rangkaian intonasi yang memberikan nada pada

pengucapan fonem. Setiap input dapat terdiri dari rangkaian pitch pattern. Setiap

pitch pattern memiliki dua nilai yaitu durasi pitch dan besarnya frekuensi

29

2.3.3 Database Diphone

Diphone adalah suatu potongan kecil dari ucapan dari pertengahan ucapan

yang satu ke pertengahan ucapan yang lain. Diphone merupakan suara gabungan

dua buah fonem. Pertengahan dari suatu ucapan cenderung merupakan daerah

yang paling stabil secara akustik. Setiap segemen diphone merupakan gabungan

dua buah fonem. Database Diphone Bahasa Indonesia dikembangkan oleh Arry

Akhmad Arman pada tahun 2000 di belgia.

2.4 The Mbrola Project

Mbrola merupakan salah satu aplikasi text to speech yang di prakarsai oleh

TCTS Lab of the Faculté Polytechnique de Mons (Belgium). Proyek mbrola mulai

dikembangkan pada tahun 1996. Website resmi The Mbrola Project adalah di

http://tcts.fpms.ac.be/synthesis/mbrola.html. Update terakhir dari database

mbrola adalah tahun 2005 dan sudah memiliki enam puluh delapan database

diphone dalam berbagai bahasa. Tujuan dari dikembangkannya mbrola adalah

untuk menciptakan sintesis suara dengan pilihan bahasa sebanyak mungkin dan

memberikan secara gratis untuk aplikasi non komersial. Tujuan utama dari mbrola

adalah untuk meningkatkan penelitian akademis tentang sintesis suara dan

terutama pada generasi prosodi yang merupakan salah satu tantangan terbesar

dalam aplikasi text to speech.

Mbrola merupakan sistesis suara yang menggunakan diphone database

sebagai sumber suara. Inputan dari mbrola adalah berupa file berektensi .pho

30

dengan isi data berupa kode sampa durasi dan pitch pattern. Konfigurasi mbrola

pada aplikasi text to speech bahasa Indonesia dapat dilihat pada gambar berikut.

Gambar 2. 1 Konfigurasi IndoTTS (Arry Akhmad Arman, 2000)

BAB II KAJIAN PUSTAKA - IMISSU Single Sign On of · PDF file · 2017-04-01Synthesis pada tahun 2010 membahas mengenai meningkatkan ekspresivitas Teks ... yakni daun yang masih muda.

Documents