BAB II KERANGKA TEORITIK A. Deskripsi Konsep Pada subbab deskripsi konsep ini akan dijelaskan seluruh teori yang berhubungan dengan pengenalan suara. Teori-teori yang akan dijelaskan antara lain mengenai sinyal percakapan, analisis sinyal dengan metode LPC, transformasi Fourier, jaringan saraf tiruan, dan tingkat pengenalan. A.1. Sinyal Percakapan Sinyal dapat didefinisikan sebagai kuantitas fisik yang bervariasi seiring waktu atau variabel bebas lainnya yang menyimpan suatu informasi. 12 Contoh sinyal adalah: suara manusia, kode morse, tegangan listrik di kabel telepon, variasi intensitas cahaya pada sebuah serat optik yang digunakan pada telepon atau jaringan komputer, dan lain-lainnya. 12 M. J. Roberts, Signals and Systems Analysis Using Transform Methods and Matlab , (New York: McGraw-Hill, 2004), h. 1. 12
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
BAB II
KERANGKA TEORITIK
A. Deskripsi Konsep
Pada subbab deskripsi konsep ini akan dijelaskan
seluruh teori yang berhubungan dengan pengenalan suara.
Teori-teori yang akan dijelaskan antara lain mengenai
sinyal percakapan, analisis sinyal dengan metode LPC,
transformasi Fourier, jaringan saraf tiruan, dan
tingkat pengenalan.
A.1. Sinyal Percakapan
Sinyal dapat didefinisikan sebagai kuantitas fisik
yang bervariasi seiring waktu atau variabel bebas
lainnya yang menyimpan suatu informasi.12 Contoh sinyal
adalah: suara manusia, kode morse, tegangan listrik di
kabel telepon, variasi intensitas cahaya pada sebuah
serat optik yang digunakan pada telepon atau jaringan
komputer, dan lain-lainnya.
Sinyal dapat diklasifikasikan menjadi beberapa
jenis yaitu: sinyal waktu kontinyu, sinyal waktu
diskrit, sinyal nilai kontinyu, sinyal nilai diskrit,
12 M. J. Roberts, Signals and Systems Analysis Using Transform Methods and Matlab, (New York: McGraw-Hill, 2004), h. 1.
12
sinyal random, dan sinyal nonrandom.13 Sinyal waktu
kontinyu dengan nama lain sinyal analog adalah sinyal
yang belum melalui proses apapun. Sedangkan sinyal
nilai diskrit atau sinyal digital adalah sinyal analog
yang telah melalui proses sampling, quantization, dan
encoding.
Sampling adalah proses mengambil nilai-nilai
sinyal pada titik-titik diskrit sepanjang variabel
waktu dari sinyal waktu kontinyu, sehingga didapatkan
sinyal waktu diskrit. Jumlah titik-titik yang diambil
setiap detik dinamakan sebagai sampling rate. Dalam
melakukan sampling, perlu diperhatikan kriteria Nyquist
yang menyatakan bahwa sebuah sinyal harus memiliki
sampling rate yang lebih besar dari 2fm, dengan fm
adalah frekuensi paling tinggi yang muncul disebuah
sinyal.14
Quantization adalah proses memetakan nilai-nilai
dari sinyal nilai kontinyu menjadi nilai-nilai yang
diskrit, sehingga didapatkan sinyal nilai diskrit.
Encoding adalah proses mengubah nilai-nilai sinyal
ke menjadi bilangan biner. Pada gambar 2 dapat dilihat
perbedaan antara sinyal analog dengan sinyal digital.
13 Ibid., h. 2.14 Ibid., h. 503.
13
Gambar 2 Diagram Sinyal Analog dan Sinyal DigitalSumber: Lawrence B. Holder, Speech Recognition
(Briefly), http://www.cs.berkeley.edu/~russell/classes/ cs188/s05/slides/chapter15b.pdf, 16 Juni 2005.
Sinyal yang berbentuk digital dapat disimpan dalam
media penyimpanan di komputer. WAV file (berasal dari
kata wave) merupakan format umum yang paling sederhana
untuk menyimpan data sinyal audio. WAV file terdiri
dari 3 potongan informasi yaitu: RIFF chunk, FORMAT
chunk, dan DATA chunk.15 RIFF chunk berisi informasi
yang menandakan bahwa file berbentuk WAV. FORMAT chunk
berisi parameter-parameter seperti jumlah channel,
sample rate, resolusi. DATA chunk yang berisi data
aktual sinyal digital.
Sinyal yang dihasilkan dari suara manusia sewaktu
melakukan percakapan disebut sebagai sinyal percakapan.
Sinyal percakapan merupakan kombinasi kompleks dari
variasi tekanan udara yang melewati pita suara dan
vocal tract, yaitu mulut, lidah, gigi, bibir, dan
15 Mark Csele, WAV File Format Descriptions, http://rti7020.etf.bgac.yu/rti/ir1pp2/domaci/WavFileFormat.html, 25 Maret 2005.
sinyal diskrit, digunakan Discrete Fourier Transform
(DFT) yang didefinisikan sebagai berikut.18
, (11)
DFT menghasilkan serangkaian buah nilai yang
berindeks di dalam domain frekuensi yang merupakan
transformasi dari sinyal domain waktu yang berindeks .
Dari hasil tersebut, dan merupakan
konjugasi kompleks.19 Karena magnitude dari konjugasi
kompleks adalah sama, maka didapatkan
18 Chris Rowden, Speech Processing, (Berkshire: McGraw-Hill, 1992), h. 48.
19 Ibid.
19
untuk bernilai 0 sampai . Dengan demikian, nilai
hasil transformasi dalam domain frekuensi yang
digunakan untuk analisis sinyal hanya nilai yang
berindeks 0 sampai saja.
Untuk mengembalikan sinyal domain frekuensi ke
domain waktu, digunakan persamaan transformasi inverse.
Persamaan DFT inverse didefinisikan sebagai berikut.20
, (12)
A.3.b. FFT
Fast Fourier Transform (FFT) dikembangkan oleh
Cooley dan Tukey pada tahun 1965. Algoritma FFT
merupakan penyederhanaan dari DFT yang memiliki
persyaratan jumlah data harus merupakan bilangan
untuk . Waktu komputasi DFT memiliki
kompleksitas sedangkan FFT memiliki kompleksitas
dengan , sehingga FFT lebih cepat daripada
DFT dengan rasio kecepatan FFT terhadap DFT adalah:21
(13)
seperti yang terhitung pada tabel 1.
20 Ibid., h. 49.21 M. J. Roberts, Op. Cit., h. 553.
20
Tabel 1 Rasio Kecepatan FFT Terhadap DFTSumber: M. J. Roberts, Signals and Systems Analysis Using Transform Methods and Matlab, (New York: McGraw-Hill, 2004), h.554.