95 KỶ YẾU HỘI THẢO KHOA HỌC CITA 2014 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC” KỸ THUẬT NHẬN DẠNG GIỌNG NÓI SỬ DỤNG MÔ HÌNH MARKOV ẨN SPEECH’S REGCONITION USING MARKOV’S MODEL Nguyễn Thế Xuân Long 1 , Mai Lam 2 , Dương Quốc Hoàng Tú 3 123 Trường Cao đẳng Công nghệ thông tin – Đại học Đà Nẵng; Email: [email protected], [email protected], [email protected]Tm tt - Bi ton nhn dng ging ni đ v đang đưc nhiu nh nghiên cu quan tâm v c nhiu phương php đưc đ xut đ gii quyt bi ton ny. Tuy nhiên cho đn nay kt qu mang li vẫn chưa lm hi lòng cc nh nghiên cu do tnh cht phc tp v không c định ca đi tưng nhn dng l ting ni con người. Đặc bit vi ting Vit th kt qu còn nhiu hn ch. Bi bo trnh by mt hưng nhn dng ting ni ting Vit da trên cơ s ca phương php nhn dng mẫu da theo mô hnh Markov n (HMM). T kha -nhn dng ging ni; nhn dng ting Vit, ci thin cht lưng nhn dng ging ni; mô hnh Markov n; phương php nhn dng ging ni. Abstract-Nowadays, speech recognition is familiar and have been interested by many scientists; there are many methods, directions proposed to solve this problem. However, the results of those researchs have not yet satisfied the scientists due to complexity of human voices; especially in Vietnamese’s voices. In this article, we will present one direction to recognize Vietnamese’s voice base on Markov’s model (HMM). Key words -speech recognition; Vietnamese’s voice recognition; improve quality of speech recognition; hidden Markov’s model; speech recognition’s methods 1. Đặt vấn đề Cng vi s pht trin ca ngnh công ngh thông tin, cc h thng t đng đ dn thay th cc công đon ca công vic. Nhn dng ting ni l mt kỹ thut c th đưc ng dng trong rt nhiu lnh vc. Ở Vit Nam, t nhng năm 90 đ c rt nhiu bi bo đ cp vn đ x l nhn dng ting Vit. Tuy nhiên, cc kt qu ny vn còn nhiu hn ch, đ l do s khc bit v ngôn ng văn bn, văn phm câu, cu trc âm v, cch pht âm v ngôn điu… Đ l chưa ni đn chng ta không c sẵn mt cơ s d liu ting Vit đ phong ph đ thc nghim. Đ c rt nhiu mô hnh đưc đ xut đ thc hin như : mô hnh Bayes, Maximum Likelihood Estimation (MLE), mô hnh hn hp phân b Guass (Gausse Markov Model), Gausse Classifier (GC)... Trong khuôn kh bi bo ny, chng tôi trnh by mt th nghim p dng mô hnh Markov ẩn (Hidden Markov Model-HMM)trong vic nhn din ging ni. Phn còn li ca bi bo đưc cu trc như sau. Phn 2 nu mt s kin thc cơ bn v mô hnh Markov ẩn đưc dng trong cc th nghim. Phn 3 trnh by mô hnh th nghim nhn dng âm thanh ting Vit da trên mô hnh Markov ẩn. Cc kt qu đưc trnh by tip sau. Phn cui l kt lun. 2. Cơ sở lý thuyết 2.1. Mô hnh Markov ẩn Mô hnh Markov ẩn (HMM) l mô hnh thng kê trong đ h thng đưc mô hnh ha đưc cho l mt qu trnh Markov vi cc tham s không bit trưc v nhim v l xc đnh cc tham s ẩn t cc tham s quan st đưc, da trên s tha nhn ny. Cc tham s ca mô hnh đưc rt ra sau đ c th s dng đ thc hin cc phân tch k tip, v d cho cc ng dng nhn dng mu. HMM l mt tin trnh ngu nhiên kép, bao gm mt tin trnh ẩn chuyn trng thi theo chui Markov ri rc v thun nht, xen k vi mt tin trnh pht sinh dy quan st. Cc k hiu đưc s dng trong mô hnh Markov ẩn l: N: s trng thi trong mô hnh M: s k hiu quan st c th T: đ di ca dy quan st (hay s k hiu trong dy quan sát) {1, 2, .., N}: tp cc trng thi qt: trng thi ca mô hnh ti thi đim t V = {v1, v2, …, vM}: tp ri rc cc k hiu quan st Π = {π1, π2, …, πN}: tp cc phân b xc sut cho trng thi khi đu, πi l xc sut đ trng thi i đưc chn ti thi đim khi đu t = 1; πi = P(q1 = i); { ∑ =1 =1 ≥ 0; = 1, 2, … , A = {aij}: ma trn xác sut chuyn vi aij là xác sut đ trng thái j xut hin ti thi đim t+1 khi trng thái i đ xut hin ti thi đim t. Githuyt rng aij l đc lp vi thi gian t: aij = P(qt+1 = j/qt = i), { ∑ = 1; = 1,2, … , −1 ≥ 0; = 1,2, … , = { ( )}: cc hm đo xc sut phát xmu, bj(vk) = P(vk đưc phát sinh khi mô hình trng thái j) { ∑ ( ) = 1; = 1,2, … , =1 ( ) ≥ 0; = 1,2, … , ; = 1,2, … , Otbiu th k hiu quan st ti thi đim t. Bba = (, , ) đưc coi là ký pháp gn ca mt mô hình Markov ẩn. A, B v π đưc gi là btham s(parameters) ca mô hnh λ. Hot đng ca HMM có thđưc mô tnhư sau: ti thi đim t = 1, mô hình trng thi q1 no đ v pht sinh ra mt ký hiu quan sát nht
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
95 KỶ YẾU HỘI THẢO KHOA HỌC CITA 2014 “CNTT VÀ ỨNG DỤNG TRONG CÁC LĨNH VỰC”
KỸ THUẬT NHẬN DẠNG GIỌNG NÓI SỬ DỤNG MÔ HÌNH MARKOV ẨN
SPEECH’S REGCONITION USING MARKOV’S MODEL
Nguyễn Thế Xuân Long1, Mai Lam2, Dương Quốc Hoàng Tú3 123Trường Cao đẳng Công nghệ thông tin – Đại học Đà Nẵng;
Tom tăt - Bai toan nhân dang giong noi đa va đang đươc
nhiêu nha nghiên cưu quan tâm va co nhiêu phương phap đươc đê xuât đê giai quyêt bai toan nay. Tuy nhiên cho đên nay kêt qua mang lai vẫn chưa lam hai lòng cac nha nghiên cưu do tinh chât phưc tap va không cô định cua đôi tương nhân dang la tiêng noi con người. Đặc biêt vơi tiêng Viêt thi kêt qua còn nhiêu han chê. Bai bao trinh bay môt hương nhân dang tiêng noi tiêng Viêt dưa trên cơ sơ cua phương phap nhân dang mẫu dưa theo mô hinh Markov ân (HMM).
Tư khoa -nhân dang giong noi; nhân dang tiêng Viêt, cai thiên chât lương nhân dang giong noi; mô hinh Markov ân; phương phap nhân dang giong noi.
Abstract-Nowadays, speech recognition is familiar and have been interested by many scientists; there are many methods, directions proposed to solve this problem. However, the results of those researchs have not yet satisfied the scientists due to complexity of human voices; especially in Vietnamese’s voices. In this article, we will present one direction to recognize Vietnamese’s voice base on Markov’s model (HMM).
Key words -speech recognition; Vietnamese’s voice recognition; improve quality of speech recognition; hidden Markov’s model; speech recognition’s methods
1. Đặt vấn đề
Cung vơi sư phat triên cua nganh công nghê thông tin,
cac hê thông tư đông đa dân thay thê cac công đoan cua
công viêc. Nhân dang tiêng noi la môt kỹ thuât co thê
đươc ưng dung trong rât nhiêu linh vưc. Ở Viêt Nam, tư
nhưng năm 90 đa co rât nhiêu bai bao đê câp vân đê xư ly
nhân dang tiêng Viêt. Tuy nhiên, cac kêt qua nay vân còn
nhiêu han chê, đo la do sư khac biêt vê ngôn ngư văn ban,
văn pham câu, câu truc âm vi, cach phat âm va ngôn
điêu… Đo la chưa noi đên chung ta không co sẵn môt cơ