FAKULTETA ZA ELEKTROTEHNIKO, RAČUNALNIŠTVO IN INFORMATIKO 2000 Maribor, Smetanova ul. 17 Razpoznava govora z usmerjeno nevronsko mrežo Avtorja: Aleš Tetičkovič Simon Klančnik Mentor: izr. prof. dr. Riko Šafarič Somentor: Gregor Pačnik Interdisciplinarna študijska smer Mehatronika
FAKULTETA ZA ELEKTROTEHNIKO, RAČUNALNIŠTVO IN INFORMATIKO 2000 Maribor, Smetanova ul. 17. Razpoznava govora z usmerjeno nevronsko mrežo. Interdisciplinarna študijska smer Mehatronika. Avtorja: Aleš Tetičkovič Simon Klančnik Mentor: izr. prof. dr. Riko Šafarič Somentor: Gregor Pačnik. - PowerPoint PPT Presentation
Welcome message from author
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
FAKULTETA ZA ELEKTROTEHNIKO,RAČUNALNIŠTVO IN INFORMATIKO2000 Maribor, Smetanova ul. 17
Razpoznava govora z usmerjeno nevronsko mrežo
Avtorja:Aleš TetičkovičSimon Klančnik
Mentor:izr. prof. dr. Riko ŠafaričSomentor:Gregor Pačnik
Interdisciplinarna študijska smer Mehatronika
2
Uvod
Na področju prepoznave govora so se v preteklosti oblikovale številne metode.
Prepoznava govora z usmerjeno nevronsko mrežo. Primarni cilj prepoznave govora je vodenje invalidskega
vozička primernega za invalide, ki so hromi od vratu navzdol (tetraplegiki).
Bistven problem pri prepoznavi povzročajo motnje iz okolice.
3
Invalidski voziček
4
Blokovna shema prepoznave govora
5
Izolacija besede
Izolacija besede po metodi izračuna tekočega povprečja in primerjavi z pragovno vrednostjo.
Izolacija besede po metodi izračuna števila prehodov čez nič signala (“zero crossing” metoda).
6
Primerjava rezultatov obeh metod
Metoda izračuna tekočega povprečja
“Zero crossing” metoda
7
LPC kepstralna analiza
Količina podatkov je za prepoznavo z usmerjeno nevronsko mrežo preobsežna.
Metoda temelji na aproksimaciji zvočnega signala kot linearne kombinacije predhodnih zvočnih vzorcev.
Rezultat analize je pretvorba besede v zaporedje točk, kjer vsaka točka pripada 12 dimenzionalnemu LPC kepstralnemu prostoru.
8
Samoorganizirajoča nevronska mreža (SOM)
Primerna za reduciranje dimenzij vhodnega signala. Spada med nevronske mreže s tekmovalnim
načinom učenja. Izhode iz SOM mreže predstavljajo pozicije
zmagovalnih nevronov. Na kakovost reduciranja dimenzij vpliva konfiguracija
SOM mreže. Dosežemo dodatno zmanjševanje količine podatkov
za prepoznavalnik govora.
9
Postopek učenja SOM mreže
1. Iskanje zmagovalnega nevrona:
2. Korekcija uteži nevronov se izvede z naslednjo enačbo:
10
Prikaz rezultatov učenja SOM mreže
Besedi LEVO Besedi DESNO Besedi STOP
11
Usmerjena nevronska mreža
Predstavlja naš prepoznavalnik govora. Spadajo med nevronske mreže z nadzorovanim
postopkom učenja. Osnovni element usmerjene nevronske mreže predstavlja
umetni nevron. Sestavljena iz vhodnega nivoja, enega ali več skritih
nivojev, ter izhodnega nivoja, ki predstavlja rezultate prepoznave.
Za učenje usmerjene nevronske mreže je uporabljeno posplošeno delta pravilo.
12
Umetni nevron
Izračun izhoda iz umetnega nevrona:
o = σ(∑iiwi + b)
13
Zgradba usmerjene nevronske mreže
14
Postopek učenja usmerjene nevronske mreže
Normalizacija dobljenih SOM izhodov na fiksno dolžino (200 koeficientov).