UVOD Jezička komunikacija je funkcija specifična za čoveka kao vrstu. U svakodnevnoj komunikaciji pažnju obraćamo gotovo isključivo na sadržaj onoga što saopštavamo ili primamo, ali ne i na način kako to radimo. Upravo zbog te lakoće kojom korisitmo jezik čini nam se da je u pitanju jednostavan proces. U svom osnovnom, prirodnom obliku, jezik se realizuje kroz govor koji predstavlja akustički signal proizveden govornim organima, a prima se putem auditivnog aparata, što može nas može uputiti na zaključak da se percepcija govornog signala može svesti na iste one procese koji su prisutni prilikom percepcije bilo kog akustičkog događaja. Specifičnost produkcije, percepcije i razumevanja govora, međutim, navela je neke autore na pretpostavku da je reč o jednoj posebnoj vrsti percepcije, koja može da se shvati kao zaseban model auditivne percepcije. Percepcija govora je zapravo složena kognitivna aktivnost interpretacije i razumevanja zvučnih signala koji čine jedan jezik. Sam proces percepcije govora počinje na nivou detekcije zvučnog signala, koji se dalje procesuira kako bi se izdvojile njegove akustičke i fonetičke informacije, koje se zatim mogu koristiti za više jezičke procese poput prepoznavanja reči. Iako u svakodnevnoj govornoj konverzaciji sa lakoćom prepoznajemo poruke koje pristižu do nas, kognitivni procesi koji se nalaze u pozadini razumevanja govora veoma su složeni. Sam zvučni signal nosi u sebi veliki broj informacija, tako da odrasla osoba bez većih teškoća može odrediti položaj u prostoru osobe koja govori, njen pol, dijalekt, emotivno stanje, starost.. Uporedo sa ovim akustičkim obrascima slušalac percipira i značenje onoga što druga osoba govori, što predstavlja glavni predmet izučavanja percepcije govora, tj. na koji način akustički obrasci evociraju opažanje i razumevanje jezičkih poruka. Izučavanje govorne percepcije u bliskoj je vezi sa poljem fonetike u lingvistici, kao i sa kognitivnom psihologijom i psihologijom opažanja. Istraživači koji se bave percepcijom govora bili su uglavnom fokusirani na otkrivanje veza između karakteristika akustičkog signala i jezičkih elemenata poput fonema i njihovih distinktivnih osobina. Ispostavilo se da je ovo dosta složen zadatak, tako da jedno sveobuhvatno objašnjenje o tome kako prepoznajemo vokale i
15
Embed
Percepcija Govora Kao Posebna Perceptivna Aktivnost
This document is posted to help you gain knowledge. Please leave a comment to let me know what you think about it! Share it to your friends and learn new things together.
Transcript
UVOD
Jezička komunikacija je funkcija specifična za čoveka kao vrstu. U svakodnevnoj
komunikaciji pažnju obraćamo gotovo isključivo na sadržaj onoga što saopštavamo ili primamo,
ali ne i na način kako to radimo. Upravo zbog te lakoće kojom korisitmo jezik čini nam se da je u
pitanju jednostavan proces. U svom osnovnom, prirodnom obliku, jezik se realizuje kroz govor
koji predstavlja akustički signal proizveden govornim organima, a prima se putem auditivnog
aparata, što može nas može uputiti na zaključak da se percepcija govornog signala može svesti
na iste one procese koji su prisutni prilikom percepcije bilo kog akustičkog događaja.
Specifičnost produkcije, percepcije i razumevanja govora, međutim, navela je neke autore na
pretpostavku da je reč o jednoj posebnoj vrsti percepcije, koja može da se shvati kao zaseban
model auditivne percepcije.
Percepcija govora je zapravo složena kognitivna aktivnost interpretacije i razumevanja
zvučnih signala koji čine jedan jezik. Sam proces percepcije govora počinje na nivou detekcije
zvučnog signala, koji se dalje procesuira kako bi se izdvojile njegove akustičke i fonetičke
informacije, koje se zatim mogu koristiti za više jezičke procese poput prepoznavanja reči.
Iako u svakodnevnoj govornoj konverzaciji sa lakoćom prepoznajemo poruke koje
pristižu do nas, kognitivni procesi koji se nalaze u pozadini razumevanja govora veoma su
složeni. Sam zvučni signal nosi u sebi veliki broj informacija, tako da odrasla osoba bez većih
teškoća može odrediti položaj u prostoru osobe koja govori, njen pol, dijalekt, emotivno stanje,
starost.. Uporedo sa ovim akustičkim obrascima slušalac percipira i značenje onoga što druga
osoba govori, što predstavlja glavni predmet izučavanja percepcije govora, tj. na koji način
akustički obrasci evociraju opažanje i razumevanje jezičkih poruka.
Izučavanje govorne percepcije u bliskoj je vezi sa poljem fonetike u lingvistici, kao i sa
kognitivnom psihologijom i psihologijom opažanja. Istraživači koji se bave percepcijom govora
bili su uglavnom fokusirani na otkrivanje veza između karakteristika akustičkog signala i
jezičkih elemenata poput fonema i njihovih distinktivnih osobina. Ispostavilo se da je ovo dosta
složen zadatak, tako da jedno sveobuhvatno objašnjenje o tome kako prepoznajemo vokale i
suglasnike još uvek izmiče. Potraga za jednim takvim objašnjenjem dovela je do formiranja dve
glavne teorijske perspektive o percepciji govora koje obuhvataju većinu empirijske građe –
motorna teorija percepcije govora i generalna auditivna teorija percepcije govora.
JEDINICE GOVORNE PERCEPCIJE
U lingvističkom smislu, osnovna jedinica u govornoj komunikaciji je fonema, glas čijom
se zamenom u datoj reči menja njeno značenje. Recimo, zamenom glasa s u reči pesak glasom š,
dobijamo novu reč pešak. Većina postojećih modela razumevanja jezika polazi od pretpostavke
da se akustički signali prevode u neku vrstu posrednih jedinica koje se zatim koriste da bi se
pristupilo rečima koje čine jezički leksikon. Uprkos neslaganjima oko toga da li ulogu ovih
posrednih jedinica preuzimaju foneme, slogovi ili cele reči, veliki broj istraživača fokusiran je na
mapiranje akustičnih signala i njihovo preslikavanje u fonetske jedinice i fonetske kategorije.
Velika varijabilnost, inherentna akustičnom signalu, jeste ono što proces percepije govora
čini izuzetno kompleksnim. Slušalac se suočava sa izazovom prevođenja visoko varijabilnog
akustičnog signala u jedinice govora. Ova varijabilnost proizilazi iz više izvora.
Fluentnost kojom neka osoba govori utiče na karakteristike zvučnog signala koji dopire
do slušaoca. Ukoliko pođemo od analize govora u svakodnevnoj komunikaciji, mogli bismo
zaključiti da se prilikom produkcije govora pojedinačni glasovi javljaju sukcesivno kao diskretne
jedinice, na isti način na koji se slova sukcesivno nižu u tekstu. Pregledom spektrograma se
zapravo može utvrditi da između pojedinačnih glasova ne postoji oštra granica, već da se uticaj i
trajanje jednog glasa prostire u polje drugog glasa. U proseku, osoba izgovori 10-15 glasova u
sekundi, dok se ove vrednosti mogu udvostručiti prilikom brzog govora. Kod fluentnog govora
dolazi do preklapanja, istovremene realizacije nekoliko glasova, fenomena poznatog kao
koartikulacija. Usled koartikluacije svaki pojedinačni deo akustičkog signala sadrži informacije
o više različitih vokala i suglasnika. Drugim rečima, fizičke karakteristike glasa će u velikoj meri
zavisiti od susednih glasova, što znači da postoji varijabilnost uslovljena kontekstom. Na primer,
izgled akustičkog zapisa suglasnika /t/ u reči „trn“ u velikoj meri je pod uticajem toga da li mu
prethodi npr. reč „ceo“ ili npr. reč „crn“, kao „ceo trn“ ili „crn trn“. Kao posledica različitih
položaja jezika prilikom izgovaranja sintagmi „crn trn“ i „ceo trn“, formiraće se i dva različita
akustička zapisa suglasnika /t/ u zavisnosti od konteksta. Jedan od problema s tim u vezi jeste
kako perceptivni sistem prepoznaje funkcionalnu jednakost između ova dva akustički različita
glasa /t/.
„crn trn“
„ceo trn“
Ovu kontekstom uslovljenu varijabilnost Liberman i saradnici ilustrovali su
spektrogramom dvoformantnih obrazaca koje slušaoci prepoznaju kao slogove /di/ i /du/.
Formanti su energetske koncentracije na određenim frekvencijskim opsezima, i imaju dve glavne
karakteristike, formantske tranzicije (porast ili pad frekvencije u okviru datog fomanta) i stabilno
stanje formanta. Kod sloga /di/ frekvencija drugog formanta je oko 2,4 kHz, dok je kod sloga
/du/ 1,2 kHz. Ono što je zanimljivo jeste razlika u tranziciji drugog formanta. Dok kod sloga /di/
uočavamo porast porast frekvencije na početku drugog formanta, kod sloga /du/ imamo pad
frekvencije na početku drugog formanta. Iako se počeci drugog formanta dosta razlikuju, u oba
slučaja čujemo d.
Pored koartikulacije, ritam kojim osoba govori, njen akcenat, emocionalno stanje,
akustične osobine prostora u kome se govornik nalazi, takođe su izvori varijablinosti akustičkog
signala. Jedan od najvećih izazova sa kojim se susrećemo pri pokušaju razumevanja procesa
percepcije govora jeste na koji način identifikujemo pravo značenje onoga što govornik
namerava da nam saopšti i pored toga što mnogobrojni izvori varijabilnosti utiču na sam
akustički signal. Uprkos visokoj varijabilnosti karakteristika pojedinačnih glasova, mi i dalje
čujemo određeni glas, tj. fonemu, a ne varijacije akustičkog signala. Očigledno je da su
mehanizmi odgovorni za detektovanje govornih signala dosta složeniji od mehanizama
odgovornih za obradu negovornih auditivnih stimulusa, na osonovu čega bi se moglo zaključiti
da je percepcija govora posebna vrsta percepcije. U prilog shvatanju da je percepcija govora
posebna vrsta percepcije govore i nalazi istraživanja koji pokazuju da je diskriminacija govornog
signala daleko bolja od diskriminacije sukcesivno prikazanih šumova i tonova, materijala koji
nije govorni signal. Da bismo bili u stanju da odredimo redosled izlaganja nejezičkih stimulusa,
njihovo trajanje ne sme da bude kraće od 650 ms. Sa druge strane, govor je razumljiv i kada u
sekundi imamo 20 sukcesivno izloženih glasova, 50 ms po glasu (Warren, Obusek, Farmer i
Warren, 1967).
Kategorijalna percepcija
Kategorijalnaa percepcija je možda najpoznatiiji obrazac percepcije govora. Iako se
akustičke karakteristike govornog signala postepeno menjaju tokom jedne serije, obrasci po
kojima slušalac identifikuje ove signale menjaju se naglo, ne postepeno. Ova funkcija oštrog,
naglog razlikovanja jedno je od obeležja kategorijalne percepcije. Konkretno, kada je reč o
nejezičkim stimulusima, diskriminacija je, bez obzira na modalitet, kontinuirana. U stanju smo
da uočimo fine prelaze u boji, jačini i kvalitetu tona ili boje, pri čemu kontinuirana promena
datog atributa ne dovodi do nagle promene percepta. Kada je reč o diskriminaciji glasova,
variranje pojedinih parametara izaziva nagle promene u perceptu, na šta ukazuju nalazi
eksperimenta Pizonija, u kome je variran početak zvučnosti dva konsonanta (Pisoni, 1978). U
spektografskoj analizi moguće je uočiti razliku između zvučnog ba i bezvučnog pa, koja se
ogleda u vremenu proteklom između vremena propuštanja vazdušne struje i trenutka kada glasne
žice počnu da vibriraju. Kod zvučnog ba glasne žice počnu da vibriraju u trenutku propuštanja
vazdušne struje, dok kod bezvučnog pa vibracija glasnih žica počinje s određenim zakašnjenjem.
Pokazalo se da ako početak zvučnosti ( VOT – voice onset time) iznosi 0 ms ispitanici uvek čuju
ba, a ako iznosi 40 ms, čuju pa. Dakle, sve do 40 ms čuje se ba, a onda se odjednom percept
menja i čuje se pa. Druga karakteristika kategorijalne percepcije jeste postojanje obrazaca po
kojima se vrši diskriminacija duž jedne serije. Kada se slušaocima prezentuje par stimulusa
izvučenih iz serije, dobija se diskontinuirana funkcija diskriminacije stimulusa. Dok je
diskriminacija slaba kada je reč o parovima stimulusa koji su jednako distinktivni po svojim
akustičkim karakteristikama, ali se nalaze na istom polu granice identifikacije, diskriminacija
stimulusa koji se nalaze na suprotnim polovima je gotovo savršena. Poslednja karakteristika
kategorijalne percepcije jeste da se učinak u diskriminaciji govornog signala može predvideti na
osnovu učinka u identifikaciji govornog signala. Sve ove karakteristike impliciraju da je
diskriminativnost unutar govorne percepcije blisko povezana sa prisustvom ili odsustvom
funkcionalnih razlika između zvukova.
Kategorijalna percepcija nije isključivo karakteristika procesa percepcije govora. Prisutna
je takođe i u percepciji ljudskog lica i facijalnih ekspresija, muzike, kao i u percepciji veštačkih
stimulusa koje ispitanici uče da kategorišu u laboratorijskim uslovima. Pored toga, prisustvo
kategorijalne percepcije zapaženo je i u ponašanju životinja. Kategorijalna percepcija je opšta
karakteristika načina na koji perceptivni sistem reaguje na pravilnosti u našem okruženju.
Uticaji iz drugih izvora informacija
Mapiranje akustičkog govornog signala i prevođenje u njegovu fonetsku reprezentaciju je
veoma kompleksan proces i može biti pod uticajem lingvističkih informacija višeg reda, poput
poznavanja značenja reči unutar jednog jezika. Pored toga, na proces percepcije govora može
uticati i vizualni modalitet, tačnije informacije koje dobijamo posmatrajući lice osobe koja
govori. Klasičan primer ovog uticaja jeste Mek Gurkov efekat. Mek Gurkov efekat je čulni
fenomen koji podrazumeva interakciju čula sluha i percepcije govora.Iluzija koja nastaje rezultat
je uparivanja auditivne komponente jednog glasa sa vizuelnom komponentom drugog glasa, pri
čemu se najčešće čuje treći glas. Vizuelna informacija o osbi koja govori utiče na način na koji
čujemo glas. Efekat se objašnjava kognitivnim naporom da se sve informacije obrade i
analiziraju, a kako su informacije koje dolaze oprečne, vizuelna percepcija ima jači uticaj i
dobija se kombinovani rezultat u vidu trećeg glasa. Snaga efekta je takva da se i istraživači koji
se bave ovom temom, svesni ove pojave, ponekad ne mogu otrgnuti efektu.
Sinhronizovanost između vizuelne informacije koju dobijamo posmatrajući lice osobe
koja govori i akustičkog signala, od velikog je značaja prilikom percepcije govora. Govor koji se
prezentuje u uslovima buke ili pozadinskog šuma, na primer, u mnogo većoj meri je razumljiviji
ukoliko posmatramo i lice onoga koji govori.
Jedno od važnih pitanja jeste na koji način perceptivni sistem integriše vizuelne i
akustičke informacije prilikom percepcije govora. Važan teorijski problem jeste pitanje stepena u
kojem je audio-vizuelna percepcija govora rezultat integracije dve vrste informacija koje dele
zajednički izvor, ili je ta percepcija posledica učenja o prirodnoj povezanosti auditivnih i
vizuelnih signala. Ova pitanja su važna kada je reč o pravljenju razlike između postojećih
teorijskih modela percepcije govora.
TEORIJE PERCEPCIJE GOVORA
MOTORNA TEORIJA PERCEPCIJE GOVORA
Početkom 50-ih godina prošlog veka, Alvin Liberman, Frenklin Kuper i drugi istraživači
Hoskinsove laboratorije izveli su seriju istraživanja na temu perpcepcije sintetizovanog govora.
Njihov rad postavio je temelje onoga što znamo o akustičkim kakteristikama lingvističkih
jedinica, poput fonema, i otkrio da je prevođenje govornih signala u jedinice jezika dosta
kompleksan proces. Liberman i njegovi saradnici su vremenom postali uvereni da percipirane
foneme i funkcije imaju jednostavniji, gotovo jedan-na-jedan, odnos prema artikulaciji nego
prema akustičkim karakteristikama signala, što predstavlja začetak motorne teorije precepcije
govora.
Iako je motorna teorija pretrpela značajne izmene tokom vremena, svaka verzija je
zadržala osnovnu premisu prvobitno formlisane motorne teorije – percepcija govora se pre
sastoji u percepciji pokreta vokalnog trakta, nego u percepciji auditornog signala. Tačnije.
produkcija i percepcija govora su koimplikativni procesi – slušalac se prilikom obrade govornog
signala oslanja na apstraktno i implicitno znanje o tome kako se određeni govorni signal
generiše. Liberman i saradnici su prvobitno razvili motornu teoriju kako bi objasnili neke
neočekivane rezultate eksperimenata u kojima je korišćena mašina za čitanje, namenjena slepim
osobama. Učesnici u eksperimentu nisu uspevali da identifikuju pojedinačne zvuke u izloženom
nizu, već su se ti zvuci spajali u nerazlučivu, nerazumljivu celinu. Prema mišljenju Libermana i
njegovih saradnika, problem je bio u tome što su sekvence diskretnih zvukova premašivale moć
auditornog sistema da razdvaja ove zvuke. Kako bi istražili akustičku strukturu govora,
Liberman i saradnici koristili su zvučni spektograf, koji predstavlja grafički zapis govora. Na
ovaj način, oni su otkrili da fonetske segmente odlikuje koartikulacija, tj. da postoji preklapanje
pokreta vokalnog trakta za uzastopne suglasnike i samoglasnike. Za Libermana, koartikulacija
predstavlja veoma važnu karakteristiku govora, jer ako postoji preklapanje informacija sadržanih
u fonetskom segmentu, informacija za svaki segment se može razvući na duži vremenski
interval, a uvo može razložiti i rešiti segmente postepeno.
Proces produkcije govora se prema Libermanu sastoji iz serije nekoliko međusobno