Kognitivni vidiki modeliranja glasbenih lastnosti z eksplicitnimi …pefprints.pef.uni-lj.si/5973/1/Magistrsko_delo_Medvesek.pdf · 2019. 9. 20. · Naslov: Kognitivni vidiki modeliranja

UNIVERZA V LJUBLJANI

v sodelovanju z Universität Wien, Univerzita Komenského v Bratislave in

Eötvös Loránd Tudományegyetem

Špela Medvešek

Kognitivni vidiki modeliranja

glasbenih lastnosti z eksplicitnimi

globokimi arhitekturami

Magistrsko delo

SKUPNI INTERDISCIPLINARNI PROGRAM DRUGE

STOPNJE KOGNITIVNA ZNANOST

Mentor: izr. prof. dr. Matija Marolt

Somentorica: izr. prof. dr. Anja Podlesek

Ljubljana, 2019

Copyright. Rezultati magistrske naloge so intelektualna lastnina avtorja in

Fakultete za računalnǐstvo in informatiko Univerze v Ljubljani. Za objavo in

korǐsčenje rezultatov magistrske naloge je potrebno pisno privoljenje avtorja,

Fakultete za računalnǐstvo in informatiko ter mentorja.

Besedilo je oblikovano z urejevalnikom besedil LATEX.

Zahvaljujem se mentorju, dr. Matiju Maroltu, in somentorici, dr. Anji

Podlesek, za svetovanje, stalno dosegljivost in strokovno pomoč pri izdelavi

magistrske naloge.

Posebna zahvala gre asistentu dr. Matevžu Pesku, ki je s svojim preteklim

delom omogočil nastanek te naloge, me spodbujal pri delu in skrbel, da nisem

že zdavnaj obupala.

Hvala Nuši, Ani in Gregu za prevode, povratne prevode in preverjanje

prevedenega vprašalnika MSI.

Hvala Zali za pomoč pri oblikovanju spletne strani z vprašalnikom. Brez

nje bi bila eksperimentalna naloga veliko bolj dolgočasna.

Hvala Urši in Mihu, ki sta mi pri programiranju spletne strani priskočila

na pomoč, kadar se je kje zataknilo.

In navsezadnje hvala vsem, ki so mi v času študija, predvsem pa med

dolgotrajnim pisanjem te naloge, stali ob strani.

Kazalo

Povzetek

Abstract

1 Uvod 1

2 Pregled področja 4

2.1 Pridobivanje informacij iz glasbe in kognitivna muzikologija . 4

2.2 Vpliv kulture na glasbeno kognicijo . . . . . . . . . . . . . . . 6

2.3 Glasbeno pričakovanje . . . . . . . . . . . . . . . . . . . . . . 9

3 Računski modeli glasbenega pričakovanja 11

3.1 Narmourjev model implikacije–realizacije . . . . . . . . . . . . 11

3.2 Kompozicionalni hierarhični model . . . . . . . . . . . . . . . 15

4 Raziskava A: Indeks glasbene sofistikacije 21

4.1 Adaptacija vprašalnika za nov kulturni prostor . . . . . . . . . 21

4.2 Validacija vprašalnika Gold-MSI (CFA) . . . . . . . . . . . . . 24

4.3 Adaptacija vprašalnika Gold-MSI (EFA) . . . . . . . . . . . . 28

5 Raziskava B: Glasbeno pričakovanje 30

5.1 Materiali . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 30

5.2 Postopek . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 33

5.3 Udeleženci . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 34

5.4 Pridobivanje odgovorov CHM . . . . . . . . . . . . . . . . . . 36

6 Raziskava B: Rezultati 37

6.1 Analiza tonskih hierarhij . . . . . . . . . . . . . . . . . . . . . 41

6.2 Vpliv poznavanja glasbe tuje kulture . . . . . . . . . . . . . . 51

6.3 Vpliv velikosti učne množice na rezultate . . . . . . . . . . . . 52

6.4 Povprečje obratnih vrednosti rangov . . . . . . . . . . . . . . 53

6.5 Pilotska študija s kitajskimi udeleženci . . . . . . . . . . . . . 56

7 Zaključek 58

7.1 Predlogi za izbolǰsave . . . . . . . . . . . . . . . . . . . . . . . 59

7.2 Nadaljnje delo . . . . . . . . . . . . . . . . . . . . . . . . . . . 60

Literatura 62

A Slovenski vprašalnik Gold-MSI 70

B Notni zapisi eksperimentalnih izsekov 73

Povzetek

Naslov: Kognitivni vidiki modeliranja glasbenih lastnosti z eksplicitnimi

globokimi arhitekturami

Avtor: Špela Medvešek

Kompozicionalni hierarhični model je globoka arhitektura, ki jo odlikuje

transparentnost, eksplicitnost naučenih konceptov in zmožnost učenja na

majhnih množicah podatkov. Model smo preizkusili na nalogi melodičnega

pričakovanja ob predhodnem poznavanju glasbe različnih kultur ter primer-

jali uspešnost njegovih napovedi z napovedmi ljudi. Izvedli smo eksperi-

ment, s katerim smo ocenili sposobnost napovedovanja nadaljevanja izsekov

zahodne in kitajske glasbe na dveh skupinah udeležencev – Evropejcih (Slo-

vencih) in Kitajcih. Poznavanje glasbenega sloga pripomore k nižji zaznani

kompleksnosti, ugotovili pa smo, da enako velja tudi za nalogo glasbenega

pričakovanja: udeleženci so bili uspešneǰsi pri napovedovanju nadaljevanja

vzorca pri glasbi lastne kulture kot pri glasbi tuje kulture. Tudi model je

prilagajal način modeliranja vzorcev glede na različne naučene tipe glasbe,

pri čemer je bil v nekaterih aspektih celo uspešneǰsi od ljudi.

Ključne besede: kompozicionalni hierarhični model, glasbeni vzorci, me-

lodično pričakovanje, vpliv kulture, glasbena kognicija.

Abstract

Title: Cognitive aspects of modelling musical characteristics using explicit

deep architectures

Author: Špela Medvešek

The compositional hierarchical model is a deep architecture characterized

by transparency, explicitness of learned concepts, and the ability to learn on

small datasets. The model was tested on the task of melodic expectation with

the prior knowledge of the music of different cultures, and its performance

in terms of the correctness of predictions was compared with human perfor-

mance. An experiment was conducted, assessing the ability of two groups of

participants—European (Slovene) and Chinese—to predict the continuations

of Western and Chinese musical excerpts. Familiarity with the musical style

contributes to a lower perceived complexity, and we found that the same

applies to the task of musical expectation: the participants were more suc-

cessful in predicting the continuations in the music of their own culture than

the foreign one. Furthermore, the model also adapted the pattern modelling

method with regard to the different types of music learned, and in some

aspects, it was even more successful than people.

Keywords: Compositional hierarchical model, musical patterns, computer

modelling, cultural influence, musical cognition.

Poglavje 1

Uvod

V zadnjem času je v kognitivni znanosti zelo priljubljena teorija predikcij-

skega procesiranja, ki trdi, da si na podlagi konteksta in predhodnih izkušenj

ustvarimo pričakovanja oziroma predikcije o prihajajočih dogodkih. Pristopi,

ki uporabljajo probabilistične modele za posnemanje kognitivnih procesov,

lahko zelo uspešno razložijo človeško vedenje na računskem nivoju. To lahko

učinkovito prenesemo tudi v kontekst glasbenega pričakovanja oziroma na-

povedovanja melodije, saj imamo relativno enostavne vhodne signale z ome-

jenim naborom možnih nadaljevanj (za razliko od npr. vidnega zaznavanja),

napovedovanje pa olaǰsajo še predhodne izkušnje oziroma vpliv kulturnega

in socialnega okolja.

Vpliv kulturnega ozadja na glasbeno kognicijo je bil raziskan in dokazan

že za mnoga področja glasbenega udejstvovanja, v pričujoči nalogi pa smo se

osredotočili na glasbeno pričakovanje in napovedovanje melodije. Za modeli-

ranje predikcijskih procesov v zaznavanju glasbe smo uporabili kompozicio-

nalni hierarhični model (angl. Compositional hierarchical model oz. CHM),

ki je bil do sedaj že uspešen pri reševanju različnih nalog s področja pridobi-

vanja informacij iz glasbe. CHM je bil naučen na dveh učnih množicah, od

katerih je prva vsebovala glasbo evropske (nemške) in druga kitajske kulture.

Dodali smo mu komponento za predvidevanje nadaljevanja vzorca. Za eval-

vacijo rezultatov smo uporabili obstoječe baze skladb, ki so se v preteklosti

1

2 Špela Medvešek

že uporabljale za analizo na področju pridobivanja informacij iz glasbe.

Delovanje modela smo primerjali s človeškim zaznavanjem skozi ekspe-

riment, v katerem smo sprva ocenili sposobnost napovedovanja nadaljeva-

nja melodičnega izseka na skupini ljudi, nato pa to sposobnost primerjali

s sposobnostjo predlaganega računskega modela. Eksperiment smo izvedli

na evropski in kitajski ljudski glasbi. Osredotočili smo se na to, kako sku-

pina ljudi in računski model ob predhodnem poznavanju evropske glasbe

predvidevata vzorce v evropski glasbi ter glasbi tujega (neevropskega) iz-

vora. Z uporabo dveh različnih učnih in testnih množic smo analizirali vpliv

predhodnega poznavanja glasbe posameznega tipa oz. kulturnega ozadja ter

preverjali, ali tudi model odraža latentne probabilistične modele, na katere

namigujejo človeški kognitivni procesi.

Naše glavno raziskovalno vprašanje je bilo, kako uspešen je kompozici-

onalni hierarhični model v primerjavi z ljudmi pri nalogi glasbenega pri-

čakovanja ter kako na uspešnost vpliva predhodni trening oz. specifična

učna množica. Poleg tega smo preizkusili tudi nasprotujoče si ugotovitve o

uspešnosti pri nalogi glasbenega pričakovanja v glasbi tuje kulture. Priča-

kovali smo, da bo uporabljeni model prilagajal način predvidevanja oz. mo-

deliranja vzorcev glede na različne naučene tipe glasbe ter da bo delovanje

modela uspešno posnemalo človeško zaznavanje.

V prvem delu naloge na kratko povzamemo dosedanje ugotovitve s področij

vpliva kulture na glasbeno kognicijo in glasbenega pričakovanja. Nadalju-

jemo z opisom razširjenega modela implikacije–realizacije, katerega delova-

nje smo primerjali s kompozicionalnim hierarhičnim modelom, ki je opisan v

nadaljevanju poglavja 3. Nato obrazložimo še algoritem, s pomočjo katerega

CHM “rešuje nalogo”.

V poglavju 4 opǐsemo raziskavo A, v kateri smo prevedli in evalvirali

Goldsmithsov indeks glasbene sofistikacije – samoocenjevalni vprašalnik, s

pomočjo katerega smo ocenjevali glasbeno predznanje udeležencev. Predsta-

vimo postopek adaptacije tovrstnih vprašalnikov za drug kulturni prostor

Magistrska naloga 3

ter utemeljimo in predstavimo skraǰsano različico omenjenega vprašalnika,

ki smo ga uporabili v raziskavi B.

Sledi opis metode raziskave B, in sicer opǐsemo postopek zbiranja skladb,

uporabljenih v eksperimentu, uporabnǐski vmesnik, ki smo ga za ta namen

izdelali, udeležence v eksperimentu in postopek pridobivanja odgovorov mo-

dela CHM.

V poglavju 6 predstavimo rezultate evropskih udeležencev, modela CHM

in modela implikacije–realizacije, nazadnje pa še na kratko povzamemo re-

zultate pilotske študije s kitajskimi udeleženci. Na koncu omenimo še nekaj

predlogov za izbolǰsave ter idej za nadaljnje delo s kompozicionalnim hie-

rarhičnim modelom.

Poglavje 2

Pregled področja

2.1 Pridobivanje informacij iz glasbe in kog-

nitivna muzikologija

Magistrska naloga združuje področji pridobivanja informacij iz glasbe (ang.

music information retrieval – MIR) in kognitivno muzikologijo. Pridobivanje

informacij iz glasbe je interdisciplinarno področje s koreninami v muzikologiji,

strojnem učenju, procesiranju signalov in psihologiji. Cilj MIR je najti mo-

dele, ki najbolje rešijo zadano nalogo, medtem ko računsko preučevanje glas-

bene kognicije poskuša modelirati človeško kognicijo [7]. Od ostalih področij

glasbene psihologije se kognitivna muzikologija razlikuje po metodoloških pri-

stopih, in sicer uporablja računalnǐsko modeliranje za preučevanje reprezen-

tacij glasbenega znanja [33]. Pri raziskovanju so pogosto vključeni biološko

navdahnjeni modeli, npr. nevronske mreže in evolucijski algoritmi.

Zanimivi in med seboj povezani temi na stičǐsču teh dveh disciplin sta

hierarhično modeliranje glasbe in iskanje vzorcev v glasbi. Hierarhično mo-

deliranje obravnava vse od najosnovneǰsih vidikov glasbe, npr. prepoznave

tonskih vǐsin iz frekvenc slušnih signalov, do vǐsjih, kot so dojemanje hierarhij

znotraj lestvice, prepoznave akordov, harmonij, motivov in fraz [25]. Primer

hierarhičnega pristopa k analizi glasbe je shenkerjanska tonalna analiza (angl.

Schenkerian analysis), izvorno poimenovana redukcijska analiza (nem. Re-

4

Magistrska naloga 5

duktionsanalyse). Teorija prikazuje, da je vsako skladbo možno (postopoma)

poenostaviti na njeno fundamentalno strukturo ter da so melodije v svojem

bistvu zgolj dodelave osnovne strukture, imenovane Ursatz. Najosnovneǰse

sosledje harmonij je tonika-dominanta-tonika (I–V–I; slika 2.1), do katerega

pridemo s transformacijami od najvǐsjega nivoja, tj. celotne skladbe, do

najnižjega, tj. Ursatz. Teorijo pa lahko uporabimo ne le za namen poenosta-

vitve melodije, temveč tudi kot prikaz skladateljevega talenta in zmožnosti

predelave ter dodelave osnovne strukture v edinstveno skladbo [48].

Slika 2.1: Prikaz osnovne strukture skladbe v C-duru (nem. Ursatz ) –

zgornja vrstica predstavlja osnovni potek padajoče melodije s pričetkom na

tonu E oz. 3. stopnji C-durove lestvice (nem. Urlinie), spodnja pa to-

nike akordov, ki bi predstavljali harmonijo (nem. Bassbrechung). Pridobljeno:

http://www.schenkerguide.com/whatisschenkeriananalysis.php, 4. 5. 2019.

Schenkerjeva analiza ne zapoveduje določenega algoritma, po katerem bi

se gradilo hierarhije v glasbi, temveč se lahko smatra bolj kot osnova za

hierarhično analizo [26]. Ravno zaradi tega na njej temelji mnogo pozneǰsih

analiz in glasbenih modelov, npr. [16, 39, 40, 62, 66], posredno pa tudi model

CHM, predstavljen v pričujoči nalogi.

S pomočjo analize, prepoznavanja ter strukturiranja motivov in fraz lahko

učinkovito rešujemo nalogo iskanja ponavljajočih vzorcev v glasbi, pri čemer

se je za uspešnega izkazal tudi CHM [25, 56].


Področje kognitivne muzikologije med drugim raziskuje tudi vzporednice

v možganih med jezikovnimi in glasbenimi dogodki [19]. Tako jezik kot glasba

sta povezana s procesiranjem zvoka. Za oba je potrebna interpretacija več

lastnosti zvoka, kot so barva, tonska vǐsina, trajanje in njihove interakcije

[18].

Nekateri aspekti jezika in glasbe so dokazano procesirani v istih funkcio-

nalnih možganskih delih, in sicer v primarnem in sekundarnem avditornem

korteksu, temporalnem režnju, Brocovem centru, primarnem in suplementar-

nem motoričnem korteksu, anteriorni insuli, bazalnih ganglijih, ventralnemu

talamusu in posteriornem cerebelumu. Pri jeziku je opazna lateralizacija – za

jezikovne naloge se specializira dominantna hemisfera (navadno leva) –, glas-

bene aktivacije pa se dogajajo na obeh hemisferah, zaradi česar se aktivnosti

jezikovnih in glasbenih procesov pogosto prekrivajo [6].

Enako kot se aktivirajo določeni možganski procesi, ko slǐsimo znan jezik,

lahko v možganih vidimo razliko v aktivacijah pri poslušanju glasbe, ki jo

poznamo [42, 60]. Tudi neskladja v glasbi na nivoju glasbene sintakse sprožijo

enake možganske odzive, kot so bili opazovani v jezikoslovnih eksperimentih

[36, 44, 49].

2.2 Vpliv kulture na glasbeno kognicijo

Vpliv kulture na glasbeno kognicijo je bil raziskan in dokazan že za mnoge

vidike glasbe, npr. glasbeno segmentacijo [44], prepoznavanje razpoloženja

[3], zaznavanje ritmične [13] in melodične kompleksnosti [15].

Mnogi eksperimenti, ki preučujejo glasbeno kognicijo, so zasnovani na je-

zikoslovnih študijah. Maess idr. [36] so v študiji z MEG so pokazali, da Bro-

cov center, ki igra pomembno vlogo pri zgodnjem procesiranju neskladnosti

v sintaksi, tudi pri glasbenih neskladjih manifestira podobne aktivacije. To

predpostavko so nato Nan in drugi [44] prenesli na področje prepoznavanja

segmentov (fraz) v glasbi in v EEG raziskavi pokazali, da neskladja v glasbi

sprožijo enake možganske odzive kot jezikovna neskladja. Pri udeležencih so

Magistrska naloga 7

opazili univerzalni označevalec prozodičnega segmentiranja fraz, angl. closure

positive shift (CPS), ki se pojavlja tako pri poslušanju govora in glasbe kot

branju. Glasbeni CPS se je pojavljal med 100 in 450 ms po koncu fraze; bolj

zgodaj pri poslušanju glasbe lastne kulture (Nemci pri poslušanju evropske,

Kitajci pri poslušanju kitajske glasbe) in pozneje pri poslušanju tuje glasbe

(Nemci pri poslušanju kitajske, Kitajci pri poslušanju evropske glasbe) [44].

Glasba različnih kultur aktivira iste oziroma zelo podobne možganske re-

gije, kar so pokazali tudi Morrison in drugi v študiji s funkcionalno magnetno

resonanco (fMRI) [42]. V splošnem se nevrofiziološke raziskave strinjajo, da

je možno opazovati razlike v možganskih aktivacijah, kadar poslušamo glasbo

lastne in kadar poslušamo glasbo tuje kulture. Pri dokazovanju tega pa so

bili še bolj uspešni behavioristični eksperimenti.

Vpliv kulture je bil dokazan že za mnoge aspekte glasbene kognicije, npr.

izražanje glasbenih preferenc [63], prepoznavanje razpoloženja in čustev v

glasbi [3], glasbeni spomin [14] itd. Že pri otrocih se pokažejo preference za

kulturno poznane glasbene tradicije [14, 63]. Tudi glasbeni spomin posame-

znika je bolǰsi za kulturno poznano kot neznano glasbo [14]. Vpliv kulture

je viden tudi pri ritmu, ki je eden od faktorjev, ki je kot stalna in periodična

mera časovne organizacije prisoten v vseh svetovnih glasbah. Preferenco za

ritem svoje kulture opazimo že zgodaj. Kultura prav tako vpliva na prepo-

znavanje ritma, in sicer se nam tuji ritmi zdijo kompleksneǰsi, zato jih težje

prepoznamo [12].

Prepoznavanje razpoloženja in klasifikacija čustev v glasbi pri odraslih sta

odvisna tako od kulturno-specifičnih kot univerzalnih strukturnih lastnosti

poslušane glasbe. Balkwill in Thompson [3] sta raziskovala, ali zahodni po-

slušalci znajo prepoznati čustva (intended emotion) v glasbi v nepoznanem

tonalnem sistemu, v njunem primeru v hindujski glasbi. Ugotovila sta, da

smo ljudje v glasbi v tujem tonalnem sistemu zmožni prepoznati osnovna

čustva, npr. veselje, žalost in jezo, ne pa kompleksneǰsih in takšnih, ki se

morda razlikujejo od kulture do kulture – kot primer slednjega navajata

“mir” [3]. Fritz in drugi [17] so opravili raziskavo tudi v obratni smeri, in


sicer so preverjali, ali tudi nezahodni (v tem primeru afrǐski) udeleženci pre-

poznajo čustva v zahodni glasbi. Prǐsli so do enakega zaključka, torej da je

tudi v zahodni glasbi izraz osnovnih emocij univerzalno prepoznaven.

Pri raziskavah kompleksnosti, tako ritmične kot melodične, velja omeniti

dve raziskavi, ki sta preučevali afrǐsko in evropsko glasbo [13, 15]. Udeleženci

so pri obeh raziskavah glasbo lastne kulture ocenjevali kot manj kompleksno

od glasbe tuje kulture. Tujo glasbo pa so ocenjevali kot kompleksneǰso od

glasbe lastne kulture, a so Afričani evropsko dojemali bistveno manj komple-

ksno kot Evropejci afrǐsko. To je najverjetneje posledica razširjenosti zaho-

dne kulture ali z drugimi besedami, ljudje po vsem svetu so dodobra sezna-

njeni z zahodno kulturo in glasbo, zaradi česar manj robustne kulture hitro

izginjajo ali v manj radikalnih primerih kažejo “zgolj” globoko infiltracijo

zahodnih glasbenih temeljev [22].

Področje raziskovanja glasbe, ki je za našo raziskavo najpomembneǰse,

pa je glasbeno pričakovanje. Izmed vseh zgoraj predstavljenih se pri tem

aspektu najmanj manifestirajo razlike med kulturami [9, 30, 31]. Tovrstne

študije se navadno izvajajo na dveh skupinah udeležencev (običajno je ena

zahodna – Evropejci ali Američani – in ena tuja – v raziskavah po večini

sodelujejo Afričani ali Azijci). Naloga udeležencev je napovedati, kako se bo

nadaljeval segment glasbe lastne in tuje kulture. Na splošno se udeleženci iz

različnih kultur zelo podobno odločajo glede nadaljevanj v skladbah lastne in

tuje kulture. V eni izmed raziskav (Krumhansl et al. [30]) pa so se neevrop-

ski udeleženci celo točneje odločali v primeru evropske glasbe, s pomembno

opombo, da so bili dobro seznanjeni z evropskimi klasičnimi deli in so se

posledično odločali bolj v skladu z glasbeno teorijo kot Evropejci, ki imajo

bolj “splošno” (tj. ne omejeno na en sam slog) znanje o zahodni glasbi.

Ugotovljeno je bilo tudi, da so poslušalci dokaj fleksibilni glede odziva

na strukturo glasbe nepoznanega stila, torej da se hitro privadijo na različne

glasbene sisteme ter so zmožni že po kratki izpostavljenosti “zatreti” priča-

kovanja, ki se ne bi skladala s slogom poslušane glasbe [22, 31]. Za to obsta-

jata dve možni razlagi, in sicer (1) da se pri poslušanju že učimo značilnosti

Magistrska naloga 9

sloga oziroma, z drugimi besedami, pozorni smo na stilistične težnje v glasbi,

ali (2) da obstajajo osnovni psihološki principi oz. univerzalne lastnosti

glasbe, ki jih lahko prenesemo na različne glasbene sloge.

2.3 Glasbeno pričakovanje

Napovedovanje igra pomembno vlogo pri procesiranju informacij. To sta

ugotavljala že Hermann von Helmholtz [20] in William James [23] konec 19.

stoletja, teorija predikcijskega procesiranja pa v zadnjem času le še pridobiva

na priljubljenosti [10, 61].

Predikcijski mehanizmi temeljijo na konstruiranju reprezentacij na osnovi

konteksta in predhodnih izkušenj, ki se manifestirajo skozi tok informacij od

zgoraj navzdol (angl. top-down). Koncept predikcijskega procesiranja se je

uspešno uveljavil na mnogih področjih, še posebno pri obdelavi senzornih

informacij [34].

Sears et al. [61] navajajo primer hoje po stopnicah – možgani si ustva-

rijo miselno reprezentacijo stopnǐsča, pri čemer si pomagajo z vizualnimi,

avditornimi, haptičnimi in proprioceptičnimi dražljaji. Z neprestanim po-

sodabljanjem te reprezentacije minimalizirajo potencialne napake v njej in

zato lahko brez pretirane nevarnosti hodimo po stopnicah. Z izpostavljeno-

stjo podobnim situacijam naše predikcijske sheme postanejo natančneǰse in

lažje predvidimo prihodnje dogodke.

Prvi, ki je predikcijsko procesiranje uporabil na področju glasbe, je bil

Leonard B. Meyer [41], čigar teorijo je za osnovo vzel Eugene Narmour in

ustvaril model realizacije–implikacije [45, 46] (gl. poglavje 3.1), ki predpo-

stavlja, da si na podlagi intervalov v skladbi ustvarimo pričakovanja o na-

daljevanju melodije. To predpostavko lahko skladatelji izkoristijo na primer

za ustvarjanje glasbe, ki si jo bodo poslušalci zlahka zapomnili [27], ali pa

za komponiranje nepričakovanih melodij, ki bi poslušalce presenetile ali kako

drugače zaznamovale.

Obširno raziskano glasbeno področje z vidika pričakovanja so kadence, tj.


kombinacije akordov oziroma tonskih stopenj, ki označujejo konec skladbe

oziroma dela skladbe. Kadence vzpostavijo najbolj predvidljiva shematska

pričakovanja v glasbi [61] (najmočneǰsi je na primer razvez iz dominante v

toniko [1]), zato lahko predvidevamo, da se bo to odražalo tudi pri reševanju

eksperimentalne naloge, in sicer smo pričakovali, da bodo udeleženci pravil-

neje odgovarjali glede pričakovanega nadaljevanja glasbe za glasbene izseke,

pri katerih je potrebno ugibati zaključek fraze (kadence), kot za izseke, pri

katerih je bilo treba ugibati nezaključni ton v frazi.

Sodobneǰsi pristopi, ki s pomočjo probabilističnih modelov posnemajo

človeške kognitivne procese, lahko v nekaterih primerih zelo dobro razložijo

človeško vedenje na računskem nivoju [38]. Glasba, predvsem monofonska,

je eno takšnih področij, ki so lahko zelo uspešno modelirana, saj nudi le

omejen nabor možnih elementov [57] oziroma nadaljevanj (za razliko od npr.

vidnega zaznavanja, kjer so elementi veliko manj diskretni, meje med njimi

pa so lahko zelo zabrisane). Napovedovanje melodije pa nam dodatno olaǰsa

(ali pa oteži) tudi predhodno poznavanje glasbene kulture.

Poglavje 3

Računski modeli glasbenega

pričakovanja

S porastjo računalnǐske tehnologije se je konec preǰsnjega stoletja začelo

večati tudi zanimanje za računalnǐsko pridobivanje informacij iz glasbe in

njeno analizo. Od takrat je nastalo že veliko modelov, ki se ukvarjajo z

najrazličneǰsimi nalogami MIR.

V tem poglavju predstavimo dva računska modela za modeliranje glasbe-

nega pričakovanja, katerih uspešnost primerjamo v nalogi: razširjeni Narmo-

urjev model implikacije–realizacije (IR) in kompozicionalni hierarhični model

(CHM).

Model IR je nastal kot alternativa schenkerjanski analizi. Slednja se

osredotoča na glasbeno analizo, IR pa predvsem na kognitivne aspekte me-

lodičnega pričakovanja. CHM je sodobna globoka arhitektura, ki z nenadzo-

rovanim učenjem ǐsče vzorce v glasbi, implementirali pa smo ji tudi kompo-

nento za napovedovanje nadaljevanja melodije.

3.1 Narmourjev model implikacije–realizacije

Eugene Narmour je za osnovo vzel teorijo glasbenega pričakovanja Leonarda

Meyerja [41], ki temelji na razumevanju glasbene strukture ter zaznavanju

11


glasbenih emocij in pomena, in jo razvil v kompleksno teorijo melodične per-

cepcije, ki jo je poimenoval model implikacije–realizacije (angl. the implication–

realization (IR) model) [45].

Osredotoča se na implikativne intervale, s pomočjo katerih si ustvarimo

pričakovanja o nadaljevanju melodije, in realizirane intervale, ki ta pričako-

vanja oz. implikacije (predvidoma) izpolnijo oz. realizirajo [65]. Z drugimi

besedami, model opazuje zaznavne sisteme, ki procesirajo informacije od zgo-

raj navzdol (angl. top-down), in tiste, ki procesirajo informacijo od spodaj

navzgor (angl. bottom-up), na podlagi katerih si zgradimo melodične re-

prezentacije. Top-down procesiranje glasbe lahko enačimo z implikacijo oz.

pričakovanjem, njihove realizacije pa spadajo v sistem bottom-up reprezen-

tacij, ki so priučene, odvisne od glasbenega znanja in izkušenj ter specifične

za glasbene kulture [50].

Model IR vsebuje pet kriterijev, na podlagi katerih se ocenjuje primernost

realiziranega intervala:

– smer melodije, angl. registral direction: implikativni intervali, veliki

8 poltonov ali več, implicirajo spremembo smeri melodije, manǰsi pa

ohranitev smeri,

– melodični povratek, angl. registral return: preferira povratek na

prvi ton implikativnega intervala oz. odmik od slednjega za največ 2

poltona navzgor ali navzdol,

– intervalna razlika, angl. intervallic difference: implikativni intervali,

veliki 5 poltonov ali manj, implicirajo podobno velike realizirane inter-

vale (z odmikom za 2 poltona navzgor ali navzdol pri spremembi smeri

melodije oziroma 3 poltone pri ohranitvi smeri), implikativni intervali

večji od 5 poltonov pa manǰse realizirane,

– bližina, angl. proximity : preferira realizirane intervale, velike 5 polto-

nov ali manj,

– zaključenost, angl. closure: implicira spremembo smeri melodije ali

Magistrska naloga 13

manǰsi realizirani interval od implikativnega, če je bil implikativni in-

terval velik (vsaj 3 poltone večji od realiziranega)

Model preferira majhne realizirane intervale in ohranitev smeri melodije ozi-

roma obstanek na istem tonu, v primeru večjih realiziranih intervalov pa

spremembo smeri melodije.

3.1.1 Razširjeni model implikacije–realizacije

Petim osnovnim kriterijem Narmourjevega modela so pozneje različni avtorji

dodali še pet kriterijev, ki pa ne temeljijo vsi na realizaciji implikativnih

intervalov. Dodani kriteriji so:

– sozvočnost, angl. consonance: preferirani realizirani intervali so so-

zvočni intervali: prima, čista kvarta, čista kvinta in oktava [28],

– tonalnost, angl. tonality : preferirani so tonsko stabilneǰsi toni, gl.

Poglavje 3.1.2 [27],

– melodična privlačnost, angl. melodic attraction: razmerje tonalno-

sti obeh tonov v realiziranem intervalu [35],

– tessitura : napoveduje tone, ki so blizu srednji legi melodije [21],

– mobilnost, angl. mobility : na podlagi avtokorelacije med zaporednimi

tonskimi vǐsinami ocenjuje, kako napovedljiv je posamezen ton glede

na preǰsnje tone in srednjo lego [21].

V nadaljevanju podrobneje predstavimo kriterij tonalnost. Njegovo poeno-

stavljeno različico smo uporabili tudi za analizo primernosti odgovorov v

raziskavi B.

3.1.2 Tonske hierarhije

Teorija tonskih hierarhij sloni na predpostavki, da so statistično pogosti glas-

beni vzorci (v večini primerov) zanesljive smernice za poslušalčevo abstrahi-

ranje tonske hierarhije. Z drugimi besedami, poslušalci so se ob upoštevanju


sloga skladbe zmožni orientirati k pravi tonalni hierarhiji, njihovo zaznavanje

pa se sklada s frekvencami pojavitve tonov in njihovih kombinacij.

Hierarhijo tonov vzpostavi glasbeni kontekst. Določeni toni so značilnej-

ši, stabilneǰsi in pomembneǰsi za strukturo kot drugi. V klasični zahodni

tonalno-harmonični glasbi 18. in 19. stoletja je glavni ton v hierarhiji to-

nika, sledita mu dominanta in dominantna paralela, nato ostali toni lestvice,

nazadnje pa še toni, ki niso del lestvice. Ta hierarhija odraža vpliv triadične

(akordne) strukture, v kateri dominirajo konsonantni akordi.

Krumhansl [29] je za namen kvantificiranja tonskih hierarhij uporabila

metodo probe tone, pri kateri so udeleženci poslušali nezaključene lestvice

ter ocenjevali (s pomočjo lestvice Likertovega tipa z vrednostmi 1–7), kako

dobro posamezni toni to lestvico zaključijo. Rezultati so transponirani v

skupno tonaliteto in predstavljeni v tabeli 3.1. Kot že omenjeno v preǰsnjem

odstavku, dobi najvǐsjo vrednost tonika (v primeru C-dura oz. c-mola je to

ton C).

Tabela 3.1: C-durova tonska hierarhija, pridobljena z metodo probe tone.

ton C C# D D# E F F# G G# A A# B

C-dur 6,35 2,23 3,48 2,33 4,38 4,09 2,52 5,19 2,39 3,66 2,29 2,88

c-mol 6,33 2,68 3,52 5,38 2,60 3,53 2,54 4,78 3,98 2,69 3,34 3,17

Toni, ki so vǐsje v tonski hierarhiji, se pojavljajo pogosteje in na poudar-

jenih metričnih pozicijah ter trajajo dlje [27], poleg tega pa vǐsje kot so v

hierarhiji, hitreje jih prepoznamo kot del lestvice [24].

Poleg glasbenih referenčnih točk, ki vodijo glasbeno percepcijo, glasbeni

spomin in razumevanje, so poslušalci občutljivi tudi na pogosta zaporedja

zvokov [58, 59]. S ponavljajočim poslušanjem implicitno razvijejo men-

talne reprezentacije, ki odražajo glasbene konsistentnosti, s pomočjo kate-

rih nato šifrirajo in pomnijo glasbene vzorce ter med poslušanem generirajo

pričakovanja. Občutljivost na te konsistentnosti omogoča relativno hitro pri-

lagoditev novim glasbenim slogom.

Koncept, da je en centralni ton referenčna točka za množico hierarhično


povezanih tonov, pa ni lasten zgolj zahodnemu tonsko-harmoničnemu slogu,

temveč tudi drugim slogom in kulturam, edinstvene hierarhije pa se lahko

vzpostavijo tudi znotraj posameznih skladb.

Zahodni poslušalci so se v poskusu Castellana idr. [9] hitro prilagodili

tonskih hierarhijam nepoznanega (indijskega) sloga. Izkazalo se je, da so

pomembneǰsi toni zaigrani večkrat, zaradi česar so poslušalci, ki s slogom

niso seznanjeni, zmožni najti primerno tonsko hierarhijo [9]. Že neizkušeni

poslušalci so fleksibilni in se hitro prilagodijo na tonska zaporedja v neznanih

glasbenih kontekstih, pri glasbeno izobraženih pa je statistično procesiranje

glasbe še bolj poudarjeno [47].

3.2 Kompozicionalni hierarhični model

V zadnjem času so na področju strojnega učenja in prepoznavanja vzorcev

postale popularne t. i. globoke arhitekture, še posebno tiste, ki temeljijo

na nevronskih mrežah. Tovrstne arhitekture ponujajo zmožnost učenja in

modeliranja značilnosti učnih podatkov na več ravneh, pri čemer na nizkih

ravneh modelirajo enostavne strukture, na vǐsjih pa obsegajo kompleksneǰse

koncepte. Pri prepoznavanju predmetov na slikah lahko npr. elementi na pr-

vih ravneh prepoznavajo značilke, kot so robovi, elementi na najvǐsjih ravneh

pa celotne predmete.

Alternativa nevronskim mrežam je vizualni hierarhični model, ki se uči se-

gmente slik hierarhično združiti v kompleksneǰse motive in specifične objekte

[51]. Na podlagi tega modela so Pesek in drugi [54] razvili kompozicionalni

hierarhični model (v nadaljevanju: CHM), globoko arhitekturo, namenjeno

pridobivanju informacij iz glasbe. Motivacija za CHM je razgradnja zaple-

tenih signalov v preprosteǰse dele signala. Prva plast vsebuje dele, ki pred-

stavljajo posamezne dogodke (npr. prisotnost zvočne frekvence na avdio

posnetku, črte na sliki ali note v simbolnem glasbenem zapisu), nadaljnje

plasti pa na podlagi statistične analize gradijo kompozicije delov s preǰsnjih

plasti, ki se pogosto sopojavljajo.


Model je bil že preizkušen na več opravilih s področja pridobivanja in-

formacij iz glasbe: prepoznavanje not v polifonični glasbi [54], pridobivanje

značilk za opredelitev čustev, izraženih z glasbo, ocenjevanje harmonskih za-

poredij [53] in iskanje vzorcev v simbolnih glasbenih predstavitvah [25, 56].

V primerjavi s trenutnimi implementacijami globokih arhitektur, ki teme-

ljijo na nevronskih mrežah, lahko strukturo naučenih konceptov v kompozi-

cionalnem hierarhičnem modelu, ki je transparentna arhitektura, opazujemo

brez specializiranega procesa, kakršen je običajno potreben za modele, ki de-

lujejo na principu črne škatle. Poleg tega CHM zaradi relativnosti delov že

na zelo majhni vhodni množici uspešno prepozna kompleksne koncepte [52].

3.2.1 Kompozicionalni hierarhični model za simbolni

glasbeni zapis

Kompozicionalni hierarhični model za simbolni glasbeni zapis (angl. Symbo-

lic compositional hierarchical model, SymCHM) je implementacija CHM za

glasbo v simbolnem glasbenem zapisu1. Model z nenadzorovanim učenjem

dogodke oz. dele na najnižjem nivoju (posamezne note) združuje v dele na

vǐsjih nivojih, slednje pa nadalje združuje v dele oz. kompozicije na še vǐsjih

nivojih in tako odkriva kompleksne, ponavljajoče se vzorce na najvǐsjih ni-

vojih [25, 55].

Medtem ko del v prvotnem modelu CHM predstavlja spektralne značil-

nosti zvoka, kot so frekvence in posamezni toni, v katere se osnovne frekvence

združujejo, pa SymCHM iz delov (tonov in njihovih kompozicij) gradi hie-

rarhične modele melodičnih vzorcev [55]. Deli so predstavljeni relativno, za-

radi česar model najde vzorce neodvisno od absolutne tonske lege in trajanja

[52] (gl. tudi Poglavje 3.2.2).

V model so avtorji vgradili več biološko navdahnjenih mehanizmov: in-

hibicijo, podobno inhibiciji v človeškem avditornem sistemu, sposobnost za-

polnjevanja manjkajočih delov (avtorji ta mehanizem poimenujejo halucina-

1 Vhodni podatki so v formatu MIDI, MusicXML ali drugih tekstovnih formatih, vse-

bujejo pa tonsko vǐsino, čas nastopa tona in trajanje tona, gl. Poglavje 3.2.2


cija) ter avtomatsko ojačitev novosti v signalu. Zaradi relativnosti naučenih

konceptov in vgrajenih mehanizmov, predvsem zapolnjevanja, lahko model

napoveduje pričakovane prihodnje dogodke, kar sovpada tudi s človeškim

dojemanjem glasbe, pričakovanji in njihovim kršenjem ter s tem povezano

zanimivostjo in emocionalnostjo doživljanja glasbe [56].

3.2.2 Obdelava podatkov

Za izgradnjo kompozicionalnega hierarhičnega modela potrebujemo učno mno-

žico v točno določenem zapisu (predstavljenem v nadaljevanju), ki predsta-

vlja naše vhodne podatke. Te CHM obdela in iz njih izlušči vzorce, ki se

v učni množici pojavljajo. Izhodna datoteka, ki jo CHM vrne, v vsaki vr-

stici vsebuje niz, ki predstavlja enega izmed najdenih vzorcev. Prvi ton v

vzorcu je predstavljen kot 0, ne glede na absolutno tonsko vǐsino, vsi nasle-

dnji pa kot relativni poltonski odmiki od njega. Tako je npr. zaporedje tonov

{C2, F2, A1,C2} v izhodni datoteki predstavljeno kot {0, 5, –3, 0}.Najprej uredimo vhodne podatke, in sicer je treba skladbe iz formata

MIDI pretvoriti v tekstovne datoteke formata .csv. V datoteki je vsak ton

predstavljen v svoji vrstici kot niz s petimi elementi:

{To, P1, P2,D, S}

pri čemer elementi po vrsti predstavljajo:

– To: čas nastopa tona (ang. onset time) v udarcih četrtinke,

– P1: tonsko vǐsino v formatu MIDI,

– P2: tonsko vǐsino, zapisano v morfetični vrednosti (vrednosti nismo

uporabljali),

– D: trajanje tona v udarcih četrtinke,

– S: številko notnega črtovja (vrednosti nismo uporabljali).


Na takšen način pripravimo učno množico, na podlagi katere s pomočjo

kompozicionalnega hierarhičnega modela pridobimo nabor glasbenih vzorcev,

dolgih med 4 in 32 dogodkov, ki se v učni množici pojavljajo.

Vzorce pretvorimo v skraǰsani zapis, pri katerem si pomagamo z malimi

in velikimi tiskanimi črkami, ki nadomestijo razmerja med toni, izražena v

številkah.

{ 0, 5, -3, 0 } → 0Ec0

Pozitivne številke spremenimo v velike črke (5 → E), negativne pa v malečrke (–3→ c). Toni so zabeleženi relativno glede na poltonsko oddaljenost odprvega tona, ki ima povsod vrednost 0. Takšno anotacijo z nekaj razlikami,

opisanimi v nadaljevanju, uporabljamo tudi pri eksperimentalnih glasbenih

izsekih.

Skladbe najprej zapǐsemo kot nize MIDI tonskih vǐsin (sledi zapis MIDI

vǐsin za del skladbe Kuža pazi):

{ 60, 60, 60, 60, 62, 62, 62, 62, 64, 64, 62, 62 }

in jih nato pretvorimo v zgoraj omenjeno anotacijo s prvo vrednostjo enako

0. Nato ločeno z $ nizu pripnemo niz z vsemi toni od drugega naprej, pri

čemer ima drugi ton (tj. prvi znak drugega niza) vrednost 0, ostale tone pa

pretvorimo relativno glede na prvi znak (drugi ton). Postopek nadaljujemo

do predzadnjega tona (gl. tabela 3.2) in dobimo nize oblike:

0000BBBBDDBB$000BBBBDDBB$...$0000BB00$...$00bb$0bb$00.

Med posamezne tone v vsakem vzorcu (ne skladbi) vstavimo regularni iz-

raz [0a-zA-Z]*, ki označuje, da se med dvema znakoma lahko nahaja poljubno

število znakov. Del v oglatih oklepajih pomeni katero koli črko angleške abe-

cede ali številko 0, zvezdica pa poljubno število ponovitev katerega koli izmed

znakov v tem naboru. Nato poǐsčemo vse vzorce, ki se ujemajo z naučenimi

vzorci do predzadnjega tona, in zadnji ton določimo kot nadaljevanje glas-

benega izseka (tabela 3.3). Vzorci se pojavljajo na različnih delih izseka in

z različnimi oddaljenostmi med toni; za slednje poskrbi izraz [0a-zA-Z]*. Na


Tabela 3.2: Pretvorba skladb za iskanje ujemajočih se vzorcev (izsek

skladbe Kuža pazi).

Mesto 13 12 11 10 9 8 7 6 5 4 3 2

Midi 60 60 60 60 62 62 62 62 64 64 62 62

Segment

0 0 0 0 B B B B D D B B

0 0 0 B B B B D D B B

0 0 B B B B D D B B

0 B B B B D D B B

0 0 0 0 B B 0 0

0 0 0 B B 0 0

0 0 B B 0 0

0 B B 0 0

0 0 b b

0 b b

0 0

podlagi tega za možna nadaljevanja izračunamo različne uteži. Dalǰsi vzorci

in vzorci, ki se s skladbo ujemajo proti koncu izseka ter imajo posledično

med posameznimi toni manj “lukenj”, dobijo večjo utež (tabela 3.3).

Uteži izračunamo po formuli:

U =Vlen

Slen + 1

pri čemer Vlen pomeni število tonov v vzorcu, Slen pa dolžino celotnega se-

gmenta z upoštevanjem ugibanega tona (gl. tabelo 3.3). Z nadaljnjim

povečanjem Slen za 1 zagotovimo vǐsjo utež za dalǰse vzorce, saj je tako

najvǐsja možna utež za vzorec dolžine n enaka nn+1 .

Tako bi npr. 32-tonski vzorec, ki bi se popolnoma ujemal z zadnjimi 32

toni (31 + 1 zadnjim, ugibanim tonom), dobil večjo utež (3233 = 0, 97), 4-tonski

vzorec, ki se ujema z zadnjimi 4 toni pa manǰso (45 = 0, 80). 4-tonski vzorec,

katerega prvi ton se ujema s prvim tonom skladbe, bi dobil zelo majhno utež


(npr. 421 = 0, 19, če bi bila skladba dolga 19 tonov).

Tabela 3.3: Postopek iskanja vzorcev in določanja uteži.

Mesto 13 12 11 10 9 8 7 6 5 4 3 2 1 Utež

Midi 60 60 60 60 62 62 62 62 64 64 62 62 ?

Izsek 0 0 0 0 B B B B D D B B * 4/(13+1)

Vzorec 1 0 0 B E = 0,29

Izsek 0 B B B B D D B B * 8/(10+1)

Vzorec 2 0 B B B D D B b = 0,73

Izsek 0 0 b b * 4/(5+1)

Vzorec 3 0 b b 0 = 0,67

V izseku skladbe Kuža pazi (tabela 3.3) je vzorec 1 primer vzorca s nizko

utežjo: 414 = 0, 29. Noben izmed predstavljenih vzorcev se ne ujema popol-

noma, vrednosti nn+1 pa se že nekoliko bolj približata vzorca 2 in 3 z utežema811 = 0, 73 in

46 = 0, 67.

Nazadnje seštejemo vse uteži vzorcev za posamezni možni odgovor.

Poglavje 4

Raziskava A:

Indeks glasbene sofistikacije

V raziskavi B (poglavji 5 in 6), ki smo jo izvedli v okviru pričujoče naloge,

smo želeli oceniti glasbeno predznanje udeležencev. Zato smo se odločili iz-

vesti predhodno raziskavo, v nalogi označeno kot raziskava A, v kateri smo

uporabili Goldsmithsov indeks glasbene sofistikacije (Gold-MSI), samooce-

njevalni vprašalnik, ki kvantificira različne vidike glasbenega udejstvovanja.

Za potrebe magistrske naloge smo ga prevedli v slovenščino in skraǰsali, kot

je opisano v tem poglavju.

4.1 Adaptacija vprašalnika za nov kulturni

prostor

Zaradi raznolikosti kultur po svetu ni dovolj, da vprašalnik le prevedemo,

ampak je potrebno podrobno preveriti njegovo veljavnost (validity) ob adap-

taciji v drugo kulturno okolje [64]. Medkulturne razlike lahko vplivajo na

veljavnost reševanja nekega vprašalnika v primeru nematernih govorcev npr.

angleščine, četudi imajo dobro znanje jezika [4], do razhajanj glede veljav-

nosti pa lahko pride celo pri uporabi istega vprašalnika pri dveh kulturah z

istim maternim jezikom, a povsem različnima kulturama (npr. ZDA in Nova

21


Zelandija) [5]. Za priredbo instrumenta (vprašalnika) za novo kulturno oko-

lje sta torej poleg prevoda obvezna tudi adaptacija in ocena veljavnosti ter

zanesljivosti (ponovljivosti in notranje konsistentnosti) [2].

Proces transkulturne adaptacije obsega izdelavo instrumenta, ki je se-

mantično, konceptualno, vsebinsko, tehnično in kriterijsko ekvivalenten iz-

vornemu [64], a jezikovno in kulturno prilagojen ciljnemu kontekstu. Tako

prilagojen instrument omogoča primerjavo rezultatov, pridobljenih v različ-

nih kulturah [2].

Kljub temu da takšna validacija vzame veliko časa, je potrebna za zago-

tavljanje popolnega jezikovnega ekvivalenta samoocenjevalnih instrumentov.

Po Sousu in Rojjanasrirat [64] so priporočeni koraki za adaptacijo instru-

menta naslednji:

1. Prevod instrumenta s strani dveh med seboj neodvisnih prevajalcev

(oz. ekip prevajalcev), od katerih je eden izvedenec na področju, s

katerim se ukvarja raziskava, drugi pa ima dobro poznavanje kulturnih

in jezikovnih nians ciljnega jezika, vendar ni izvedenec na zadevnem

področju;

2. Oba prevoda pregleda tretji dvojezični, še raje pa dvokulturni, prevaja-

lec ter izpostavi dvoumja in neujemanja med obema prevodoma. Nato

se v soglasju z vsemi tremi prevajalci in člani raziskovalne ekipe ustvari

preliminarno začetno prevedeno verzijo instrumenta v ciljnem jeziku;

3. Dva prevajalca, ki v projektu še nista sodelovala in ki sta po karakte-

ristikah enaka kot prevajalca iz prve točke, opravita vzvratni prevod

(angl. back-translation) v izvorni jezik brez poznavanja izvornega be-

sedila. Ta korak služi preverjanju ter razjasnitvi besedǐsča in stavčnih

struktur, uporabljenih v prevodu v ciljni jezik;

4. Ponovno se pregleda odstopanja med prevodi ter napravi predzadnjo

verzijo instrumenta v ciljnem jeziku. V kolikor se ekipa o odstopanjih

ne strinja, je potrebno ponoviti vse 4 korake bodisi za celotni vprašalnik

bodisi za točke nestrinjanja.


S prvimi štirimi točkami se zagotovi konceptualno, semantično in vsebinsko

ekvivalentnost instrumenta v ciljnem jeziku s tistim v izvornem jeziku. Ko je

ugodeno vsem štirim korakom, je instrument pripravljen za pilotsko testiranje

[64]:

5. 10–40 posameznikov (naravnih govorcev ciljnega jezika) oceni jasnost

navodil, vprašanj in formata odgovor, priporočljivo pa je, da enako

stori tudi odbor 6–10 strokovnjakov. Za vsako točko je potrebno vsaj

80-odstotno strinjanje v vsaki izmed obeh skupin;

6. Dvojezični posamezniki najprej rešijo vprašalnik v ciljnem, nato pa še

izvornem jeziku (vendar z drugačnim vrstnim redom vprašanj). Na

podlagi primerjave odgovorov se sklepa o kriterijski enakovrednosti;

7. Končno se opravi psihometrično testiranje (splošni dogovor glede po-

trebnega števila subjektov je približno število vprašanj × 10) z uporaboanalize merilne lestvice in odgovorov, Pearsonove korelacijske analize

ter eksploratorne in konfirmatorne faktorske analize. Namen tega ko-

raka je prečistiti vprašalnik, tako da bo končni instrument ustrezal

minimalnim zahtevam za zanesljivost (reliability), homogenost in ve-

ljavnost (validity) ter da bo imel stabilno faktorsko strukturo.

Notranjo konsistentnost instrumenta lahko preverimo z izračunom Cronba-

chovega koeficienta α (zaželeno je, da znaša njegova vrednost ≥ 0,70); pono-vljivost testiranja merimo z Wilcoxonovim neparametričnim testom, korela-

cijskimi koeficienti ali parnim t-testom [2, 4, 32].

Veljavnost najprej preverjamo z vzvratnim prevodom, pregledom litera-

ture, kritično obravnavo in opiranjem na izvedenska mnenja. Nato opravimo

faktorsko analizo in instrument s pomočjo korelacijskih koeficientov (npr.

Spearmanov ρ, Pearsonov r) primerjamo z izvornim ali drugimi podobnimi

instrumenti [2, 32].

Najpogosteǰsi statistični analizi, ki se uporabljata za validacijo prevo-

dov instrumentov, sta eksploratorna in konfirmatorna faktorska analiza [2].


S konfirmatorno faktorsko analizo (CFA) preverjamo, ali podatki odražajo

strukturo izvornega instrumenta, s pomočjo eksploratorne faktorske analize

(EFA) pa lahko iz velikega seta vprašanj izluščimo, katere dimenzije instru-

menta so pomembne za definiranje modela ali teorije oz. kaj adaptirani in-

strument sploh meri [2]. Eksploratorna analiza se načeloma uporablja, kadar

konfirmatorna ne pokaže ustreznega prileganja strukture izvornega instru-

menta podatkom, zbranim s priredbo.

4.2 Validacija vprašalnika Gold-MSI (CFA)

Vprašalnik Gold-MSI obsega 38 vprašanj o glasbenem udejstvovanju in iz-

obraženosti (gl. dodatek A). Prvih 31 vprašanj je subjektivnih in ima od-

govore v obliki lestvice Likertovega tipa (1–7, pri čemer pomeni 1 “sploh se

ne strinjam”, 7 pa “popolnoma se strinjam”), zadnjih 7 pa je bolj objek-

tivnih vprašanj o trajanju glasbenega izobraževanja, številu inštrumentov,

ki jih posameznik igra, itd. (odgovori na vsako vprašanje so razdeljeni v 7

neintervalnih ordinalnih kategorij).

Vprašalnik smo z večkratnim preverjanjem kakovosti prevedli v sloven-

ščino. Dva prevajalca sta vprašalnik neodvisno prevedla, tretja prevajalka

pa je prevoda pregledala. Oba pregledana prevoda smo združili v prvo slo-

vensko verzijo. To verzijo je četrta neodvisna prevajalka prevedla nazaj v

angleščino (back-translation), nazadnje pa smo primerjali vzvratni prevod

z izvornim angleškim besedilom ter z ustreznimi spremembami prve verzije

ustvarili končni slovenski prevod.

V okolju CodeIgniter 3.1.7 smo ustvarili spletno stran z vprašalnikom

Gold-MSI v slovenščini ter štirimi kratkimi demografskimi vprašanji (spol,

starost, izobrazba, status). Podatke smo obdelali v orodju za statistično

analizo R 3.4.0.

Opravili smo konfirmatorno faktorsko analizo, da bi ugotovili, ali preve-

deni vprašalnik odraža psihometrično strukturo originalnega, nato pa smo se

odločili še za eksploratorno faktorsko analizo, saj smo hoteli vprašalnik čim


bolj skraǰsati.

4.2.1 Udeleženci

Vprašalnik je v celoti rešilo 231 ljudi (79 moških, 152 žensk). Udeleženci so

bili povečini študentje (136) in zaposleni (75), stari med 16 in 58 let (M =

26,7, SD = 7,3). Skoraj vsi udeleženci (96,5 %) so imeli vǐsjo izobrazbo od

srednješolske: 83 jih je imelo šesto stopnjo izobrazbe, 86 sedmo in 54 osmo.

Velika večina udeležencev je imela vsaj nekaj let glasbene izobrazbe. Glas-

bene šole ni nikoli obiskovalo 66 udeležencev (28,6 %), kar 139 (60,2 %) pa

se jih je vsaj tri leta formalno učilo igranja inštrumenta oz. petja (od tega

44 udeležencev deset let ali več). Tretjina udeležencev (75) se ni nikoli iz-

obraževala o glasbeni teoriji, 128 (55,4 %) pa se jih je na tem področju

izobraževalo tri leta ali več (od tega 41 udeležencev več kot šest let). Le 38

udeležencev (16 %) je bilo popolnih neglasbenikov – nikoli se niso glasbeno

izobraževali in vadili inštrumentov niti se niso sami naučili igrati nobenega

inštrumenta niti ne obvladajo petja.

Največ udeležencev je odgovorilo, da najbolj obvladajo petje (47), temu

so sledili klavir (43), kitara (33), prečna flavta (15) in violina (11). Ostali

inštrumenti so imeli frekvenco 3 ali manj, 65 udeležencev (28,1 %) pa ni

obvladalo nobenega inštrumenta oz. petja.

4.2.2 Konfirmatorna analiza

Najprej smo preverili ponovljivost testiranja instrumenta. Pregledali smo

7 parametrov (povprečne vrednosti, tri mere razpršenosti – SD, najvǐsje in

najnižje vrednosti – ter tri mere zanesljivosti – Cronbachovo α, McDonal-

dovo ω in Guttmanovo λ6) za pet faktorjev, o katerih poročajo Müllensiefen,

Gingras, Musil in Stewart [43]:

– aktivno udejstvovanje (active engagement – A),

– zaznavne sposobnosti (perceptual abilities – P),


– glasbena izobrazba (musical training – M),

– pevske sposobnosti (singing abilities – S),

– čustva (emotions – E).

Vsaka izmed 38 postavk iz vprašalnika spada v eno izmed teh petih kategorij

(A: obsega 9 postavk, P: 9, M: 7, S: 7, E: 6). Obravnavali smo tudi splošni

faktor glasbene sofistikacije (General sophistication – GEN), ki obsega 18

izmed teh 38 postavk [43].

V tabeli 4.1 so predstavljene različne vrednosti, pridobljene v originalni

raziskavi ([43], oznaka “EN” v tabeli), ter vrednosti, pridobljene v raziskavi

A (oznaka “SL” v tabeli). Mere zanesljivosti kažejo na dobro notranjo kon-

sistentnost pri vseh faktorjih, tako za originalni instrument v angleščini kot

za slovensko različico.

Tabela 4.1: Primerjava povprečnih vrednosti, razpršenosti in mer zaneslji-

vosti med originalno in našo raziskavo za 5 faktorjev in splošni faktor glasbene

sofistikacije (n = 147.633 (EN); n = 231 (SL)).

Aktivno Zaznavne Glasbena Pevske Čustva Splošna

udejstvovanje sposobnosti izobrazba sposobnosti sofistikacija

(A) (P) (M) (S) (E) (GEN)

EN SL EN SL EN SL EN SL EN SL EN SL

M 41,52 37,67 50,20 50,85 26,52 28,65 31,67 32,22 34,66 34,77 81,58 82,16

SD 10,36 11,69 7,86 9,67 11,44 12,20 8,72 10,18 5,04 5,83 20,62 23,93

Max 63 62 63 63 49 48 49 49 42 42 126 124

Min 9 9 9 22 7 7 7 8 6 14 18 22

α 0,87 0,87 0,87 0,88 0,90 0,92 0,87 0,88 0,79 0,76 0,93 0,94

ω 0,87 0,88 0,87 0,89 0,90 0,92 0,87 0,88 0,79 0,77 0,93 0,94

λ6 0,86 0,87 0,87 0,88 0,91 0,93 0,87 0,88 0,77 0,74 0,94 0,96

Opombe: EN: originalna raziskava; SL: raziskava A.

Ponovljivost testiranja smo preverili z enosmernim t-testom, s katerim smo

rezultate Slovencev pri vseh šestih faktorjih primerjali s povprečji pri posa-

meznem faktorju, ki jih poročajo avtorji v originalni raziskavi. Vrednosti se


pri večini faktorjev niso razlikovale statistično značilno (p > 0,05), izjema je

bil le faktor Aktivno udejstvovanje (tabela 4.2). Razlogi za to so lahko na

primer dejanska razlika med vzorcema ali razlike v interpretaciji vrednosti

na uporabljeni odgovorni lestvici.

Tabela 4.2: Rezultati enosmernega t-testa za povprečne rezultate pri po-

sameznem faktorju.

Faktor t(230) p d

Aktivno udejstvovanje –5,01 < 0,001 –0,661

Zaznavne sposobnosti 1,02 0,309 0,135

Glasbena izobrazba 2,65 0,009 0,349

Pevske sposobnosti 0,82 0,415 0,108

Čustva 0,29 0,774 0,038

Splošni faktor 0,37 0,713 0,049

Analiza angleškega in slovenskega vprašalnika je torej pokazala, da sta

instrumenta v veliki meri primerljiva, a smo kljub temu opravili tudi konfir-

matorno analizo slovenskega vprašalnika, saj avtorji prvotnega vprašalnika

poročajo o slabem prileganju enofaktorskemu modelu [43].

Konfirmatorna faktorska analiza enofaktorskega modela slovenskega vpra-

šalnika je pokazala, da se podatki modelu ne prilegajo dobro, χ2 (665) =

2901, p < 0,001; CFI = 1,00; TLI = 1,00; RMSEA = 0,150, 90-% IZ =

[0,146, 0,154]; SRMR = 0,128.

Prileganje je bilo še slabše pri 5-faktorskem (isti faktorji kot v originalni

raziskavi) modelu (χ2 (655) = 9690, p < 0,001; CFI = 0,328; TLI = 0,278;

RMSEA = 0,244, 90-% IZ = [0,240, 0,249]; SRMR = 0,085), kar je bil eden

izmed razlogov, zakaj smo morali vprašalnik rekonstruirati.


4.3 Adaptacija vprašalnika Gold-MSI (EFA)

Cilj eksploratorne analize je bil zmanǰsati število vprašanj, ki bi nam vseeno

dala zadostne informacije o glasbeni sofistikaciji udeležencev. Ker je bila

eksperimentalna naloga v raziskavi B dokaj dolga, smo želeli vprašalnik Gold-

MSI občutno skraǰsati.

Izločili smo en splošni faktor z lastno vrednostjo 13,1. Nato smo izbrali

postavke z absolutnimi nasičenostmi, večjimi od 0,70; vprašalnik smo tako

skraǰsali na osem postavk (za 79 %).

Na podlagi teh osmih postavk smo ustvarili nov indeks glasbene sofistika-

cije (tabela 4.3), ki dobro sovpada s splošnim indeksom splošne sofistikacije

Gold-MSI (r = 0,95). Korelacijo smo izračunali na podlagi števila točk oz.

faktorskega dosežka, ki smo ga pridobili s seštevanjem uteženih vrednosti

odgovorov pri posameznih postavkah (število točk za posameznikov indeks

glasbene sofistikacije je bil seštevek uteženih odgovorov na postavke št. 5, 7,

10, 12, 19, 22, 27 in 32; po enakem postopku smo izračunali tudi rezultat pri

indeksu Gold-MSI).

Tabela 4.3: Izbor postavk z najvǐsjimi absolutnimi nasičenostmi.

Absolutna

Št. Postavka nasičenost

5 Dobro znam presoditi, ali je nekdo dober ali slab pevec. 0,734

7 Na pamet lahko pojem ali igram skladbe. 0,753

10 Ob spremljavi glasbenega posnetka sem sposoben zapeti prave note. 0,794

12 Zmožen sem primerjati in razpravljati o razlikah med dvema0,795

izvedbama ali različicama iste pesmi.

19 Zmožen sem prepoznati posebnosti poslušane skladbe. 0,802

22 Opazim, kadar nekdo poje ali igra napačne tone. 0,724

27 Ne bi rekel, da sem glasbenik. 0,746

32 Koliko časa ste redno, dnevno vadili glasbeni inštrument? 0,777

Novi indeks glasbene sofistikacije z osmimi postavkami smo vključili v

raziskavo B. Odgovori na prvih 7 postavk iz tabele 4.3 so bili v raziskavi B


del lestvice Likertovega tipa (kot v originalnem vprašalniku). Pri zadnjem

pa smo od udeležencev zahtevali, da sami vnesejo število let (med 0 in svojo

starostjo) redne vadbe inštrumenta oz. petja, vendar smo za končni izračun

rezultata MSI v raziskavi B intervalne odgovore pretvorili nazaj v njihove

ordinalne ustreznice, uporabljene v originalnem vprašalniku [43].

Poglavje 5

Raziskava B:

Glasbeno pričakovanje

5.1 Materiali

Eksperiment je bil sestavljen iz dveh blokov, kitajskega in evropskega, za

katera smo poiskali ustrezne glasbene zbirke, znotraj njih našli primerne

skladbe ter jih ustrezno skraǰsali. Kitajski glasbeni izseki, ki smo jih z dovo-

ljenjem avtorjev uporabili, so del glasbene baze, uporabljene v študiji zazna-

vanja glasbenih fraz [44]. Izseki evropske glasbe so iz prosto dostopne spletne

zbirke Robokopp1, ki vsebuje ljudske in vojne pesmi ter himne iz nemških

in angleških govornih okolij. Da bi prǐslo do čim manj razlik v glasbenem

slogu, smo se omejili le na nemške pesmi.

Za vsak del (evropski, kitajski) smo sprva naključno izbrali po 30 ne-

polifoničnih glasbenih odlomkov. Vsako skladbo v zapisu MIDI smo najprej

pretvorili v notni zapis z uporabo programov Midi Sheet Music in MuseScore

2 ter jo nato ponovno izvozili v formatu MIDI. Za ponovno izdelavo MIDI-jev

smo se odločili, ker so bile evropske in kitajske skladbe iz različnih virov in

je med njimi prihajalo do razlik v barvi zvoka in odmevu, prav tako pa je bil

natančen notni zapis uporaben za nadaljnjo statistično obravnavo skladb.

1http://www.musicanet.org/robokopp/Volksong.html, 15. 2. 2018

30


Skladbe so bile prvotno dokaj dolge, v povprečju 18,7 sekunde oz. pri-

bližno 8 taktov. Da bi bila naloga bolj prijazna do udeležencev, smo jih

skraǰsali na posamezne fraze znotraj skladb. Na sliki 5.1a je primer prvotne

skladbe, njena skraǰsana različica, uporabljena v eksperimentalni nalogi, pa

je na sliki 5.1b.

Skladbe smo kraǰsali na dva načina: nekatere smo odrezali po predza-

dnjem tonu fraze (udeleženci so torej morali napovedati zadnji ton fraze),

nekatere pa na naključnem mestu sredi fraze. Tako imenovane zaključene

(sliki 5.1b in 5.1d) in nezaključene izseke (sliki 5.1c in 5.1e) smo vključili v

razmerju 3 : 1 (75 % zaključenih, 25 % nezaključenih).

(a) primer kitajske skladbe

(b) kitajski izsek; zaključen (odlomek 1)

(c) kitajski izsek, nezaključen (odlomek 2)

(d) nemški izsek, zaključen (odlomek 3)

(e) nemški izsek, nezaključen (odlomek 4)

Slika 5.1: Primeri uporabljenih izsekov.


Na podlagi treh kriterijev – (1) število tonov, (2) največji interval, ki se

pojavi v skladbi, in (3) razpon – smo za vsako kulturo izbrali po 20 odlom-

kov, ki smo jih vključili v eksperimentalno nalogo. Da bi zagotovili čim bolj

podobno strukturo glasbenih dogodkov, so bili izbrani odlomki znotraj okvi-

rov M ± 2 SD za vsakega izmed treh kriterijev. Na koncu smo iz preostankaprimernih skladb izbrali časovno kraǰse odlomke.

V tabeli 5.1 se nahajajo vrednosti omenjenih treh kriterijev za primer

glasbenih odlomkov 1–4 (slika 5.1b–e).

Tabela 5.1: Vrednosti kriterijev 1–3 za štiri glasbene odlomke.

OdlomekŠtevilo Največji Razpon

tonov interval [polton]

1 (kitajski zaključen) 13 VIII (oktava) 12

2 (kitajski nezaključen) 17 VI (seksta) 17

3 (evropski zaključen) 13 IV (kvarta) 14

4 (evropski nezaključen) 12 IV (kvarta) 17

Z enosmerno ANOVO smo med seboj primerjali glasbene odlomke obeh

kultur. Skupini se v nobenem izmed prej omenjenih kriterijev nista stati-

stično pomembno razlikovali (tabela 5.2).

Glasbeni odlomki so imeli v povprečju skoraj 15 tonov (kitajski: M =

15,6, SD = 3,3; nemški: M = 13,9, SD = 4,3). Kitajske skladbe v izboru so

imele med 10 in 22 tonov, nemške pa med 7 in 24.

V povprečju je bil največji interval v odlomkih obeh kultur seksta. Med

kitajskimi skladbami je bila najmanǰsa vrednost terca in največja oktava,

med nemškimi pa najmanǰsa kvarta ter največja decima.

Skupini sta se po razponu skladb minimalno razlikovali. Povprečni razpon

skladb je bila oktava oz. 12 poltonov (kitajske: M = 12,4, SD = 3,8; nemške:

M = 11,6, SD = 2,8). Kitajske skladbe so imele razpon med 5 (kvarta) in 20

poltonov (tercdecima), nemške pa med 7 (kvinta) in 17 poltonov (undecima).

Povprečno so skladbe trajale 6,9 sekunde (kitajske: M = 7,3, SD = 1,7;


nemške: M = 6,6, SD = 2,2). Kitajske skladbe so bile dolge med 5 in 11

sekund, nemške pa med 3 in 11 sekund.

Tabela 5.2: Rezultati enosmerne ANOVE za primerjanje kriterija v skupini

evropskih in skupini kitajskih odlomkov.

Kriterij MS F(1, 38) p ω2

število tonov 28,9 1,88 0,179 0,021

največji interval 0,1 0,04 0,845 –0,025

razpon [polton] 6,4 0,54 0,469 –0,012

trajanje [s] 4,2 1,04 0,315 0,001

Opomba. Moč testa: 1 − β = 0,11 pri vrednosti α = 0,05.

5.2 Postopek

Spletno stran z vprašalnikom smo izdelali v MVC-okolju CodeIgniter 3.1.7, ki

je zasnovano na programskem jeziku PHP. Vprašalnik je bil sestavljen iz štirih

delov: prvi del je obsegal demografska vprašanja, skraǰsani vprašalnik Gold-

MSI in vprašanji o glasbenih preferencah ter pogostosti poslušanja kitajske

glasbe. Drugi del se je pričel z navodili za eksperimentalni del, nato pa so

bili udeleženci preusmerjeni na uporabnǐski vmesnik (slika 5.2), ki so ga se

najprej naučili uporabljati na treh poskusnih primerih.

Naloga udeležencev je bila poslušati kratek glasbeni izsek, nato s pomočjo

tonskega drsnika ali gumbov izbrati ton, ki bi bil po njihovem mnenju naj-

bolǰse nadaljevanje poslušanega izseka, in po potrebi ponovno poslušati izsek

z dodanim tonom. Na koncu so morali označiti še, ali skladbo prepoznajo

ali ne. Za poskusne primere smo izbrali skladbe, ki bi jih poznali praktično

vsi udeleženci (pri slovenskem vprašalniku so bile to Kuža pazi, Zdravljica in

Vse najbolǰse za te, pri angleškem pa otroška pesem Twinkle, Twinkle, Little

Star, Beethovnova skladba Für Elise in Vse najbolǰse za te) in jim zelo ver-

jetno znali določiti nadaljevanja. Pravilnost odgovorov na poskusnem delu


Slika 5.2: Uporabnǐski vmesnik za eksperimentalno nalogo.

je med drugim vplivala na pozneǰso razvrstitev v skupini glasbenikov in ne-

glasbenikov (gl. poglavje 5.3.2).

Tako med poskusnim kot eksperimentalnim delom so s pritiskom na gumb

(?) lahko kadarkoli ponovno prikazali navodila.

Po končanem poskusnem delu se je pričel eksperimentalni del, sestavljen

iz evropskega in kitajskega bloka. Vsak del je obsegal po 20 manj poznanih

glasbenih izsekov, ki jim je bilo treba določiti nadaljevanje. Vrstni red blokov

se je izmenjeval (polovica udeležencev je torej najprej reševala evropski in

nato kitajski blok, polovica pa obratno).

Vprašalnik smo distribuirali preko elektronske pošte in družabnih omrežij

ter povezavo objavili tudi na spletni strani Oddelka za psihologijo Filozofske

fakultete.

5.3 Udeleženci

Vprašalnik je v celoti rešilo 57 udeležencev (26 moških, 31 žensk), starih med

16 in 54 let (M = 26,7, SD = 7,5). Večina udeležencev (59,6 %) je imela


vǐsjo izobrazbo od srednješolske: 14 jih je imelo šesto stopnjo, 16 sedmo in

10 osmo.

Velika večina udeležencev je vsaj nekaj let redno vadila glasbeni inštru-

ment oziroma petje. Le deseterica (17,5 %) je odgovorila, da niso nikoli vadili

inštrumentov; v povprečju so udeleženci redno vadili 6,8 let (SD = 6,5). Kar

19 udeležencev (33,3 %) je inštrument vadilo 10 let ali več (max : 25 let),

skoraj tri četrtine (73,7 %) pa vsaj 3 leta.

Najbolj priljubljene zvrsti so bile klasična glasba (13 udeležencev uvrstilo

na prvo mesto, 5 na drugo in 15 na tretje), rock (16, 6, 4) in pop (6, 9, 5).

Udeleženci v veliki meri ne poslušajo kitajske glasbe: 39 (68 %) je ne posluša

nikoli, 13 občasno (nekajkrat na leto), le 2 nekajkrat na mesec in 3 praktično

vsak dan.

5.3.1 Indeks glasbene sofistikacije

Del demografskega vprašalnika je predstavljal skraǰsani vprašalnik Gold-MSI,

predstavljen v raziskavi A (poglavje 4.3).

Udeleženci so poročali o visoki glasbeni sofistikaciji, kar pravzaprav ni

presenetljivo, saj je večina vsaj 3 leta redno vadila glasbeni inštrument ozi-

roma petje. Povprečen rezultat je bil 42,2 točk od 56 možnih (SD = 7,7).

S pomočjo rezultatov skraǰsane lestvice Gold-MSI smo med drugim določali

razporeditev udeležencev v skupine glasbenikov in neglasbenikov.

5.3.2 Skupine

Ker je bilo v vzorcu veliko glasbenikov, smo se odločili za razporeditev v

večjo skupino glasbenikov in manǰso skupino neglasbenikov.

Upoštevali smo dva kriterija: indeks glasbene sofistikacije in odgovore

na preizkusnem delu vprašalnika. Za MSI smo mejo določili pri rezultatu

40, ki bi ga udeleženec dobil, če bi pri vsaki postavki (v povprečju) označil

vrednost 5. Med neglasbenike so bili torej umeščeni tisti, ki so imeli rezultat

MSI do vključno 39 (16 udeležencev). Nadalje smo v to skupino uvrstili tudi


vse udeležence, ki na preizkusnem delu vprašalnika (tri znane pesmi) niso

pravilno rešili vseh primerov. Upoštevali smo tudi odgovor na vprašanje,

ali poslušano skladbo poznajo, zaradi česar je en udeleženec “napredoval” iz

skupine neglasbenikov v skupino glasbenikov. Vsaj eno napako je storilo 14

udeležencev. Po združenju obeh kriterijev je bilo v skupini neglasbenikov 21

udeležencev (9 moških, 12 žensk, MSI: M = 34,4, SD = 6,8; leta glasbenega

izobraževanja: M = 1,8, SD = 2,2).

Preostalih 36 udeležencev smo razvrstili v skupino glasbenikov (17 moš-

kih, 19 žensk, MSI: M = 46,8, SD = 3,3; leta glasbenega izobraževanja: M

= 9,6, SD = 6,3).

5.4 Pridobivanje odgovorov CHM

Uporabili smo evropsko in kitajsko učno množico, ki sta obsegali približno

14.000 tonov, iz glasbene zbirke Essen2. Za obdelavo z modelom CHM smo

podatke v množicah uredili, kot je opisano v poglavju 3.2.2.

Rezultati, pridobljeni z evropsko in kitajsko učno množico na podlagi vsot

uteži, so bili zelo razpršeni (od –22 do +21 poltonov od izhodǐsča). Za začetek

smo se omejili le na razpon, kakršnega so imeli na voljo udeleženci (± 12poltonov), nazadnje pa smo se na podlagi razpršenosti odgovorov evropskih

udeležencev (slika 6.3 v poglavju 6.1.1) in porazdelitve intervalov v skladbah,

ki so bile del eksperimenta, omejili le na tone, ki so od izhodǐsča oddaljeni

največ za kvarto (IV) oz. 5 poltonov.

Kot najbolǰsi odgovor smo smatrali odgovor z najvǐsjo vsoto uteži in

tako pridobili odgovore CHM za vseh 40 glasbenih izsekov. Rezultati so

predstavljeni v poglavju 6.

2 Dostop: http://kern.ccarh.org/browse, 22. 6. 2018

Poglavje 6

Raziskava B:

Rezultati

V nalogi smo želeli preučiti, kako uspešen je kompozicionalni hierarhični

model v primerjavi z ljudmi pri nalogi glasbenega pričakovanja ter kako na

uspešnost vpliva predhodno poznavanje glasbene kulture oziroma specifična

učna množica. Eksperiment smo izvedli na dveh različnih zvrsteh glasbe:

evropski in kitajski ljudski glasbi.

V tabeli 6.1 so predstavljeni rezultati evropskih udeležencev, modela

CHM, naučenega na evropski in kitajski učni množici, ter razširjenega Nar-

mourjevega modela implikacije–realizacije. V naslednjih poglavjih podrob-

neje primerjamo rezultate znotraj različnih skupin.

Najprej bomo predstavili rezultate udeležencev z evropskim (slovenskim)

kulturnim ozadjem. Nato bomo analizirali delovanje modela CHM, naučene-

ga na evropski in kitajski učni množici, ter predstavili rezultate popravljenega

modela implikacije–realizacije. Rezultate bomo povezali s teorijo tonskih hie-

rarhij in povzeli, ali seznanjenost s tujo glasbeno kulturo vpliva na uspešnost

pri reševanju ter kako na uspešnost modela vpliva velikost učne množice.

Nazadnje bomo na kratko povzeli še pilotsko študijo istega eksperimenta s

kitajskimi udeleženci.

37


Tabela 6.1: Povprečna uspešnost udeležencev z evropskim kulturnim ozad-

jem in uspešnost CHM, naučenega na evropskih (CHM–eu) in kitajskih

(CHM–cn) vzorcih.

Evropske skladbe Kitajske skladbe

vse zaključene nezaključ. vse zaključene nezaključ.

Vsi udeleženci 58 % 63 % 42 % 34 % 34 % 35 %

Glasbeniki 68 % 74 % 47 % 39 % 37 % 44 %

Neglasbeniki 41 % 43 % 33 % 25 % 27 % 21 %

CHM–eu 60 % 73 % 20 % 30 % 33 % 20 %

CHM–cn 45 % 53 % 20 % 30 % 40 % 0 %

Narmour 50 % 60 % 20 % 35 % 25 % 40 %

Kot pravilna nadaljevanja izsekov smo upoštevali le tista, ki so dejanska

nadaljevanja skladbe. V primeru odlomka 1 (slika 5.1b na strani 31) je torej

pravilni odgovor –2, tj. premik za dva poltona navzdol, kar je tudi dejansko

nadaljevanje odlomka 1 (s slike 5.1a je razvidno nadaljevanje odlomka 1)1.

Udeleženci

V tem izseku se sklicujemo na tabelo 6.2, v kateri se nahajajo vrednosti

Wilcoxonega testa enakovrednih parov in Wilcoxonovega testa vsote rangov

za različne kombinacije skupin udeležencev, glasbenih slogov ter primerjavo

obeh vrst izsekov.

Evropski udeleženci so v povprečju pravilno rešili 58 % evropskih in 34 %

kitajskih izsekov. Razlika med obema blokoma je bila statistično pomembna,

tako v skupini glasbenikov kot neglasbenikov.

Glasbeniki so bili bolj uspešni od neglasbenikov tako pri reševanju evrop-

skega kot tudi kitajskega bloka. Razlike med skupinama glasbenikov in ne-

glasbenikov so bile pri glasbi obeh kultur statistično značilne.

1 V podpoglavju “Analiza tonskih hierarhij” za pravilnost odgovorov uporabljamo

drugačen kriterij, ki je razložen na začetku poglavja 6.1.


Tabela 6.2: Rezultati Wilcoxonovega testa enakovrednih parov (V ) in Wil-

coxonovega testa vsote rangov (W ).

Udeleženci Glasba Dodatni kriterij W V p

GlasbenikiEvropska : kitajska

3 < 0,001

Neglasbeniki 29 0,005

Glasbeniki : neglasbenikiEvropska 134 < 0,001

Kitajska 152 < 0,001

GlasbenikiEvropska

Zaključeni :

nezaključeni

izseki

129 < 0,001

Kitajska 476 0,050

NeglasbenikiEvropska 180 0,305

Kitajska 147,5 0,234

Pri evropskih izsekih so bili udeleženci bolj uspešni pri reševanju za-

ključenih kot nezaključenih izsekov, pri kitajskem delu pa so bolje reševali

nezaključene izseke. Glasbeniki so statistično pomembno bolje odgovarjali

za zaključene kot nezaključene izseke, tako pri evropskem kot tudi kitajskem

bloku (pri slednjem je bila razlika na meji statistično signifikantne). Pri

neglasbenikih so bile razlike manǰse.

Glede na to, da so zaključki fraz najbolj predvidljivi deli skladb (gl. po-

glavje 2.3), smo pričakovali, da bodo udeleženci (in tudi CHM) uspešneǰsi

pri reševanju zaključenih kot nezaključenih izsekov. Hipotezo smo potrdili

za skupino glasbenikov, nekoliko bolje pa so se razlike manifestirale ob po-

slušanju glasbe lastne kot tuje kulture.

Presenetilo nas je, da so neglasbeniki pri reševanju kitajskega bloka naj-

bolje odgovarjali za nezaključeni izsek cn16 (57-odstotna uspešnost), vendar

je razlog za to najverjetneje ta, da je šlo v zadnjem delu izseka za ponovitev

melodije s prvega dela izseka, zaradi česar so pravilni ton enkrat že slǐsali

in ga znali poustvariti2. Najslabše so udeleženci odgovarjali za zaključeni

izsek cn5 (skupno 5 % pravilnih odgovorov), in sicer je le 8 % glasbenikov

odgovorilo pravilno, izmed neglasbenikov pa nihče. To je bila edina izmed

vseh 40 skladb, pri kateri je bil pravilni odgovor 0 (obstanek na istem tonu),

2 Notni zapisi vseh eksperimentalnih izsekov se nahaja v prilogi B.


kar pa se udeležencem očitno ni zdelo ustrezno.

CHM

CHM, naučen na evropski učni množici (CHM–eu), je pravilno nadaljeval 60

% evropskih izsekov in 30 % kitajskih. V evropskem bloku je pravilno odgo-

voril za kar 73 % zaključenih izsekov, vendar le enega nezaključenega (tj. 20

%). Pri kitajskem delu je bila porazdelitev bolj enakomerna: pravilno je rešil

33 % zaključenih in prav tako kot v evropskem bloku le 20 % nezaključenih

izsekov.

CHM, naučen na kitajskih vzorcih (CHM–cn), je bil nekoliko manj uspe-

šen od CHM–eu. Zanimivo je, da je CHM–cn bolje reševal evropski del od

kitajskega, in sicer je pravilno nadaljeval 45 % evropskih izsekov in, enako

kot CHM–eu, le 30 % kitajskih.

CHM, predvsem CHM–eu, se zelo dobro približa uspešnosti udeležencev,

iz česar lahko sklepamo, da je model v nalogi glasbenega pričakovanja primer-

ljiv s povprečno izobraženim glasbenikom (naj rezultati naših udeležencev ne

zavedejo, saj so bili v povprečju relativno visoko glasbeno izobraženi ter so

izkazali visoko stopnjo glasbene sofistikacije).

Narmourjev model implikacije-realizacije

Glede na dejanske odgovore pri evropskem delu eksperimenta smo povzeli tri

preprosta pravila glede ugibanih tonov:

– so visoko na tonski hierarhiji (gl. poglavje 3.1.2),

– če je melodija na zgornji oz. spodnji meji razpona izseka, ugibani ton

spremeni smer melodije,

– so 7 ali manj poltonov oddaljeni od izhodǐsča.

Udeleženci se teh treh pravil dosledno držijo, CHM prvih dveh prav tako,

tretjega pa smo (s strožjo omejitvijo 5 ali manj poltonov oddaljenosti) im-

plementirali z omejitvijo možnih odgovorov, ki jih lahko poda model.


Teh pravil se drži tudi razširjeni Narmourjev model implikacije-realizacije

(poglavje 3.1, [65]). Izkazalo se je, da so pravila (nepopravljenega) razširje-

nega Narmourjevega modela prestroga, in posledično se je na naši nalogi

veliko slabše odrezal – pravilno namreč ni rešil niti enega evropskega izseka

in le tri kitajske (15 %). Pri večini skladb nepopravljeni model kot najbolǰsi

odgovor navede 0, kar je z vidika konformnosti s tonsko hierarhijo v skladbi

v večini primerov popolnoma sprejemljiv odgovor, ni pa najbolj verjeten.

Poleg tega daje preveliko težo odgovorom v neposredni bližini izhodǐsča (±nekaj poltonov).

Za potrebe naloge smo uporabili zgolj nabor kriterijev razširjenega mo-

dela implikacije–realizacije, saj se je osnovni model preveč osredotočal na

majhnost realiziranih intervalov oziroma prepogosto preferiral obstanek na

istem tonu. Obdržali smo kriterije melodični povratek, blǐzina, tonalnost, me-

lodična privlačnost in tessitura. Ta nabor kriterijev je podal najbolǰse možne

odgovore za naša eksperimentalna bloka. S tem smo dobili rezultate, primer-

ljive s CHM–eu, in sicer je popravljeni model implikacije–realizacije pravilno

nadaljeval 50 % evropskih in 35 % kitajskih skladb (tabela 6.1).

6.1 Analiza tonskih hierarhij

Zelo težko bi trdili, da je dejansko nadaljevanje izsekov tudi najbolǰse in edino

možno, saj se na istem mestu lahko več različnih tonov “slǐsi dobro”. Zato

smo v tem poglavju za določitev “pravilnih” nadaljevanj izsekov uporabili

drugačen kriterij kot v preǰsnjem. Za vsako evropsko in kitajsko skladbo

smo na podlagi njene tonske hierarhije določili možne odgovore in tako za

vsakega udeleženca izračunali, kako uspešen je bil pri nadaljevanju izseka.

Kot pravilna nadaljevanja skladb smo upoštevali vse tiste tone, ki se pojavijo

v ustrezni tonski hierarhiji oziroma lestvici. Tako je bilo za evropske skladbe

v duru možnih 7 različnih tonov (gl. sliko 6.1b), za molove pa 9 (dodani

zvǐsani 6. in 7. stopnja, ki se pojavljata v harmonični in melodični lestvici).

Za pravilne veljajo ti toni v kateri koli oktavi.


(a) Primer evropskega izseka (odlomek 3).

(b) Del možnih odgovorov.

Slika 6.1: Nabor možnih pravilnih odgovorov za zgornji evropski izsek vse-

buje vse tone C-durove lestvice.

Za kitajske skladbe je bilo možnih 5 različnih tonov (gl. sliko 6.2). Kot

pravilni veljajo ti toni v kateri koli oktavi.

(a) Primer kitajskega izseka (odlomek 1).

(b) Del možnih odgovorov.

Slika 6.2: Nabor možnih pravilnih odgovorov za zgornji kitajski izsek vse-

buje vse tone durove pentatonične lestvice z izhodǐsčem v tonu H[.

Pri evropskih izsekih je bilo tako izmed vseh možnih odgovorov po naši poe-

nostavljeni definiciji tonskih hierarhij pravilnih kar 60 % odgovorov (15 tonov

od 25) za skladbe v duru in 68 % (17 od 25) za molove skladbe. Pri kitajskih


je bila možnost pravilnega odgovora z ugibanjem nekoliko manǰsa, in sicer

44-odstotna (pravilnih je bilo 11 tonov od 25).

Evropski udeleženci so pravilneje reševali evropski kot kitajski del, in

sicer so bili pri evropskem delu 94,2-odstotno uspešni, pri kitajskem pa 89,7-

odstotno (uspešnost za evropski del – glasbeniki: 97,9 %, neglasbeniki: 87,9

%; kitajski del – glasbeniki: 95,6 %, neglasbeniki: 79,5 %). Primerjali smo

več kriterijev ter ali so med njimi statistično pomembne razlike. Med obema

testnima blokoma (tj. v evropskem v primerjavi s kitajskim) so bile po-

membne razlike znotraj obeh skupin udeležencev. Prav tako so bile po-

membne statistične razlike med glasbeniki in neglasbeniki znotraj posame-

znega testnega bloka. Natančni rezultati testov za preverjanje razlik med

različnimi skupinami so navedeni v tabeli 6.3.

Tabela 6.3: Rezultati Wilcoxonovega testa vsote rangov (primerjava glas-

benikov in neglasbenikov; W ) in Wilcoxonovega testa enakovrednih parov

(primerjava evropske in kitajske glasbe; V ).

Udeleženci Glasba W V p

Glasbeniki : neglasbenikiEvropska 370 0,900

Kitajska 152 < 0,001

GlasbenikiEvropska : kitajska

0 < 0,001

Neglasbeniki 32 < 0,001

Kljub temu da so evropski udeleženci statistično pomembno slabše reševali

kitajski del od evropskega, je bila njihova uspešnost zelo visoka – združena

skupina glasbenikov in neglasbenikov je pri kitajskem bloku dosegla skoraj

90-odstotno uspešnost, glasbeniki pa so bili skoraj popolnoma uspešni. Po-

trdimo lahko torej hipotezo, da se hitro prilagodimo na statistične tendence

glasbe nepoznanega sloga [22, 29, 31], pri tem pa pomembno vlogo igra tudi

glasbena izkušenost oziroma sofistikacija.

Kot je že navedeno, je bila uspešnost evropskih udeležencev 94,2-odstotna

za evropski in 89,7-odstotna za kitajski blok. Model CHM (tako CHM–eu


kot CHM–cn) je pravilno nadaljeval prav vse skladbe v evropskem ekspe-

rimentalnem bloku. Tako je bil torej na preizkusu z evropskimi skladbami

100-odstotno uspešen in posledično bolj uspešen od udeležencev.

Pri kitajskem eksperimentalnem bloku je bil CHM–cn prav tako 100-

odstotno uspešen, CHM–eu pa le 80-odstotno. Razlog, zakaj je bil CHM–cn

na evropskem delu popolnoma uspešen, CHM–eu pa na kitajskem delu ni bil,

je najverjetneje, da so vsi toni pentatonične lestvice podmnožica diatonične

lestvice.

6.1.1 Analiza evropskega izseka

V tabeli 6.4 je predstavljena tonska hierarhija odlomka 3 (slika 5.1d, Sli-

ka 6.1a), po teoriji tonskih hierarhij, opisani v poglavju 3.1.2. Tonaliteta

skladbe je C-dur. Toni C-durove lestvice so opremljeni z lestvičnimi sto-

pnjami (stolpec Stopnja). Stolpec Odgovor predstavlja oddaljenost v pol-

tonih od zadnjega slǐsanega tona v poslušanem izseku. Če se je izsek torej

zaključil na tonu E, so morali udeleženci za ton F drsnik premakniti za eno

stopnjo (en polton) navzgor. Tabela vsebuje tudi vsote uteži za odlomek 3,

kakršne je podal CHM.

V tonski hierarhiji imajo najvǐsje vrednosti toni, ki so del lestvice, od

tega največ tonika (I. stopnja, v tem primeru C), sledi dominanta (V. oz.

G), nato dominantna paralela (III. oz. E) in subdominanta (IV. oz. F), še

nekoliko nižje sta tonična paralela (VI. oz. A) in subdominantna paralela

(II. oz. D), najnižje pa vodilni ton (VII. oz. H) in nediatonični toni (brez

označenih stopenj oz. v tem primeru vsi toni z #).

CHM–eu je v skladu s teorijo tonskih hierarhij najvǐsje uteži dal tonom

ustrezne lestvice, z izjemo vodilnega tona (H oz. odgovor -5), ki je dobil zelo

nizko utež, kljub temu da je del C-durove lestvice; vendar, kot smo omenili

že prej, ima VII. stopnja tudi v tonski hierarhiji najnižjo utež.

CHM–cn je očitno našel manj ujemajočih se vzorcev, saj so njegove vsote

uteži veliko manǰse kot pri CHM–eu. Kljub temu je tudi CHM, naučen na

kitajski učni množici, deloma prepoznal tonsko hierarhijo, vendar je mogoče


Tabela 6.4: Tonska hierarhija in vsote uteži CHM za odlomek 3. Odebeljeno

je označeno dejansko nadaljevanje skladbe (C/–4) in najbolǰsa odgovora glede

na CHM.

Ton Stopnja Odgovor TonalnostVsota uteži

CHM–eu CHM–cn

H VII. -5 2,88 1,14 -

C I. -4 6,35 14,26 6,89

C# -3 2,23 1,23 0,83

D II. -2 3,48 24,01 8,64

D# -1 2,33 4,40 -

E III. 0 4,38 20,42 4,11

F IV. 1 4,09 16,70 3,85

F# 2 2,52 6,08 0,40

G V. 3 5,19 17,05 10,85

G# 4 2,39 2,88 0,83

A VI. 5 3,66 8,07 2,73

opaziti, da so najvǐsje uteži prejeli odgovori, ki so del tako diatonične (“evrop-

ske”) durove lestvice kot kitajske pentatonične lestvice.

V zgornji tabeli so predstavljeni zgolj toni, ki so od izhodǐsčnega oddaljeni

za 5 poltonov (navzgor ali navzdol), saj so bili to odgovori, ki so jih udeleženci

v veliki večini izbirali tako v našem eksperimentu (96,3 % za evropske in 95,6

% za kitajske skladbe, gl. sliko 6.3) kot tudi v drugih, npr. Carlsen 1981 [8].

Kot je že omenjeno, smo v tem poglavju kot nabor možnih odgovorov iz-

brali zelo poenostavljeno različico zgornje tonske hierarhije. Poenostavljeno

hierarhijo smo uporabili predvsem zato, da bi lahko primerjali rezultate

evropskih in kitajskih izsekov, saj za kitajski tonalni sistem še ne obstaja

podobna validirana hierarhija.

Podrobneje smo analizirali odgovore evropskih udeležencev na evropskem

glasbenem izseku (odlomek 3, slika 5.1d). Preverjali smo, kako dobro so se

melodična pričakovanja udeležencev skladala s predlaganim modelom tonskih


Slika 6.3: Frekvenčna porazdelitev odgovorov evropskih udeležencev na

vseh 40 eksperimentalnih nalog.

hierarhij (in ne “pravilnim” odgovorov oz. dejanskim nadaljevanjem izseka).

Rezultati udeležencev za odlomek 3 so predstavljeni v tabeli 6.5.

Tabela 6.5: Frekvenčna tabela odgovorov za odlomek 3 (dejanski odgovor

je –4).

Odgovor Del lestvice? Glasb. Neglasb. Skupaj

-4 X 6 (17 %) 5 (24 %) 11 (19 %)

-2 X 29 (81 %) 7 (33 %) 36 (63 %)

-1 - 1 (5 %) 1 (2 %)

0 X - 3 (14 %) 3 (5 %)

1 X 1 (3 %) 4 (19 %) 5 (9 %)

2 - 1 (5 %) 1 (2 %)

Skupaj 36 (100 %) 21 (100 %) 57 (100 %)

Razpršenost odgovorov je bila med neglasbeniki večja kot med glasbeniki,

kljub temu da je bila skupina glasbenikov skoraj dvakrat večja od skupine ne-

glasbenikov. Za evropski eksperimentalni blok je bila povprečna razpršenost

med glasbeniki 3,9 odgovorov, med neglasbeniki p

Kognitivni vidiki modeliranja glasbenih lastnosti z eksplicitnimi …pefprints.pef.uni-lj.si/5973/1/Magistrsko_delo_Medvesek.pdf · 2019. 9. 20. · Naslov: Kognitivni vidiki modeliranja

Documents