-
UNIVERZA V LJUBLJANI
v sodelovanju z Universität Wien, Univerzita Komenského v
Bratislave in
Eötvös Loránd Tudományegyetem
Špela Medvešek
Kognitivni vidiki modeliranja
glasbenih lastnosti z eksplicitnimi
globokimi arhitekturami
Magistrsko delo
SKUPNI INTERDISCIPLINARNI PROGRAM DRUGE
STOPNJE KOGNITIVNA ZNANOST
Mentor: izr. prof. dr. Matija Marolt
Somentorica: izr. prof. dr. Anja Podlesek
Ljubljana, 2019
-
Copyright. Rezultati magistrske naloge so intelektualna lastnina
avtorja in
Fakultete za računalnǐstvo in informatiko Univerze v
Ljubljani. Za objavo in
korǐsčenje rezultatov magistrske naloge je potrebno pisno
privoljenje avtorja,
Fakultete za računalnǐstvo in informatiko ter mentorja.
Besedilo je oblikovano z urejevalnikom besedil LATEX.
-
Zahvaljujem se mentorju, dr. Matiju Maroltu, in somentorici, dr.
Anji
Podlesek, za svetovanje, stalno dosegljivost in strokovno pomoč
pri izdelavi
magistrske naloge.
Posebna zahvala gre asistentu dr. Matevžu Pesku, ki je s svojim
preteklim
delom omogočil nastanek te naloge, me spodbujal pri delu in
skrbel, da nisem
že zdavnaj obupala.
Hvala Nuši, Ani in Gregu za prevode, povratne prevode in
preverjanje
prevedenega vprašalnika MSI.
Hvala Zali za pomoč pri oblikovanju spletne strani z
vprašalnikom. Brez
nje bi bila eksperimentalna naloga veliko bolj dolgočasna.
Hvala Urši in Mihu, ki sta mi pri programiranju spletne strani
priskočila
na pomoč, kadar se je kje zataknilo.
In navsezadnje hvala vsem, ki so mi v času študija, predvsem
pa med
dolgotrajnim pisanjem te naloge, stali ob strani.
-
Kazalo
Povzetek
Abstract
1 Uvod 1
2 Pregled področja 4
2.1 Pridobivanje informacij iz glasbe in kognitivna muzikologija
. 4
2.2 Vpliv kulture na glasbeno kognicijo . . . . . . . . . . . .
. . . 6
2.3 Glasbeno pričakovanje . . . . . . . . . . . . . . . . . . .
. . . 9
3 Računski modeli glasbenega pričakovanja 11
3.1 Narmourjev model implikacije–realizacije . . . . . . . . . .
. . 11
3.2 Kompozicionalni hierarhični model . . . . . . . . . . . . .
. . 15
4 Raziskava A: Indeks glasbene sofistikacije 21
4.1 Adaptacija vprašalnika za nov kulturni prostor . . . . . .
. . . 21
4.2 Validacija vprašalnika Gold-MSI (CFA) . . . . . . . . . . .
. . 24
4.3 Adaptacija vprašalnika Gold-MSI (EFA) . . . . . . . . . . .
. 28
5 Raziskava B: Glasbeno pričakovanje 30
5.1 Materiali . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . 30
5.2 Postopek . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . 33
5.3 Udeleženci . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . 34
5.4 Pridobivanje odgovorov CHM . . . . . . . . . . . . . . . . .
. 36
-
6 Raziskava B: Rezultati 37
6.1 Analiza tonskih hierarhij . . . . . . . . . . . . . . . . .
. . . . 41
6.2 Vpliv poznavanja glasbe tuje kulture . . . . . . . . . . . .
. . 51
6.3 Vpliv velikosti učne množice na rezultate . . . . . . . .
. . . . 52
6.4 Povprečje obratnih vrednosti rangov . . . . . . . . . . . .
. . 53
6.5 Pilotska študija s kitajskimi udeleženci . . . . . . . . .
. . . . 56
7 Zaključek 58
7.1 Predlogi za izbolǰsave . . . . . . . . . . . . . . . . . .
. . . . . 59
7.2 Nadaljnje delo . . . . . . . . . . . . . . . . . . . . . . .
. . . . 60
Literatura 62
A Slovenski vprašalnik Gold-MSI 70
B Notni zapisi eksperimentalnih izsekov 73
-
Povzetek
Naslov: Kognitivni vidiki modeliranja glasbenih lastnosti z
eksplicitnimi
globokimi arhitekturami
Avtor: Špela Medvešek
Kompozicionalni hierarhični model je globoka arhitektura, ki jo
odlikuje
transparentnost, eksplicitnost naučenih konceptov in zmožnost
učenja na
majhnih množicah podatkov. Model smo preizkusili na nalogi
melodičnega
pričakovanja ob predhodnem poznavanju glasbe različnih kultur
ter primer-
jali uspešnost njegovih napovedi z napovedmi ljudi. Izvedli smo
eksperi-
ment, s katerim smo ocenili sposobnost napovedovanja
nadaljevanja izsekov
zahodne in kitajske glasbe na dveh skupinah udeležencev –
Evropejcih (Slo-
vencih) in Kitajcih. Poznavanje glasbenega sloga pripomore k
nižji zaznani
kompleksnosti, ugotovili pa smo, da enako velja tudi za nalogo
glasbenega
pričakovanja: udeleženci so bili uspešneǰsi pri
napovedovanju nadaljevanja
vzorca pri glasbi lastne kulture kot pri glasbi tuje kulture.
Tudi model je
prilagajal način modeliranja vzorcev glede na različne
naučene tipe glasbe,
pri čemer je bil v nekaterih aspektih celo uspešneǰsi od
ljudi.
Ključne besede: kompozicionalni hierarhični model, glasbeni
vzorci, me-
lodično pričakovanje, vpliv kulture, glasbena kognicija.
-
Abstract
Title: Cognitive aspects of modelling musical characteristics
using explicit
deep architectures
Author: Špela Medvešek
The compositional hierarchical model is a deep architecture
characterized
by transparency, explicitness of learned concepts, and the
ability to learn on
small datasets. The model was tested on the task of melodic
expectation with
the prior knowledge of the music of different cultures, and its
performance
in terms of the correctness of predictions was compared with
human perfor-
mance. An experiment was conducted, assessing the ability of two
groups of
participants—European (Slovene) and Chinese—to predict the
continuations
of Western and Chinese musical excerpts. Familiarity with the
musical style
contributes to a lower perceived complexity, and we found that
the same
applies to the task of musical expectation: the participants
were more suc-
cessful in predicting the continuations in the music of their
own culture than
the foreign one. Furthermore, the model also adapted the pattern
modelling
method with regard to the different types of music learned, and
in some
aspects, it was even more successful than people.
Keywords: Compositional hierarchical model, musical patterns,
computer
modelling, cultural influence, musical cognition.
-
Poglavje 1
Uvod
V zadnjem času je v kognitivni znanosti zelo priljubljena
teorija predikcij-
skega procesiranja, ki trdi, da si na podlagi konteksta in
predhodnih izkušenj
ustvarimo pričakovanja oziroma predikcije o prihajajočih
dogodkih. Pristopi,
ki uporabljajo probabilistične modele za posnemanje kognitivnih
procesov,
lahko zelo uspešno razložijo človeško vedenje na računskem
nivoju. To lahko
učinkovito prenesemo tudi v kontekst glasbenega pričakovanja
oziroma na-
povedovanja melodije, saj imamo relativno enostavne vhodne
signale z ome-
jenim naborom možnih nadaljevanj (za razliko od npr. vidnega
zaznavanja),
napovedovanje pa olaǰsajo še predhodne izkušnje oziroma vpliv
kulturnega
in socialnega okolja.
Vpliv kulturnega ozadja na glasbeno kognicijo je bil raziskan in
dokazan
že za mnoga področja glasbenega udejstvovanja, v pričujoči
nalogi pa smo se
osredotočili na glasbeno pričakovanje in napovedovanje
melodije. Za modeli-
ranje predikcijskih procesov v zaznavanju glasbe smo uporabili
kompozicio-
nalni hierarhični model (angl. Compositional hierarchical model
oz. CHM),
ki je bil do sedaj že uspešen pri reševanju različnih nalog
s področja pridobi-
vanja informacij iz glasbe. CHM je bil naučen na dveh učnih
množicah, od
katerih je prva vsebovala glasbo evropske (nemške) in druga
kitajske kulture.
Dodali smo mu komponento za predvidevanje nadaljevanja vzorca.
Za eval-
vacijo rezultatov smo uporabili obstoječe baze skladb, ki so se
v preteklosti
1
-
2 Špela Medvešek
že uporabljale za analizo na področju pridobivanja informacij
iz glasbe.
Delovanje modela smo primerjali s človeškim zaznavanjem skozi
ekspe-
riment, v katerem smo sprva ocenili sposobnost napovedovanja
nadaljeva-
nja melodičnega izseka na skupini ljudi, nato pa to sposobnost
primerjali
s sposobnostjo predlaganega računskega modela. Eksperiment smo
izvedli
na evropski in kitajski ljudski glasbi. Osredotočili smo se na
to, kako sku-
pina ljudi in računski model ob predhodnem poznavanju evropske
glasbe
predvidevata vzorce v evropski glasbi ter glasbi tujega
(neevropskega) iz-
vora. Z uporabo dveh različnih učnih in testnih množic smo
analizirali vpliv
predhodnega poznavanja glasbe posameznega tipa oz. kulturnega
ozadja ter
preverjali, ali tudi model odraža latentne probabilistične
modele, na katere
namigujejo človeški kognitivni procesi.
Naše glavno raziskovalno vprašanje je bilo, kako uspešen je
kompozici-
onalni hierarhični model v primerjavi z ljudmi pri nalogi
glasbenega pri-
čakovanja ter kako na uspešnost vpliva predhodni trening oz.
specifična
učna množica. Poleg tega smo preizkusili tudi nasprotujoče si
ugotovitve o
uspešnosti pri nalogi glasbenega pričakovanja v glasbi tuje
kulture. Priča-
kovali smo, da bo uporabljeni model prilagajal način
predvidevanja oz. mo-
deliranja vzorcev glede na različne naučene tipe glasbe ter da
bo delovanje
modela uspešno posnemalo človeško zaznavanje.
V prvem delu naloge na kratko povzamemo dosedanje ugotovitve s
področij
vpliva kulture na glasbeno kognicijo in glasbenega
pričakovanja. Nadalju-
jemo z opisom razširjenega modela implikacije–realizacije,
katerega delova-
nje smo primerjali s kompozicionalnim hierarhičnim modelom, ki
je opisan v
nadaljevanju poglavja 3. Nato obrazložimo še algoritem, s
pomočjo katerega
CHM “rešuje nalogo”.
V poglavju 4 opǐsemo raziskavo A, v kateri smo prevedli in
evalvirali
Goldsmithsov indeks glasbene sofistikacije – samoocenjevalni
vprašalnik, s
pomočjo katerega smo ocenjevali glasbeno predznanje
udeležencev. Predsta-
vimo postopek adaptacije tovrstnih vprašalnikov za drug
kulturni prostor
-
Magistrska naloga 3
ter utemeljimo in predstavimo skraǰsano različico omenjenega
vprašalnika,
ki smo ga uporabili v raziskavi B.
Sledi opis metode raziskave B, in sicer opǐsemo postopek
zbiranja skladb,
uporabljenih v eksperimentu, uporabnǐski vmesnik, ki smo ga za
ta namen
izdelali, udeležence v eksperimentu in postopek pridobivanja
odgovorov mo-
dela CHM.
V poglavju 6 predstavimo rezultate evropskih udeležencev,
modela CHM
in modela implikacije–realizacije, nazadnje pa še na kratko
povzamemo re-
zultate pilotske študije s kitajskimi udeleženci. Na koncu
omenimo še nekaj
predlogov za izbolǰsave ter idej za nadaljnje delo s
kompozicionalnim hie-
rarhičnim modelom.
-
Poglavje 2
Pregled področja
2.1 Pridobivanje informacij iz glasbe in kog-
nitivna muzikologija
Magistrska naloga združuje področji pridobivanja informacij iz
glasbe (ang.
music information retrieval – MIR) in kognitivno muzikologijo.
Pridobivanje
informacij iz glasbe je interdisciplinarno področje s
koreninami v muzikologiji,
strojnem učenju, procesiranju signalov in psihologiji. Cilj MIR
je najti mo-
dele, ki najbolje rešijo zadano nalogo, medtem ko računsko
preučevanje glas-
bene kognicije poskuša modelirati človeško kognicijo [7]. Od
ostalih področij
glasbene psihologije se kognitivna muzikologija razlikuje po
metodoloških pri-
stopih, in sicer uporablja računalnǐsko modeliranje za
preučevanje reprezen-
tacij glasbenega znanja [33]. Pri raziskovanju so pogosto
vključeni biološko
navdahnjeni modeli, npr. nevronske mreže in evolucijski
algoritmi.
Zanimivi in med seboj povezani temi na stičǐsču teh dveh
disciplin sta
hierarhično modeliranje glasbe in iskanje vzorcev v glasbi.
Hierarhično mo-
deliranje obravnava vse od najosnovneǰsih vidikov glasbe, npr.
prepoznave
tonskih vǐsin iz frekvenc slušnih signalov, do vǐsjih, kot so
dojemanje hierarhij
znotraj lestvice, prepoznave akordov, harmonij, motivov in fraz
[25]. Primer
hierarhičnega pristopa k analizi glasbe je shenkerjanska
tonalna analiza (angl.
Schenkerian analysis), izvorno poimenovana redukcijska analiza
(nem. Re-
4
-
Magistrska naloga 5
duktionsanalyse). Teorija prikazuje, da je vsako skladbo možno
(postopoma)
poenostaviti na njeno fundamentalno strukturo ter da so melodije
v svojem
bistvu zgolj dodelave osnovne strukture, imenovane Ursatz.
Najosnovneǰse
sosledje harmonij je tonika-dominanta-tonika (I–V–I; slika 2.1),
do katerega
pridemo s transformacijami od najvǐsjega nivoja, tj. celotne
skladbe, do
najnižjega, tj. Ursatz. Teorijo pa lahko uporabimo ne le za
namen poenosta-
vitve melodije, temveč tudi kot prikaz skladateljevega talenta
in zmožnosti
predelave ter dodelave osnovne strukture v edinstveno skladbo
[48].
Slika 2.1: Prikaz osnovne strukture skladbe v C-duru (nem.
Ursatz ) –
zgornja vrstica predstavlja osnovni potek padajoče melodije s
pričetkom na
tonu E oz. 3. stopnji C-durove lestvice (nem. Urlinie), spodnja
pa to-
nike akordov, ki bi predstavljali harmonijo (nem. Bassbrechung).
Pridobljeno:
http://www.schenkerguide.com/whatisschenkeriananalysis.php, 4.
5. 2019.
Schenkerjeva analiza ne zapoveduje določenega algoritma, po
katerem bi
se gradilo hierarhije v glasbi, temveč se lahko smatra bolj kot
osnova za
hierarhično analizo [26]. Ravno zaradi tega na njej temelji
mnogo pozneǰsih
analiz in glasbenih modelov, npr. [16, 39, 40, 62, 66], posredno
pa tudi model
CHM, predstavljen v pričujoči nalogi.
S pomočjo analize, prepoznavanja ter strukturiranja motivov in
fraz lahko
učinkovito rešujemo nalogo iskanja ponavljajočih vzorcev v
glasbi, pri čemer
se je za uspešnega izkazal tudi CHM [25, 56].
-
6 Špela Medvešek
Področje kognitivne muzikologije med drugim raziskuje tudi
vzporednice
v možganih med jezikovnimi in glasbenimi dogodki [19]. Tako
jezik kot glasba
sta povezana s procesiranjem zvoka. Za oba je potrebna
interpretacija več
lastnosti zvoka, kot so barva, tonska vǐsina, trajanje in
njihove interakcije
[18].
Nekateri aspekti jezika in glasbe so dokazano procesirani v
istih funkcio-
nalnih možganskih delih, in sicer v primarnem in sekundarnem
avditornem
korteksu, temporalnem režnju, Brocovem centru, primarnem in
suplementar-
nem motoričnem korteksu, anteriorni insuli, bazalnih ganglijih,
ventralnemu
talamusu in posteriornem cerebelumu. Pri jeziku je opazna
lateralizacija – za
jezikovne naloge se specializira dominantna hemisfera (navadno
leva) –, glas-
bene aktivacije pa se dogajajo na obeh hemisferah, zaradi česar
se aktivnosti
jezikovnih in glasbenih procesov pogosto prekrivajo [6].
Enako kot se aktivirajo določeni možganski procesi, ko
slǐsimo znan jezik,
lahko v možganih vidimo razliko v aktivacijah pri poslušanju
glasbe, ki jo
poznamo [42, 60]. Tudi neskladja v glasbi na nivoju glasbene
sintakse sprožijo
enake možganske odzive, kot so bili opazovani v jezikoslovnih
eksperimentih
[36, 44, 49].
2.2 Vpliv kulture na glasbeno kognicijo
Vpliv kulture na glasbeno kognicijo je bil raziskan in dokazan
že za mnoge
vidike glasbe, npr. glasbeno segmentacijo [44], prepoznavanje
razpoloženja
[3], zaznavanje ritmične [13] in melodične kompleksnosti
[15].
Mnogi eksperimenti, ki preučujejo glasbeno kognicijo, so
zasnovani na je-
zikoslovnih študijah. Maess idr. [36] so v študiji z MEG so
pokazali, da Bro-
cov center, ki igra pomembno vlogo pri zgodnjem procesiranju
neskladnosti
v sintaksi, tudi pri glasbenih neskladjih manifestira podobne
aktivacije. To
predpostavko so nato Nan in drugi [44] prenesli na področje
prepoznavanja
segmentov (fraz) v glasbi in v EEG raziskavi pokazali, da
neskladja v glasbi
sprožijo enake možganske odzive kot jezikovna neskladja. Pri
udeležencih so
-
Magistrska naloga 7
opazili univerzalni označevalec prozodičnega segmentiranja
fraz, angl. closure
positive shift (CPS), ki se pojavlja tako pri poslušanju govora
in glasbe kot
branju. Glasbeni CPS se je pojavljal med 100 in 450 ms po koncu
fraze; bolj
zgodaj pri poslušanju glasbe lastne kulture (Nemci pri
poslušanju evropske,
Kitajci pri poslušanju kitajske glasbe) in pozneje pri
poslušanju tuje glasbe
(Nemci pri poslušanju kitajske, Kitajci pri poslušanju
evropske glasbe) [44].
Glasba različnih kultur aktivira iste oziroma zelo podobne
možganske re-
gije, kar so pokazali tudi Morrison in drugi v študiji s
funkcionalno magnetno
resonanco (fMRI) [42]. V splošnem se nevrofiziološke raziskave
strinjajo, da
je možno opazovati razlike v možganskih aktivacijah, kadar
poslušamo glasbo
lastne in kadar poslušamo glasbo tuje kulture. Pri dokazovanju
tega pa so
bili še bolj uspešni behavioristični eksperimenti.
Vpliv kulture je bil dokazan že za mnoge aspekte glasbene
kognicije, npr.
izražanje glasbenih preferenc [63], prepoznavanje razpoloženja
in čustev v
glasbi [3], glasbeni spomin [14] itd. Že pri otrocih se
pokažejo preference za
kulturno poznane glasbene tradicije [14, 63]. Tudi glasbeni
spomin posame-
znika je bolǰsi za kulturno poznano kot neznano glasbo [14].
Vpliv kulture
je viden tudi pri ritmu, ki je eden od faktorjev, ki je kot
stalna in periodična
mera časovne organizacije prisoten v vseh svetovnih glasbah.
Preferenco za
ritem svoje kulture opazimo že zgodaj. Kultura prav tako vpliva
na prepo-
znavanje ritma, in sicer se nam tuji ritmi zdijo kompleksneǰsi,
zato jih težje
prepoznamo [12].
Prepoznavanje razpoloženja in klasifikacija čustev v glasbi
pri odraslih sta
odvisna tako od kulturno-specifičnih kot univerzalnih
strukturnih lastnosti
poslušane glasbe. Balkwill in Thompson [3] sta raziskovala, ali
zahodni po-
slušalci znajo prepoznati čustva (intended emotion) v glasbi v
nepoznanem
tonalnem sistemu, v njunem primeru v hindujski glasbi. Ugotovila
sta, da
smo ljudje v glasbi v tujem tonalnem sistemu zmožni prepoznati
osnovna
čustva, npr. veselje, žalost in jezo, ne pa kompleksneǰsih in
takšnih, ki se
morda razlikujejo od kulture do kulture – kot primer slednjega
navajata
“mir” [3]. Fritz in drugi [17] so opravili raziskavo tudi v
obratni smeri, in
-
8 Špela Medvešek
sicer so preverjali, ali tudi nezahodni (v tem primeru afrǐski)
udeleženci pre-
poznajo čustva v zahodni glasbi. Prǐsli so do enakega
zaključka, torej da je
tudi v zahodni glasbi izraz osnovnih emocij univerzalno
prepoznaven.
Pri raziskavah kompleksnosti, tako ritmične kot melodične,
velja omeniti
dve raziskavi, ki sta preučevali afrǐsko in evropsko glasbo
[13, 15]. Udeleženci
so pri obeh raziskavah glasbo lastne kulture ocenjevali kot manj
kompleksno
od glasbe tuje kulture. Tujo glasbo pa so ocenjevali kot
kompleksneǰso od
glasbe lastne kulture, a so Afričani evropsko dojemali bistveno
manj komple-
ksno kot Evropejci afrǐsko. To je najverjetneje posledica
razširjenosti zaho-
dne kulture ali z drugimi besedami, ljudje po vsem svetu so
dodobra sezna-
njeni z zahodno kulturo in glasbo, zaradi česar manj robustne
kulture hitro
izginjajo ali v manj radikalnih primerih kažejo “zgolj” globoko
infiltracijo
zahodnih glasbenih temeljev [22].
Področje raziskovanja glasbe, ki je za našo raziskavo
najpomembneǰse,
pa je glasbeno pričakovanje. Izmed vseh zgoraj predstavljenih
se pri tem
aspektu najmanj manifestirajo razlike med kulturami [9, 30, 31].
Tovrstne
študije se navadno izvajajo na dveh skupinah udeležencev
(običajno je ena
zahodna – Evropejci ali Američani – in ena tuja – v raziskavah
po večini
sodelujejo Afričani ali Azijci). Naloga udeležencev je
napovedati, kako se bo
nadaljeval segment glasbe lastne in tuje kulture. Na splošno se
udeleženci iz
različnih kultur zelo podobno odločajo glede nadaljevanj v
skladbah lastne in
tuje kulture. V eni izmed raziskav (Krumhansl et al. [30]) pa so
se neevrop-
ski udeleženci celo točneje odločali v primeru evropske
glasbe, s pomembno
opombo, da so bili dobro seznanjeni z evropskimi klasičnimi
deli in so se
posledično odločali bolj v skladu z glasbeno teorijo kot
Evropejci, ki imajo
bolj “splošno” (tj. ne omejeno na en sam slog) znanje o zahodni
glasbi.
Ugotovljeno je bilo tudi, da so poslušalci dokaj fleksibilni
glede odziva
na strukturo glasbe nepoznanega stila, torej da se hitro
privadijo na različne
glasbene sisteme ter so zmožni že po kratki izpostavljenosti
“zatreti” priča-
kovanja, ki se ne bi skladala s slogom poslušane glasbe [22,
31]. Za to obsta-
jata dve možni razlagi, in sicer (1) da se pri poslušanju že
učimo značilnosti
-
Magistrska naloga 9
sloga oziroma, z drugimi besedami, pozorni smo na stilistične
težnje v glasbi,
ali (2) da obstajajo osnovni psihološki principi oz.
univerzalne lastnosti
glasbe, ki jih lahko prenesemo na različne glasbene sloge.
2.3 Glasbeno pričakovanje
Napovedovanje igra pomembno vlogo pri procesiranju informacij.
To sta
ugotavljala že Hermann von Helmholtz [20] in William James [23]
konec 19.
stoletja, teorija predikcijskega procesiranja pa v zadnjem času
le še pridobiva
na priljubljenosti [10, 61].
Predikcijski mehanizmi temeljijo na konstruiranju reprezentacij
na osnovi
konteksta in predhodnih izkušenj, ki se manifestirajo skozi tok
informacij od
zgoraj navzdol (angl. top-down). Koncept predikcijskega
procesiranja se je
uspešno uveljavil na mnogih področjih, še posebno pri
obdelavi senzornih
informacij [34].
Sears et al. [61] navajajo primer hoje po stopnicah – možgani
si ustva-
rijo miselno reprezentacijo stopnǐsča, pri čemer si pomagajo
z vizualnimi,
avditornimi, haptičnimi in proprioceptičnimi dražljaji. Z
neprestanim po-
sodabljanjem te reprezentacije minimalizirajo potencialne napake
v njej in
zato lahko brez pretirane nevarnosti hodimo po stopnicah. Z
izpostavljeno-
stjo podobnim situacijam naše predikcijske sheme postanejo
natančneǰse in
lažje predvidimo prihodnje dogodke.
Prvi, ki je predikcijsko procesiranje uporabil na področju
glasbe, je bil
Leonard B. Meyer [41], čigar teorijo je za osnovo vzel Eugene
Narmour in
ustvaril model realizacije–implikacije [45, 46] (gl. poglavje
3.1), ki predpo-
stavlja, da si na podlagi intervalov v skladbi ustvarimo
pričakovanja o na-
daljevanju melodije. To predpostavko lahko skladatelji
izkoristijo na primer
za ustvarjanje glasbe, ki si jo bodo poslušalci zlahka
zapomnili [27], ali pa
za komponiranje nepričakovanih melodij, ki bi poslušalce
presenetile ali kako
drugače zaznamovale.
Obširno raziskano glasbeno področje z vidika pričakovanja so
kadence, tj.
-
10 Špela Medvešek
kombinacije akordov oziroma tonskih stopenj, ki označujejo
konec skladbe
oziroma dela skladbe. Kadence vzpostavijo najbolj predvidljiva
shematska
pričakovanja v glasbi [61] (najmočneǰsi je na primer razvez
iz dominante v
toniko [1]), zato lahko predvidevamo, da se bo to odražalo tudi
pri reševanju
eksperimentalne naloge, in sicer smo pričakovali, da bodo
udeleženci pravil-
neje odgovarjali glede pričakovanega nadaljevanja glasbe za
glasbene izseke,
pri katerih je potrebno ugibati zaključek fraze (kadence), kot
za izseke, pri
katerih je bilo treba ugibati nezaključni ton v frazi.
Sodobneǰsi pristopi, ki s pomočjo probabilističnih modelov
posnemajo
človeške kognitivne procese, lahko v nekaterih primerih zelo
dobro razložijo
človeško vedenje na računskem nivoju [38]. Glasba, predvsem
monofonska,
je eno takšnih področij, ki so lahko zelo uspešno modelirana,
saj nudi le
omejen nabor možnih elementov [57] oziroma nadaljevanj (za
razliko od npr.
vidnega zaznavanja, kjer so elementi veliko manj diskretni, meje
med njimi
pa so lahko zelo zabrisane). Napovedovanje melodije pa nam
dodatno olaǰsa
(ali pa oteži) tudi predhodno poznavanje glasbene kulture.
-
Poglavje 3
Računski modeli glasbenega
pričakovanja
S porastjo računalnǐske tehnologije se je konec preǰsnjega
stoletja začelo
večati tudi zanimanje za računalnǐsko pridobivanje informacij
iz glasbe in
njeno analizo. Od takrat je nastalo že veliko modelov, ki se
ukvarjajo z
najrazličneǰsimi nalogami MIR.
V tem poglavju predstavimo dva računska modela za modeliranje
glasbe-
nega pričakovanja, katerih uspešnost primerjamo v nalogi:
razširjeni Narmo-
urjev model implikacije–realizacije (IR) in kompozicionalni
hierarhični model
(CHM).
Model IR je nastal kot alternativa schenkerjanski analizi.
Slednja se
osredotoča na glasbeno analizo, IR pa predvsem na kognitivne
aspekte me-
lodičnega pričakovanja. CHM je sodobna globoka arhitektura, ki
z nenadzo-
rovanim učenjem ǐsče vzorce v glasbi, implementirali pa smo
ji tudi kompo-
nento za napovedovanje nadaljevanja melodije.
3.1 Narmourjev model implikacije–realizacije
Eugene Narmour je za osnovo vzel teorijo glasbenega
pričakovanja Leonarda
Meyerja [41], ki temelji na razumevanju glasbene strukture ter
zaznavanju
11
-
12 Špela Medvešek
glasbenih emocij in pomena, in jo razvil v kompleksno teorijo
melodične per-
cepcije, ki jo je poimenoval model implikacije–realizacije
(angl. the implication–
realization (IR) model) [45].
Osredotoča se na implikativne intervale, s pomočjo katerih si
ustvarimo
pričakovanja o nadaljevanju melodije, in realizirane intervale,
ki ta pričako-
vanja oz. implikacije (predvidoma) izpolnijo oz. realizirajo
[65]. Z drugimi
besedami, model opazuje zaznavne sisteme, ki procesirajo
informacije od zgo-
raj navzdol (angl. top-down), in tiste, ki procesirajo
informacijo od spodaj
navzgor (angl. bottom-up), na podlagi katerih si zgradimo
melodične re-
prezentacije. Top-down procesiranje glasbe lahko enačimo z
implikacijo oz.
pričakovanjem, njihove realizacije pa spadajo v sistem
bottom-up reprezen-
tacij, ki so priučene, odvisne od glasbenega znanja in
izkušenj ter specifične
za glasbene kulture [50].
Model IR vsebuje pet kriterijev, na podlagi katerih se ocenjuje
primernost
realiziranega intervala:
– smer melodije, angl. registral direction: implikativni
intervali, veliki
8 poltonov ali več, implicirajo spremembo smeri melodije,
manǰsi pa
ohranitev smeri,
– melodični povratek, angl. registral return: preferira
povratek na
prvi ton implikativnega intervala oz. odmik od slednjega za
največ 2
poltona navzgor ali navzdol,
– intervalna razlika, angl. intervallic difference: implikativni
intervali,
veliki 5 poltonov ali manj, implicirajo podobno velike
realizirane inter-
vale (z odmikom za 2 poltona navzgor ali navzdol pri spremembi
smeri
melodije oziroma 3 poltone pri ohranitvi smeri), implikativni
intervali
večji od 5 poltonov pa manǰse realizirane,
– bližina, angl. proximity : preferira realizirane intervale,
velike 5 polto-
nov ali manj,
– zaključenost, angl. closure: implicira spremembo smeri
melodije ali
-
Magistrska naloga 13
manǰsi realizirani interval od implikativnega, če je bil
implikativni in-
terval velik (vsaj 3 poltone večji od realiziranega)
Model preferira majhne realizirane intervale in ohranitev smeri
melodije ozi-
roma obstanek na istem tonu, v primeru večjih realiziranih
intervalov pa
spremembo smeri melodije.
3.1.1 Razširjeni model implikacije–realizacije
Petim osnovnim kriterijem Narmourjevega modela so pozneje
različni avtorji
dodali še pet kriterijev, ki pa ne temeljijo vsi na realizaciji
implikativnih
intervalov. Dodani kriteriji so:
– sozvočnost, angl. consonance: preferirani realizirani
intervali so so-
zvočni intervali: prima, čista kvarta, čista kvinta in oktava
[28],
– tonalnost, angl. tonality : preferirani so tonsko stabilneǰsi
toni, gl.
Poglavje 3.1.2 [27],
– melodična privlačnost, angl. melodic attraction: razmerje
tonalno-
sti obeh tonov v realiziranem intervalu [35],
– tessitura : napoveduje tone, ki so blizu srednji legi melodije
[21],
– mobilnost, angl. mobility : na podlagi avtokorelacije med
zaporednimi
tonskimi vǐsinami ocenjuje, kako napovedljiv je posamezen ton
glede
na preǰsnje tone in srednjo lego [21].
V nadaljevanju podrobneje predstavimo kriterij tonalnost.
Njegovo poeno-
stavljeno različico smo uporabili tudi za analizo primernosti
odgovorov v
raziskavi B.
3.1.2 Tonske hierarhije
Teorija tonskih hierarhij sloni na predpostavki, da so
statistično pogosti glas-
beni vzorci (v večini primerov) zanesljive smernice za
poslušalčevo abstrahi-
ranje tonske hierarhije. Z drugimi besedami, poslušalci so se
ob upoštevanju
-
14 Špela Medvešek
sloga skladbe zmožni orientirati k pravi tonalni hierarhiji,
njihovo zaznavanje
pa se sklada s frekvencami pojavitve tonov in njihovih
kombinacij.
Hierarhijo tonov vzpostavi glasbeni kontekst. Določeni toni so
značilnej-
ši, stabilneǰsi in pomembneǰsi za strukturo kot drugi. V
klasični zahodni
tonalno-harmonični glasbi 18. in 19. stoletja je glavni ton v
hierarhiji to-
nika, sledita mu dominanta in dominantna paralela, nato ostali
toni lestvice,
nazadnje pa še toni, ki niso del lestvice. Ta hierarhija
odraža vpliv triadične
(akordne) strukture, v kateri dominirajo konsonantni akordi.
Krumhansl [29] je za namen kvantificiranja tonskih hierarhij
uporabila
metodo probe tone, pri kateri so udeleženci poslušali
nezaključene lestvice
ter ocenjevali (s pomočjo lestvice Likertovega tipa z
vrednostmi 1–7), kako
dobro posamezni toni to lestvico zaključijo. Rezultati so
transponirani v
skupno tonaliteto in predstavljeni v tabeli 3.1. Kot že
omenjeno v preǰsnjem
odstavku, dobi najvǐsjo vrednost tonika (v primeru C-dura oz.
c-mola je to
ton C).
Tabela 3.1: C-durova tonska hierarhija, pridobljena z metodo
probe tone.
ton C C# D D# E F F# G G# A A# B
C-dur 6,35 2,23 3,48 2,33 4,38 4,09 2,52 5,19 2,39 3,66 2,29
2,88
c-mol 6,33 2,68 3,52 5,38 2,60 3,53 2,54 4,78 3,98 2,69 3,34
3,17
Toni, ki so vǐsje v tonski hierarhiji, se pojavljajo pogosteje
in na poudar-
jenih metričnih pozicijah ter trajajo dlje [27], poleg tega pa
vǐsje kot so v
hierarhiji, hitreje jih prepoznamo kot del lestvice [24].
Poleg glasbenih referenčnih točk, ki vodijo glasbeno
percepcijo, glasbeni
spomin in razumevanje, so poslušalci občutljivi tudi na
pogosta zaporedja
zvokov [58, 59]. S ponavljajočim poslušanjem implicitno
razvijejo men-
talne reprezentacije, ki odražajo glasbene konsistentnosti, s
pomočjo kate-
rih nato šifrirajo in pomnijo glasbene vzorce ter med
poslušanem generirajo
pričakovanja. Občutljivost na te konsistentnosti omogoča
relativno hitro pri-
lagoditev novim glasbenim slogom.
Koncept, da je en centralni ton referenčna točka za množico
hierarhično
-
Magistrska naloga 15
povezanih tonov, pa ni lasten zgolj zahodnemu
tonsko-harmoničnemu slogu,
temveč tudi drugim slogom in kulturam, edinstvene hierarhije pa
se lahko
vzpostavijo tudi znotraj posameznih skladb.
Zahodni poslušalci so se v poskusu Castellana idr. [9] hitro
prilagodili
tonskih hierarhijam nepoznanega (indijskega) sloga. Izkazalo se
je, da so
pomembneǰsi toni zaigrani večkrat, zaradi česar so
poslušalci, ki s slogom
niso seznanjeni, zmožni najti primerno tonsko hierarhijo [9].
Že neizkušeni
poslušalci so fleksibilni in se hitro prilagodijo na tonska
zaporedja v neznanih
glasbenih kontekstih, pri glasbeno izobraženih pa je
statistično procesiranje
glasbe še bolj poudarjeno [47].
3.2 Kompozicionalni hierarhični model
V zadnjem času so na področju strojnega učenja in
prepoznavanja vzorcev
postale popularne t. i. globoke arhitekture, še posebno tiste,
ki temeljijo
na nevronskih mrežah. Tovrstne arhitekture ponujajo zmožnost
učenja in
modeliranja značilnosti učnih podatkov na več ravneh, pri
čemer na nizkih
ravneh modelirajo enostavne strukture, na vǐsjih pa obsegajo
kompleksneǰse
koncepte. Pri prepoznavanju predmetov na slikah lahko npr.
elementi na pr-
vih ravneh prepoznavajo značilke, kot so robovi, elementi na
najvǐsjih ravneh
pa celotne predmete.
Alternativa nevronskim mrežam je vizualni hierarhični model,
ki se uči se-
gmente slik hierarhično združiti v kompleksneǰse motive in
specifične objekte
[51]. Na podlagi tega modela so Pesek in drugi [54] razvili
kompozicionalni
hierarhični model (v nadaljevanju: CHM), globoko arhitekturo,
namenjeno
pridobivanju informacij iz glasbe. Motivacija za CHM je
razgradnja zaple-
tenih signalov v preprosteǰse dele signala. Prva plast vsebuje
dele, ki pred-
stavljajo posamezne dogodke (npr. prisotnost zvočne frekvence
na avdio
posnetku, črte na sliki ali note v simbolnem glasbenem zapisu),
nadaljnje
plasti pa na podlagi statistične analize gradijo kompozicije
delov s preǰsnjih
plasti, ki se pogosto sopojavljajo.
-
16 Špela Medvešek
Model je bil že preizkušen na več opravilih s področja
pridobivanja in-
formacij iz glasbe: prepoznavanje not v polifonični glasbi
[54], pridobivanje
značilk za opredelitev čustev, izraženih z glasbo,
ocenjevanje harmonskih za-
poredij [53] in iskanje vzorcev v simbolnih glasbenih
predstavitvah [25, 56].
V primerjavi s trenutnimi implementacijami globokih arhitektur,
ki teme-
ljijo na nevronskih mrežah, lahko strukturo naučenih konceptov
v kompozi-
cionalnem hierarhičnem modelu, ki je transparentna arhitektura,
opazujemo
brez specializiranega procesa, kakršen je običajno potreben za
modele, ki de-
lujejo na principu črne škatle. Poleg tega CHM zaradi
relativnosti delov že
na zelo majhni vhodni množici uspešno prepozna kompleksne
koncepte [52].
3.2.1 Kompozicionalni hierarhični model za simbolni
glasbeni zapis
Kompozicionalni hierarhični model za simbolni glasbeni zapis
(angl. Symbo-
lic compositional hierarchical model, SymCHM) je implementacija
CHM za
glasbo v simbolnem glasbenem zapisu1. Model z nenadzorovanim
učenjem
dogodke oz. dele na najnižjem nivoju (posamezne note) združuje
v dele na
vǐsjih nivojih, slednje pa nadalje združuje v dele oz.
kompozicije na še vǐsjih
nivojih in tako odkriva kompleksne, ponavljajoče se vzorce na
najvǐsjih ni-
vojih [25, 55].
Medtem ko del v prvotnem modelu CHM predstavlja spektralne
značil-
nosti zvoka, kot so frekvence in posamezni toni, v katere se
osnovne frekvence
združujejo, pa SymCHM iz delov (tonov in njihovih kompozicij)
gradi hie-
rarhične modele melodičnih vzorcev [55]. Deli so predstavljeni
relativno, za-
radi česar model najde vzorce neodvisno od absolutne tonske
lege in trajanja
[52] (gl. tudi Poglavje 3.2.2).
V model so avtorji vgradili več biološko navdahnjenih
mehanizmov: in-
hibicijo, podobno inhibiciji v človeškem avditornem sistemu,
sposobnost za-
polnjevanja manjkajočih delov (avtorji ta mehanizem poimenujejo
halucina-
1 Vhodni podatki so v formatu MIDI, MusicXML ali drugih
tekstovnih formatih, vse-
bujejo pa tonsko vǐsino, čas nastopa tona in trajanje tona,
gl. Poglavje 3.2.2
-
Magistrska naloga 17
cija) ter avtomatsko ojačitev novosti v signalu. Zaradi
relativnosti naučenih
konceptov in vgrajenih mehanizmov, predvsem zapolnjevanja, lahko
model
napoveduje pričakovane prihodnje dogodke, kar sovpada tudi s
človeškim
dojemanjem glasbe, pričakovanji in njihovim kršenjem ter s tem
povezano
zanimivostjo in emocionalnostjo doživljanja glasbe [56].
3.2.2 Obdelava podatkov
Za izgradnjo kompozicionalnega hierarhičnega modela potrebujemo
učno mno-
žico v točno določenem zapisu (predstavljenem v
nadaljevanju), ki predsta-
vlja naše vhodne podatke. Te CHM obdela in iz njih izlušči
vzorce, ki se
v učni množici pojavljajo. Izhodna datoteka, ki jo CHM vrne, v
vsaki vr-
stici vsebuje niz, ki predstavlja enega izmed najdenih vzorcev.
Prvi ton v
vzorcu je predstavljen kot 0, ne glede na absolutno tonsko
vǐsino, vsi nasle-
dnji pa kot relativni poltonski odmiki od njega. Tako je npr.
zaporedje tonov
{C2, F2, A1,C2} v izhodni datoteki predstavljeno kot {0, 5, –3,
0}.Najprej uredimo vhodne podatke, in sicer je treba skladbe iz
formata
MIDI pretvoriti v tekstovne datoteke formata .csv. V datoteki je
vsak ton
predstavljen v svoji vrstici kot niz s petimi elementi:
{To, P1, P2,D, S}
pri čemer elementi po vrsti predstavljajo:
– To: čas nastopa tona (ang. onset time) v udarcih
četrtinke,
– P1: tonsko vǐsino v formatu MIDI,
– P2: tonsko vǐsino, zapisano v morfetični vrednosti
(vrednosti nismo
uporabljali),
– D: trajanje tona v udarcih četrtinke,
– S: številko notnega črtovja (vrednosti nismo
uporabljali).
-
18 Špela Medvešek
Na takšen način pripravimo učno množico, na podlagi katere s
pomočjo
kompozicionalnega hierarhičnega modela pridobimo nabor
glasbenih vzorcev,
dolgih med 4 in 32 dogodkov, ki se v učni množici
pojavljajo.
Vzorce pretvorimo v skraǰsani zapis, pri katerem si pomagamo z
malimi
in velikimi tiskanimi črkami, ki nadomestijo razmerja med toni,
izražena v
številkah.
{ 0, 5, -3, 0 } → 0Ec0
Pozitivne številke spremenimo v velike črke (5 → E), negativne
pa v malečrke (–3→ c). Toni so zabeleženi relativno glede na
poltonsko oddaljenost odprvega tona, ki ima povsod vrednost 0.
Takšno anotacijo z nekaj razlikami,
opisanimi v nadaljevanju, uporabljamo tudi pri eksperimentalnih
glasbenih
izsekih.
Skladbe najprej zapǐsemo kot nize MIDI tonskih vǐsin (sledi
zapis MIDI
vǐsin za del skladbe Kuža pazi):
{ 60, 60, 60, 60, 62, 62, 62, 62, 64, 64, 62, 62 }
in jih nato pretvorimo v zgoraj omenjeno anotacijo s prvo
vrednostjo enako
0. Nato ločeno z $ nizu pripnemo niz z vsemi toni od drugega
naprej, pri
čemer ima drugi ton (tj. prvi znak drugega niza) vrednost 0,
ostale tone pa
pretvorimo relativno glede na prvi znak (drugi ton). Postopek
nadaljujemo
do predzadnjega tona (gl. tabela 3.2) in dobimo nize oblike:
0000BBBBDDBB$000BBBBDDBB$...$0000BB00$...$00bb$0bb$00.
Med posamezne tone v vsakem vzorcu (ne skladbi) vstavimo
regularni iz-
raz [0a-zA-Z]*, ki označuje, da se med dvema znakoma lahko
nahaja poljubno
število znakov. Del v oglatih oklepajih pomeni katero koli
črko angleške abe-
cede ali številko 0, zvezdica pa poljubno število ponovitev
katerega koli izmed
znakov v tem naboru. Nato poǐsčemo vse vzorce, ki se ujemajo z
naučenimi
vzorci do predzadnjega tona, in zadnji ton določimo kot
nadaljevanje glas-
benega izseka (tabela 3.3). Vzorci se pojavljajo na različnih
delih izseka in
z različnimi oddaljenostmi med toni; za slednje poskrbi izraz
[0a-zA-Z]*. Na
-
Magistrska naloga 19
Tabela 3.2: Pretvorba skladb za iskanje ujemajočih se vzorcev
(izsek
skladbe Kuža pazi).
Mesto 13 12 11 10 9 8 7 6 5 4 3 2
Midi 60 60 60 60 62 62 62 62 64 64 62 62
Segment
0 0 0 0 B B B B D D B B
0 0 0 B B B B D D B B
0 0 B B B B D D B B
0 B B B B D D B B
0 0 0 0 B B 0 0
0 0 0 B B 0 0
0 0 B B 0 0
0 B B 0 0
0 0 b b
0 b b
0 0
podlagi tega za možna nadaljevanja izračunamo različne
uteži. Dalǰsi vzorci
in vzorci, ki se s skladbo ujemajo proti koncu izseka ter imajo
posledično
med posameznimi toni manj “lukenj”, dobijo večjo utež (tabela
3.3).
Uteži izračunamo po formuli:
U =Vlen
Slen + 1
pri čemer Vlen pomeni število tonov v vzorcu, Slen pa dolžino
celotnega se-
gmenta z upoštevanjem ugibanega tona (gl. tabelo 3.3). Z
nadaljnjim
povečanjem Slen za 1 zagotovimo vǐsjo utež za dalǰse vzorce,
saj je tako
najvǐsja možna utež za vzorec dolžine n enaka nn+1 .
Tako bi npr. 32-tonski vzorec, ki bi se popolnoma ujemal z
zadnjimi 32
toni (31 + 1 zadnjim, ugibanim tonom), dobil večjo utež (3233
= 0, 97), 4-tonski
vzorec, ki se ujema z zadnjimi 4 toni pa manǰso (45 = 0, 80).
4-tonski vzorec,
katerega prvi ton se ujema s prvim tonom skladbe, bi dobil zelo
majhno utež
-
20 Špela Medvešek
(npr. 421 = 0, 19, če bi bila skladba dolga 19 tonov).
Tabela 3.3: Postopek iskanja vzorcev in določanja uteži.
Mesto 13 12 11 10 9 8 7 6 5 4 3 2 1 Utež
Midi 60 60 60 60 62 62 62 62 64 64 62 62 ?
Izsek 0 0 0 0 B B B B D D B B * 4/(13+1)
Vzorec 1 0 0 B E = 0,29
Izsek 0 B B B B D D B B * 8/(10+1)
Vzorec 2 0 B B B D D B b = 0,73
Izsek 0 0 b b * 4/(5+1)
Vzorec 3 0 b b 0 = 0,67
V izseku skladbe Kuža pazi (tabela 3.3) je vzorec 1 primer
vzorca s nizko
utežjo: 414 = 0, 29. Noben izmed predstavljenih vzorcev se ne
ujema popol-
noma, vrednosti nn+1 pa se že nekoliko bolj približata vzorca
2 in 3 z utežema811 = 0, 73 in
46 = 0, 67.
Nazadnje seštejemo vse uteži vzorcev za posamezni možni
odgovor.
-
Poglavje 4
Raziskava A:
Indeks glasbene sofistikacije
V raziskavi B (poglavji 5 in 6), ki smo jo izvedli v okviru
pričujoče naloge,
smo želeli oceniti glasbeno predznanje udeležencev. Zato smo
se odločili iz-
vesti predhodno raziskavo, v nalogi označeno kot raziskava A, v
kateri smo
uporabili Goldsmithsov indeks glasbene sofistikacije (Gold-MSI),
samooce-
njevalni vprašalnik, ki kvantificira različne vidike
glasbenega udejstvovanja.
Za potrebe magistrske naloge smo ga prevedli v slovenščino in
skraǰsali, kot
je opisano v tem poglavju.
4.1 Adaptacija vprašalnika za nov kulturni
prostor
Zaradi raznolikosti kultur po svetu ni dovolj, da vprašalnik le
prevedemo,
ampak je potrebno podrobno preveriti njegovo veljavnost
(validity) ob adap-
taciji v drugo kulturno okolje [64]. Medkulturne razlike lahko
vplivajo na
veljavnost reševanja nekega vprašalnika v primeru nematernih
govorcev npr.
angleščine, četudi imajo dobro znanje jezika [4], do
razhajanj glede veljav-
nosti pa lahko pride celo pri uporabi istega vprašalnika pri
dveh kulturah z
istim maternim jezikom, a povsem različnima kulturama (npr. ZDA
in Nova
21
-
22 Špela Medvešek
Zelandija) [5]. Za priredbo instrumenta (vprašalnika) za novo
kulturno oko-
lje sta torej poleg prevoda obvezna tudi adaptacija in ocena
veljavnosti ter
zanesljivosti (ponovljivosti in notranje konsistentnosti)
[2].
Proces transkulturne adaptacije obsega izdelavo instrumenta, ki
je se-
mantično, konceptualno, vsebinsko, tehnično in kriterijsko
ekvivalenten iz-
vornemu [64], a jezikovno in kulturno prilagojen ciljnemu
kontekstu. Tako
prilagojen instrument omogoča primerjavo rezultatov,
pridobljenih v različ-
nih kulturah [2].
Kljub temu da takšna validacija vzame veliko časa, je potrebna
za zago-
tavljanje popolnega jezikovnega ekvivalenta samoocenjevalnih
instrumentov.
Po Sousu in Rojjanasrirat [64] so priporočeni koraki za
adaptacijo instru-
menta naslednji:
1. Prevod instrumenta s strani dveh med seboj neodvisnih
prevajalcev
(oz. ekip prevajalcev), od katerih je eden izvedenec na
področju, s
katerim se ukvarja raziskava, drugi pa ima dobro poznavanje
kulturnih
in jezikovnih nians ciljnega jezika, vendar ni izvedenec na
zadevnem
področju;
2. Oba prevoda pregleda tretji dvojezični, še raje pa
dvokulturni, prevaja-
lec ter izpostavi dvoumja in neujemanja med obema prevodoma.
Nato
se v soglasju z vsemi tremi prevajalci in člani raziskovalne
ekipe ustvari
preliminarno začetno prevedeno verzijo instrumenta v ciljnem
jeziku;
3. Dva prevajalca, ki v projektu še nista sodelovala in ki sta
po karakte-
ristikah enaka kot prevajalca iz prve točke, opravita vzvratni
prevod
(angl. back-translation) v izvorni jezik brez poznavanja
izvornega be-
sedila. Ta korak služi preverjanju ter razjasnitvi besedǐsča
in stavčnih
struktur, uporabljenih v prevodu v ciljni jezik;
4. Ponovno se pregleda odstopanja med prevodi ter napravi
predzadnjo
verzijo instrumenta v ciljnem jeziku. V kolikor se ekipa o
odstopanjih
ne strinja, je potrebno ponoviti vse 4 korake bodisi za celotni
vprašalnik
bodisi za točke nestrinjanja.
-
Magistrska naloga 23
S prvimi štirimi točkami se zagotovi konceptualno, semantično
in vsebinsko
ekvivalentnost instrumenta v ciljnem jeziku s tistim v izvornem
jeziku. Ko je
ugodeno vsem štirim korakom, je instrument pripravljen za
pilotsko testiranje
[64]:
5. 10–40 posameznikov (naravnih govorcev ciljnega jezika) oceni
jasnost
navodil, vprašanj in formata odgovor, priporočljivo pa je, da
enako
stori tudi odbor 6–10 strokovnjakov. Za vsako točko je potrebno
vsaj
80-odstotno strinjanje v vsaki izmed obeh skupin;
6. Dvojezični posamezniki najprej rešijo vprašalnik v
ciljnem, nato pa še
izvornem jeziku (vendar z drugačnim vrstnim redom vprašanj).
Na
podlagi primerjave odgovorov se sklepa o kriterijski
enakovrednosti;
7. Končno se opravi psihometrično testiranje (splošni dogovor
glede po-
trebnega števila subjektov je približno število vprašanj ×
10) z uporaboanalize merilne lestvice in odgovorov, Pearsonove
korelacijske analize
ter eksploratorne in konfirmatorne faktorske analize. Namen tega
ko-
raka je prečistiti vprašalnik, tako da bo končni instrument
ustrezal
minimalnim zahtevam za zanesljivost (reliability), homogenost in
ve-
ljavnost (validity) ter da bo imel stabilno faktorsko
strukturo.
Notranjo konsistentnost instrumenta lahko preverimo z izračunom
Cronba-
chovega koeficienta α (zaželeno je, da znaša njegova vrednost
≥ 0,70); pono-vljivost testiranja merimo z Wilcoxonovim
neparametričnim testom, korela-
cijskimi koeficienti ali parnim t-testom [2, 4, 32].
Veljavnost najprej preverjamo z vzvratnim prevodom, pregledom
litera-
ture, kritično obravnavo in opiranjem na izvedenska mnenja.
Nato opravimo
faktorsko analizo in instrument s pomočjo korelacijskih
koeficientov (npr.
Spearmanov ρ, Pearsonov r) primerjamo z izvornim ali drugimi
podobnimi
instrumenti [2, 32].
Najpogosteǰsi statistični analizi, ki se uporabljata za
validacijo prevo-
dov instrumentov, sta eksploratorna in konfirmatorna faktorska
analiza [2].
-
24 Špela Medvešek
S konfirmatorno faktorsko analizo (CFA) preverjamo, ali podatki
odražajo
strukturo izvornega instrumenta, s pomočjo eksploratorne
faktorske analize
(EFA) pa lahko iz velikega seta vprašanj izluščimo, katere
dimenzije instru-
menta so pomembne za definiranje modela ali teorije oz. kaj
adaptirani in-
strument sploh meri [2]. Eksploratorna analiza se načeloma
uporablja, kadar
konfirmatorna ne pokaže ustreznega prileganja strukture
izvornega instru-
menta podatkom, zbranim s priredbo.
4.2 Validacija vprašalnika Gold-MSI (CFA)
Vprašalnik Gold-MSI obsega 38 vprašanj o glasbenem
udejstvovanju in iz-
obraženosti (gl. dodatek A). Prvih 31 vprašanj je subjektivnih
in ima od-
govore v obliki lestvice Likertovega tipa (1–7, pri čemer
pomeni 1 “sploh se
ne strinjam”, 7 pa “popolnoma se strinjam”), zadnjih 7 pa je
bolj objek-
tivnih vprašanj o trajanju glasbenega izobraževanja, številu
inštrumentov,
ki jih posameznik igra, itd. (odgovori na vsako vprašanje so
razdeljeni v 7
neintervalnih ordinalnih kategorij).
Vprašalnik smo z večkratnim preverjanjem kakovosti prevedli v
sloven-
ščino. Dva prevajalca sta vprašalnik neodvisno prevedla,
tretja prevajalka
pa je prevoda pregledala. Oba pregledana prevoda smo združili v
prvo slo-
vensko verzijo. To verzijo je četrta neodvisna prevajalka
prevedla nazaj v
angleščino (back-translation), nazadnje pa smo primerjali
vzvratni prevod
z izvornim angleškim besedilom ter z ustreznimi spremembami
prve verzije
ustvarili končni slovenski prevod.
V okolju CodeIgniter 3.1.7 smo ustvarili spletno stran z
vprašalnikom
Gold-MSI v slovenščini ter štirimi kratkimi demografskimi
vprašanji (spol,
starost, izobrazba, status). Podatke smo obdelali v orodju za
statistično
analizo R 3.4.0.
Opravili smo konfirmatorno faktorsko analizo, da bi ugotovili,
ali preve-
deni vprašalnik odraža psihometrično strukturo originalnega,
nato pa smo se
odločili še za eksploratorno faktorsko analizo, saj smo hoteli
vprašalnik čim
-
Magistrska naloga 25
bolj skraǰsati.
4.2.1 Udeleženci
Vprašalnik je v celoti rešilo 231 ljudi (79 moških, 152
žensk). Udeleženci so
bili povečini študentje (136) in zaposleni (75), stari med 16
in 58 let (M =
26,7, SD = 7,3). Skoraj vsi udeleženci (96,5 %) so imeli vǐsjo
izobrazbo od
srednješolske: 83 jih je imelo šesto stopnjo izobrazbe, 86
sedmo in 54 osmo.
Velika večina udeležencev je imela vsaj nekaj let glasbene
izobrazbe. Glas-
bene šole ni nikoli obiskovalo 66 udeležencev (28,6 %), kar
139 (60,2 %) pa
se jih je vsaj tri leta formalno učilo igranja inštrumenta oz.
petja (od tega
44 udeležencev deset let ali več). Tretjina udeležencev (75)
se ni nikoli iz-
obraževala o glasbeni teoriji, 128 (55,4 %) pa se jih je na tem
področju
izobraževalo tri leta ali več (od tega 41 udeležencev več
kot šest let). Le 38
udeležencev (16 %) je bilo popolnih neglasbenikov – nikoli se
niso glasbeno
izobraževali in vadili inštrumentov niti se niso sami naučili
igrati nobenega
inštrumenta niti ne obvladajo petja.
Največ udeležencev je odgovorilo, da najbolj obvladajo petje
(47), temu
so sledili klavir (43), kitara (33), prečna flavta (15) in
violina (11). Ostali
inštrumenti so imeli frekvenco 3 ali manj, 65 udeležencev
(28,1 %) pa ni
obvladalo nobenega inštrumenta oz. petja.
4.2.2 Konfirmatorna analiza
Najprej smo preverili ponovljivost testiranja instrumenta.
Pregledali smo
7 parametrov (povprečne vrednosti, tri mere razpršenosti – SD,
najvǐsje in
najnižje vrednosti – ter tri mere zanesljivosti – Cronbachovo
α, McDonal-
dovo ω in Guttmanovo λ6) za pet faktorjev, o katerih poročajo
Müllensiefen,
Gingras, Musil in Stewart [43]:
– aktivno udejstvovanje (active engagement – A),
– zaznavne sposobnosti (perceptual abilities – P),
-
26 Špela Medvešek
– glasbena izobrazba (musical training – M),
– pevske sposobnosti (singing abilities – S),
– čustva (emotions – E).
Vsaka izmed 38 postavk iz vprašalnika spada v eno izmed teh
petih kategorij
(A: obsega 9 postavk, P: 9, M: 7, S: 7, E: 6). Obravnavali smo
tudi splošni
faktor glasbene sofistikacije (General sophistication – GEN), ki
obsega 18
izmed teh 38 postavk [43].
V tabeli 4.1 so predstavljene različne vrednosti, pridobljene v
originalni
raziskavi ([43], oznaka “EN” v tabeli), ter vrednosti,
pridobljene v raziskavi
A (oznaka “SL” v tabeli). Mere zanesljivosti kažejo na dobro
notranjo kon-
sistentnost pri vseh faktorjih, tako za originalni instrument v
angleščini kot
za slovensko različico.
Tabela 4.1: Primerjava povprečnih vrednosti, razpršenosti in
mer zaneslji-
vosti med originalno in našo raziskavo za 5 faktorjev in
splošni faktor glasbene
sofistikacije (n = 147.633 (EN); n = 231 (SL)).
Aktivno Zaznavne Glasbena Pevske Čustva Splošna
udejstvovanje sposobnosti izobrazba sposobnosti
sofistikacija
(A) (P) (M) (S) (E) (GEN)
EN SL EN SL EN SL EN SL EN SL EN SL
M 41,52 37,67 50,20 50,85 26,52 28,65 31,67 32,22 34,66 34,77
81,58 82,16
SD 10,36 11,69 7,86 9,67 11,44 12,20 8,72 10,18 5,04 5,83 20,62
23,93
Max 63 62 63 63 49 48 49 49 42 42 126 124
Min 9 9 9 22 7 7 7 8 6 14 18 22
α 0,87 0,87 0,87 0,88 0,90 0,92 0,87 0,88 0,79 0,76 0,93
0,94
ω 0,87 0,88 0,87 0,89 0,90 0,92 0,87 0,88 0,79 0,77 0,93
0,94
λ6 0,86 0,87 0,87 0,88 0,91 0,93 0,87 0,88 0,77 0,74 0,94
0,96
Opombe: EN: originalna raziskava; SL: raziskava A.
Ponovljivost testiranja smo preverili z enosmernim t-testom, s
katerim smo
rezultate Slovencev pri vseh šestih faktorjih primerjali s
povprečji pri posa-
meznem faktorju, ki jih poročajo avtorji v originalni
raziskavi. Vrednosti se
-
Magistrska naloga 27
pri večini faktorjev niso razlikovale statistično značilno (p
> 0,05), izjema je
bil le faktor Aktivno udejstvovanje (tabela 4.2). Razlogi za to
so lahko na
primer dejanska razlika med vzorcema ali razlike v
interpretaciji vrednosti
na uporabljeni odgovorni lestvici.
Tabela 4.2: Rezultati enosmernega t-testa za povprečne
rezultate pri po-
sameznem faktorju.
Faktor t(230) p d
Aktivno udejstvovanje –5,01 < 0,001 –0,661
Zaznavne sposobnosti 1,02 0,309 0,135
Glasbena izobrazba 2,65 0,009 0,349
Pevske sposobnosti 0,82 0,415 0,108
Čustva 0,29 0,774 0,038
Splošni faktor 0,37 0,713 0,049
Analiza angleškega in slovenskega vprašalnika je torej
pokazala, da sta
instrumenta v veliki meri primerljiva, a smo kljub temu opravili
tudi konfir-
matorno analizo slovenskega vprašalnika, saj avtorji prvotnega
vprašalnika
poročajo o slabem prileganju enofaktorskemu modelu [43].
Konfirmatorna faktorska analiza enofaktorskega modela
slovenskega vpra-
šalnika je pokazala, da se podatki modelu ne prilegajo dobro,
χ2 (665) =
2901, p < 0,001; CFI = 1,00; TLI = 1,00; RMSEA = 0,150, 90-%
IZ =
[0,146, 0,154]; SRMR = 0,128.
Prileganje je bilo še slabše pri 5-faktorskem (isti faktorji
kot v originalni
raziskavi) modelu (χ2 (655) = 9690, p < 0,001; CFI = 0,328;
TLI = 0,278;
RMSEA = 0,244, 90-% IZ = [0,240, 0,249]; SRMR = 0,085), kar je
bil eden
izmed razlogov, zakaj smo morali vprašalnik rekonstruirati.
-
28 Špela Medvešek
4.3 Adaptacija vprašalnika Gold-MSI (EFA)
Cilj eksploratorne analize je bil zmanǰsati število vprašanj,
ki bi nam vseeno
dala zadostne informacije o glasbeni sofistikaciji udeležencev.
Ker je bila
eksperimentalna naloga v raziskavi B dokaj dolga, smo želeli
vprašalnik Gold-
MSI občutno skraǰsati.
Izločili smo en splošni faktor z lastno vrednostjo 13,1. Nato
smo izbrali
postavke z absolutnimi nasičenostmi, večjimi od 0,70;
vprašalnik smo tako
skraǰsali na osem postavk (za 79 %).
Na podlagi teh osmih postavk smo ustvarili nov indeks glasbene
sofistika-
cije (tabela 4.3), ki dobro sovpada s splošnim indeksom
splošne sofistikacije
Gold-MSI (r = 0,95). Korelacijo smo izračunali na podlagi
števila točk oz.
faktorskega dosežka, ki smo ga pridobili s seštevanjem
uteženih vrednosti
odgovorov pri posameznih postavkah (število točk za
posameznikov indeks
glasbene sofistikacije je bil seštevek uteženih odgovorov na
postavke št. 5, 7,
10, 12, 19, 22, 27 in 32; po enakem postopku smo izračunali
tudi rezultat pri
indeksu Gold-MSI).
Tabela 4.3: Izbor postavk z najvǐsjimi absolutnimi
nasičenostmi.
Absolutna
Št. Postavka nasičenost
5 Dobro znam presoditi, ali je nekdo dober ali slab pevec.
0,734
7 Na pamet lahko pojem ali igram skladbe. 0,753
10 Ob spremljavi glasbenega posnetka sem sposoben zapeti prave
note. 0,794
12 Zmožen sem primerjati in razpravljati o razlikah med
dvema0,795
izvedbama ali različicama iste pesmi.
19 Zmožen sem prepoznati posebnosti poslušane skladbe.
0,802
22 Opazim, kadar nekdo poje ali igra napačne tone. 0,724
27 Ne bi rekel, da sem glasbenik. 0,746
32 Koliko časa ste redno, dnevno vadili glasbeni inštrument?
0,777
Novi indeks glasbene sofistikacije z osmimi postavkami smo
vključili v
raziskavo B. Odgovori na prvih 7 postavk iz tabele 4.3 so bili v
raziskavi B
-
Magistrska naloga 29
del lestvice Likertovega tipa (kot v originalnem vprašalniku).
Pri zadnjem
pa smo od udeležencev zahtevali, da sami vnesejo število let
(med 0 in svojo
starostjo) redne vadbe inštrumenta oz. petja, vendar smo za
končni izračun
rezultata MSI v raziskavi B intervalne odgovore pretvorili nazaj
v njihove
ordinalne ustreznice, uporabljene v originalnem vprašalniku
[43].
-
Poglavje 5
Raziskava B:
Glasbeno pričakovanje
5.1 Materiali
Eksperiment je bil sestavljen iz dveh blokov, kitajskega in
evropskega, za
katera smo poiskali ustrezne glasbene zbirke, znotraj njih
našli primerne
skladbe ter jih ustrezno skraǰsali. Kitajski glasbeni izseki,
ki smo jih z dovo-
ljenjem avtorjev uporabili, so del glasbene baze, uporabljene v
študiji zazna-
vanja glasbenih fraz [44]. Izseki evropske glasbe so iz prosto
dostopne spletne
zbirke Robokopp1, ki vsebuje ljudske in vojne pesmi ter himne iz
nemških
in angleških govornih okolij. Da bi prǐslo do čim manj razlik
v glasbenem
slogu, smo se omejili le na nemške pesmi.
Za vsak del (evropski, kitajski) smo sprva naključno izbrali po
30 ne-
polifoničnih glasbenih odlomkov. Vsako skladbo v zapisu MIDI
smo najprej
pretvorili v notni zapis z uporabo programov Midi Sheet Music in
MuseScore
2 ter jo nato ponovno izvozili v formatu MIDI. Za ponovno
izdelavo MIDI-jev
smo se odločili, ker so bile evropske in kitajske skladbe iz
različnih virov in
je med njimi prihajalo do razlik v barvi zvoka in odmevu, prav
tako pa je bil
natančen notni zapis uporaben za nadaljnjo statistično
obravnavo skladb.
1http://www.musicanet.org/robokopp/Volksong.html, 15. 2.
2018
30
-
Magistrska naloga 31
Skladbe so bile prvotno dokaj dolge, v povprečju 18,7 sekunde
oz. pri-
bližno 8 taktov. Da bi bila naloga bolj prijazna do
udeležencev, smo jih
skraǰsali na posamezne fraze znotraj skladb. Na sliki 5.1a je
primer prvotne
skladbe, njena skraǰsana različica, uporabljena v
eksperimentalni nalogi, pa
je na sliki 5.1b.
Skladbe smo kraǰsali na dva načina: nekatere smo odrezali po
predza-
dnjem tonu fraze (udeleženci so torej morali napovedati zadnji
ton fraze),
nekatere pa na naključnem mestu sredi fraze. Tako imenovane
zaključene
(sliki 5.1b in 5.1d) in nezaključene izseke (sliki 5.1c in
5.1e) smo vključili v
razmerju 3 : 1 (75 % zaključenih, 25 % nezaključenih).
(a) primer kitajske skladbe
(b) kitajski izsek; zaključen (odlomek 1)
(c) kitajski izsek, nezaključen (odlomek 2)
(d) nemški izsek, zaključen (odlomek 3)
(e) nemški izsek, nezaključen (odlomek 4)
Slika 5.1: Primeri uporabljenih izsekov.
-
32 Špela Medvešek
Na podlagi treh kriterijev – (1) število tonov, (2) največji
interval, ki se
pojavi v skladbi, in (3) razpon – smo za vsako kulturo izbrali
po 20 odlom-
kov, ki smo jih vključili v eksperimentalno nalogo. Da bi
zagotovili čim bolj
podobno strukturo glasbenih dogodkov, so bili izbrani odlomki
znotraj okvi-
rov M ± 2 SD za vsakega izmed treh kriterijev. Na koncu smo iz
preostankaprimernih skladb izbrali časovno kraǰse odlomke.
V tabeli 5.1 se nahajajo vrednosti omenjenih treh kriterijev za
primer
glasbenih odlomkov 1–4 (slika 5.1b–e).
Tabela 5.1: Vrednosti kriterijev 1–3 za štiri glasbene
odlomke.
OdlomekŠtevilo Največji Razpon
tonov interval [polton]
1 (kitajski zaključen) 13 VIII (oktava) 12
2 (kitajski nezaključen) 17 VI (seksta) 17
3 (evropski zaključen) 13 IV (kvarta) 14
4 (evropski nezaključen) 12 IV (kvarta) 17
Z enosmerno ANOVO smo med seboj primerjali glasbene odlomke
obeh
kultur. Skupini se v nobenem izmed prej omenjenih kriterijev
nista stati-
stično pomembno razlikovali (tabela 5.2).
Glasbeni odlomki so imeli v povprečju skoraj 15 tonov
(kitajski: M =
15,6, SD = 3,3; nemški: M = 13,9, SD = 4,3). Kitajske skladbe v
izboru so
imele med 10 in 22 tonov, nemške pa med 7 in 24.
V povprečju je bil največji interval v odlomkih obeh kultur
seksta. Med
kitajskimi skladbami je bila najmanǰsa vrednost terca in
največja oktava,
med nemškimi pa najmanǰsa kvarta ter največja decima.
Skupini sta se po razponu skladb minimalno razlikovali.
Povprečni razpon
skladb je bila oktava oz. 12 poltonov (kitajske: M = 12,4, SD =
3,8; nemške:
M = 11,6, SD = 2,8). Kitajske skladbe so imele razpon med 5
(kvarta) in 20
poltonov (tercdecima), nemške pa med 7 (kvinta) in 17 poltonov
(undecima).
Povprečno so skladbe trajale 6,9 sekunde (kitajske: M = 7,3, SD
= 1,7;
-
Magistrska naloga 33
nemške: M = 6,6, SD = 2,2). Kitajske skladbe so bile dolge med
5 in 11
sekund, nemške pa med 3 in 11 sekund.
Tabela 5.2: Rezultati enosmerne ANOVE za primerjanje kriterija v
skupini
evropskih in skupini kitajskih odlomkov.
Kriterij MS F(1, 38) p ω2
število tonov 28,9 1,88 0,179 0,021
največji interval 0,1 0,04 0,845 –0,025
razpon [polton] 6,4 0,54 0,469 –0,012
trajanje [s] 4,2 1,04 0,315 0,001
Opomba. Moč testa: 1 − β = 0,11 pri vrednosti α = 0,05.
5.2 Postopek
Spletno stran z vprašalnikom smo izdelali v MVC-okolju
CodeIgniter 3.1.7, ki
je zasnovano na programskem jeziku PHP. Vprašalnik je bil
sestavljen iz štirih
delov: prvi del je obsegal demografska vprašanja, skraǰsani
vprašalnik Gold-
MSI in vprašanji o glasbenih preferencah ter pogostosti
poslušanja kitajske
glasbe. Drugi del se je pričel z navodili za eksperimentalni
del, nato pa so
bili udeleženci preusmerjeni na uporabnǐski vmesnik (slika
5.2), ki so ga se
najprej naučili uporabljati na treh poskusnih primerih.
Naloga udeležencev je bila poslušati kratek glasbeni izsek,
nato s pomočjo
tonskega drsnika ali gumbov izbrati ton, ki bi bil po njihovem
mnenju naj-
bolǰse nadaljevanje poslušanega izseka, in po potrebi ponovno
poslušati izsek
z dodanim tonom. Na koncu so morali označiti še, ali skladbo
prepoznajo
ali ne. Za poskusne primere smo izbrali skladbe, ki bi jih
poznali praktično
vsi udeleženci (pri slovenskem vprašalniku so bile to Kuža
pazi, Zdravljica in
Vse najbolǰse za te, pri angleškem pa otroška pesem Twinkle,
Twinkle, Little
Star, Beethovnova skladba Für Elise in Vse najbolǰse za te) in
jim zelo ver-
jetno znali določiti nadaljevanja. Pravilnost odgovorov na
poskusnem delu
-
34 Špela Medvešek
Slika 5.2: Uporabnǐski vmesnik za eksperimentalno nalogo.
je med drugim vplivala na pozneǰso razvrstitev v skupini
glasbenikov in ne-
glasbenikov (gl. poglavje 5.3.2).
Tako med poskusnim kot eksperimentalnim delom so s pritiskom na
gumb
(?) lahko kadarkoli ponovno prikazali navodila.
Po končanem poskusnem delu se je pričel eksperimentalni del,
sestavljen
iz evropskega in kitajskega bloka. Vsak del je obsegal po 20
manj poznanih
glasbenih izsekov, ki jim je bilo treba določiti nadaljevanje.
Vrstni red blokov
se je izmenjeval (polovica udeležencev je torej najprej
reševala evropski in
nato kitajski blok, polovica pa obratno).
Vprašalnik smo distribuirali preko elektronske pošte in
družabnih omrežij
ter povezavo objavili tudi na spletni strani Oddelka za
psihologijo Filozofske
fakultete.
5.3 Udeleženci
Vprašalnik je v celoti rešilo 57 udeležencev (26 moških, 31
žensk), starih med
16 in 54 let (M = 26,7, SD = 7,5). Večina udeležencev (59,6 %)
je imela
-
Magistrska naloga 35
vǐsjo izobrazbo od srednješolske: 14 jih je imelo šesto
stopnjo, 16 sedmo in
10 osmo.
Velika večina udeležencev je vsaj nekaj let redno vadila
glasbeni inštru-
ment oziroma petje. Le deseterica (17,5 %) je odgovorila, da
niso nikoli vadili
inštrumentov; v povprečju so udeleženci redno vadili 6,8 let
(SD = 6,5). Kar
19 udeležencev (33,3 %) je inštrument vadilo 10 let ali več
(max : 25 let),
skoraj tri četrtine (73,7 %) pa vsaj 3 leta.
Najbolj priljubljene zvrsti so bile klasična glasba (13
udeležencev uvrstilo
na prvo mesto, 5 na drugo in 15 na tretje), rock (16, 6, 4) in
pop (6, 9, 5).
Udeleženci v veliki meri ne poslušajo kitajske glasbe: 39 (68
%) je ne posluša
nikoli, 13 občasno (nekajkrat na leto), le 2 nekajkrat na mesec
in 3 praktično
vsak dan.
5.3.1 Indeks glasbene sofistikacije
Del demografskega vprašalnika je predstavljal skraǰsani
vprašalnik Gold-MSI,
predstavljen v raziskavi A (poglavje 4.3).
Udeleženci so poročali o visoki glasbeni sofistikaciji, kar
pravzaprav ni
presenetljivo, saj je večina vsaj 3 leta redno vadila glasbeni
inštrument ozi-
roma petje. Povprečen rezultat je bil 42,2 točk od 56 možnih
(SD = 7,7).
S pomočjo rezultatov skraǰsane lestvice Gold-MSI smo med
drugim določali
razporeditev udeležencev v skupine glasbenikov in
neglasbenikov.
5.3.2 Skupine
Ker je bilo v vzorcu veliko glasbenikov, smo se odločili za
razporeditev v
večjo skupino glasbenikov in manǰso skupino neglasbenikov.
Upoštevali smo dva kriterija: indeks glasbene sofistikacije in
odgovore
na preizkusnem delu vprašalnika. Za MSI smo mejo določili pri
rezultatu
40, ki bi ga udeleženec dobil, če bi pri vsaki postavki (v
povprečju) označil
vrednost 5. Med neglasbenike so bili torej umeščeni tisti, ki
so imeli rezultat
MSI do vključno 39 (16 udeležencev). Nadalje smo v to skupino
uvrstili tudi
-
36 Špela Medvešek
vse udeležence, ki na preizkusnem delu vprašalnika (tri znane
pesmi) niso
pravilno rešili vseh primerov. Upoštevali smo tudi odgovor na
vprašanje,
ali poslušano skladbo poznajo, zaradi česar je en udeleženec
“napredoval” iz
skupine neglasbenikov v skupino glasbenikov. Vsaj eno napako je
storilo 14
udeležencev. Po združenju obeh kriterijev je bilo v skupini
neglasbenikov 21
udeležencev (9 moških, 12 žensk, MSI: M = 34,4, SD = 6,8;
leta glasbenega
izobraževanja: M = 1,8, SD = 2,2).
Preostalih 36 udeležencev smo razvrstili v skupino glasbenikov
(17 moš-
kih, 19 žensk, MSI: M = 46,8, SD = 3,3; leta glasbenega
izobraževanja: M
= 9,6, SD = 6,3).
5.4 Pridobivanje odgovorov CHM
Uporabili smo evropsko in kitajsko učno množico, ki sta
obsegali približno
14.000 tonov, iz glasbene zbirke Essen2. Za obdelavo z modelom
CHM smo
podatke v množicah uredili, kot je opisano v poglavju
3.2.2.
Rezultati, pridobljeni z evropsko in kitajsko učno množico na
podlagi vsot
uteži, so bili zelo razpršeni (od –22 do +21 poltonov od
izhodǐsča). Za začetek
smo se omejili le na razpon, kakršnega so imeli na voljo
udeleženci (± 12poltonov), nazadnje pa smo se na podlagi
razpršenosti odgovorov evropskih
udeležencev (slika 6.3 v poglavju 6.1.1) in porazdelitve
intervalov v skladbah,
ki so bile del eksperimenta, omejili le na tone, ki so od
izhodǐsča oddaljeni
največ za kvarto (IV) oz. 5 poltonov.
Kot najbolǰsi odgovor smo smatrali odgovor z najvǐsjo vsoto
uteži in
tako pridobili odgovore CHM za vseh 40 glasbenih izsekov.
Rezultati so
predstavljeni v poglavju 6.
2 Dostop: http://kern.ccarh.org/browse, 22. 6. 2018
-
Poglavje 6
Raziskava B:
Rezultati
V nalogi smo želeli preučiti, kako uspešen je kompozicionalni
hierarhični
model v primerjavi z ljudmi pri nalogi glasbenega pričakovanja
ter kako na
uspešnost vpliva predhodno poznavanje glasbene kulture oziroma
specifična
učna množica. Eksperiment smo izvedli na dveh različnih
zvrsteh glasbe:
evropski in kitajski ljudski glasbi.
V tabeli 6.1 so predstavljeni rezultati evropskih udeležencev,
modela
CHM, naučenega na evropski in kitajski učni množici, ter
razširjenega Nar-
mourjevega modela implikacije–realizacije. V naslednjih
poglavjih podrob-
neje primerjamo rezultate znotraj različnih skupin.
Najprej bomo predstavili rezultate udeležencev z evropskim
(slovenskim)
kulturnim ozadjem. Nato bomo analizirali delovanje modela CHM,
naučene-
ga na evropski in kitajski učni množici, ter predstavili
rezultate popravljenega
modela implikacije–realizacije. Rezultate bomo povezali s
teorijo tonskih hie-
rarhij in povzeli, ali seznanjenost s tujo glasbeno kulturo
vpliva na uspešnost
pri reševanju ter kako na uspešnost modela vpliva velikost
učne množice.
Nazadnje bomo na kratko povzeli še pilotsko študijo istega
eksperimenta s
kitajskimi udeleženci.
37
-
38 Špela Medvešek
Tabela 6.1: Povprečna uspešnost udeležencev z evropskim
kulturnim ozad-
jem in uspešnost CHM, naučenega na evropskih (CHM–eu) in
kitajskih
(CHM–cn) vzorcih.
Evropske skladbe Kitajske skladbe
vse zaključene nezaključ. vse zaključene nezaključ.
Vsi udeleženci 58 % 63 % 42 % 34 % 34 % 35 %
Glasbeniki 68 % 74 % 47 % 39 % 37 % 44 %
Neglasbeniki 41 % 43 % 33 % 25 % 27 % 21 %
CHM–eu 60 % 73 % 20 % 30 % 33 % 20 %
CHM–cn 45 % 53 % 20 % 30 % 40 % 0 %
Narmour 50 % 60 % 20 % 35 % 25 % 40 %
Kot pravilna nadaljevanja izsekov smo upoštevali le tista, ki
so dejanska
nadaljevanja skladbe. V primeru odlomka 1 (slika 5.1b na strani
31) je torej
pravilni odgovor –2, tj. premik za dva poltona navzdol, kar je
tudi dejansko
nadaljevanje odlomka 1 (s slike 5.1a je razvidno nadaljevanje
odlomka 1)1.
Udeleženci
V tem izseku se sklicujemo na tabelo 6.2, v kateri se nahajajo
vrednosti
Wilcoxonega testa enakovrednih parov in Wilcoxonovega testa
vsote rangov
za različne kombinacije skupin udeležencev, glasbenih slogov
ter primerjavo
obeh vrst izsekov.
Evropski udeleženci so v povprečju pravilno rešili 58 %
evropskih in 34 %
kitajskih izsekov. Razlika med obema blokoma je bila
statistično pomembna,
tako v skupini glasbenikov kot neglasbenikov.
Glasbeniki so bili bolj uspešni od neglasbenikov tako pri
reševanju evrop-
skega kot tudi kitajskega bloka. Razlike med skupinama
glasbenikov in ne-
glasbenikov so bile pri glasbi obeh kultur statistično
značilne.
1 V podpoglavju “Analiza tonskih hierarhij” za pravilnost
odgovorov uporabljamo
drugačen kriterij, ki je razložen na začetku poglavja
6.1.
-
Magistrska naloga 39
Tabela 6.2: Rezultati Wilcoxonovega testa enakovrednih parov (V
) in Wil-
coxonovega testa vsote rangov (W ).
Udeleženci Glasba Dodatni kriterij W V p
GlasbenikiEvropska : kitajska
3 < 0,001
Neglasbeniki 29 0,005
Glasbeniki : neglasbenikiEvropska 134 < 0,001
Kitajska 152 < 0,001
GlasbenikiEvropska
Zaključeni :
nezaključeni
izseki
129 < 0,001
Kitajska 476 0,050
NeglasbenikiEvropska 180 0,305
Kitajska 147,5 0,234
Pri evropskih izsekih so bili udeleženci bolj uspešni pri
reševanju za-
ključenih kot nezaključenih izsekov, pri kitajskem delu pa so
bolje reševali
nezaključene izseke. Glasbeniki so statistično pomembno bolje
odgovarjali
za zaključene kot nezaključene izseke, tako pri evropskem kot
tudi kitajskem
bloku (pri slednjem je bila razlika na meji statistično
signifikantne). Pri
neglasbenikih so bile razlike manǰse.
Glede na to, da so zaključki fraz najbolj predvidljivi deli
skladb (gl. po-
glavje 2.3), smo pričakovali, da bodo udeleženci (in tudi CHM)
uspešneǰsi
pri reševanju zaključenih kot nezaključenih izsekov. Hipotezo
smo potrdili
za skupino glasbenikov, nekoliko bolje pa so se razlike
manifestirale ob po-
slušanju glasbe lastne kot tuje kulture.
Presenetilo nas je, da so neglasbeniki pri reševanju kitajskega
bloka naj-
bolje odgovarjali za nezaključeni izsek cn16 (57-odstotna
uspešnost), vendar
je razlog za to najverjetneje ta, da je šlo v zadnjem delu
izseka za ponovitev
melodije s prvega dela izseka, zaradi česar so pravilni ton
enkrat že slǐsali
in ga znali poustvariti2. Najslabše so udeleženci odgovarjali
za zaključeni
izsek cn5 (skupno 5 % pravilnih odgovorov), in sicer je le 8 %
glasbenikov
odgovorilo pravilno, izmed neglasbenikov pa nihče. To je bila
edina izmed
vseh 40 skladb, pri kateri je bil pravilni odgovor 0 (obstanek
na istem tonu),
2 Notni zapisi vseh eksperimentalnih izsekov se nahaja v prilogi
B.
-
40 Špela Medvešek
kar pa se udeležencem očitno ni zdelo ustrezno.
CHM
CHM, naučen na evropski učni množici (CHM–eu), je pravilno
nadaljeval 60
% evropskih izsekov in 30 % kitajskih. V evropskem bloku je
pravilno odgo-
voril za kar 73 % zaključenih izsekov, vendar le enega
nezaključenega (tj. 20
%). Pri kitajskem delu je bila porazdelitev bolj enakomerna:
pravilno je rešil
33 % zaključenih in prav tako kot v evropskem bloku le 20 %
nezaključenih
izsekov.
CHM, naučen na kitajskih vzorcih (CHM–cn), je bil nekoliko manj
uspe-
šen od CHM–eu. Zanimivo je, da je CHM–cn bolje reševal
evropski del od
kitajskega, in sicer je pravilno nadaljeval 45 % evropskih
izsekov in, enako
kot CHM–eu, le 30 % kitajskih.
CHM, predvsem CHM–eu, se zelo dobro približa uspešnosti
udeležencev,
iz česar lahko sklepamo, da je model v nalogi glasbenega
pričakovanja primer-
ljiv s povprečno izobraženim glasbenikom (naj rezultati naših
udeležencev ne
zavedejo, saj so bili v povprečju relativno visoko glasbeno
izobraženi ter so
izkazali visoko stopnjo glasbene sofistikacije).
Narmourjev model implikacije-realizacije
Glede na dejanske odgovore pri evropskem delu eksperimenta smo
povzeli tri
preprosta pravila glede ugibanih tonov:
– so visoko na tonski hierarhiji (gl. poglavje 3.1.2),
– če je melodija na zgornji oz. spodnji meji razpona izseka,
ugibani ton
spremeni smer melodije,
– so 7 ali manj poltonov oddaljeni od izhodǐsča.
Udeleženci se teh treh pravil dosledno držijo, CHM prvih dveh
prav tako,
tretjega pa smo (s strožjo omejitvijo 5 ali manj poltonov
oddaljenosti) im-
plementirali z omejitvijo možnih odgovorov, ki jih lahko poda
model.
-
Magistrska naloga 41
Teh pravil se drži tudi razširjeni Narmourjev model
implikacije-realizacije
(poglavje 3.1, [65]). Izkazalo se je, da so pravila
(nepopravljenega) razširje-
nega Narmourjevega modela prestroga, in posledično se je na
naši nalogi
veliko slabše odrezal – pravilno namreč ni rešil niti enega
evropskega izseka
in le tri kitajske (15 %). Pri večini skladb nepopravljeni
model kot najbolǰsi
odgovor navede 0, kar je z vidika konformnosti s tonsko
hierarhijo v skladbi
v večini primerov popolnoma sprejemljiv odgovor, ni pa najbolj
verjeten.
Poleg tega daje preveliko težo odgovorom v neposredni bližini
izhodǐsča (±nekaj poltonov).
Za potrebe naloge smo uporabili zgolj nabor kriterijev
razširjenega mo-
dela implikacije–realizacije, saj se je osnovni model preveč
osredotočal na
majhnost realiziranih intervalov oziroma prepogosto preferiral
obstanek na
istem tonu. Obdržali smo kriterije melodični povratek,
blǐzina, tonalnost, me-
lodična privlačnost in tessitura. Ta nabor kriterijev je podal
najbolǰse možne
odgovore za naša eksperimentalna bloka. S tem smo dobili
rezultate, primer-
ljive s CHM–eu, in sicer je popravljeni model
implikacije–realizacije pravilno
nadaljeval 50 % evropskih in 35 % kitajskih skladb (tabela
6.1).
6.1 Analiza tonskih hierarhij
Zelo težko bi trdili, da je dejansko nadaljevanje izsekov tudi
najbolǰse in edino
možno, saj se na istem mestu lahko več različnih tonov
“slǐsi dobro”. Zato
smo v tem poglavju za določitev “pravilnih” nadaljevanj izsekov
uporabili
drugačen kriterij kot v preǰsnjem. Za vsako evropsko in
kitajsko skladbo
smo na podlagi njene tonske hierarhije določili možne odgovore
in tako za
vsakega udeleženca izračunali, kako uspešen je bil pri
nadaljevanju izseka.
Kot pravilna nadaljevanja skladb smo upoštevali vse tiste tone,
ki se pojavijo
v ustrezni tonski hierarhiji oziroma lestvici. Tako je bilo za
evropske skladbe
v duru možnih 7 različnih tonov (gl. sliko 6.1b), za molove pa
9 (dodani
zvǐsani 6. in 7. stopnja, ki se pojavljata v harmonični in
melodični lestvici).
Za pravilne veljajo ti toni v kateri koli oktavi.
-
42 Špela Medvešek
(a) Primer evropskega izseka (odlomek 3).
(b) Del možnih odgovorov.
Slika 6.1: Nabor možnih pravilnih odgovorov za zgornji evropski
izsek vse-
buje vse tone C-durove lestvice.
Za kitajske skladbe je bilo možnih 5 različnih tonov (gl.
sliko 6.2). Kot
pravilni veljajo ti toni v kateri koli oktavi.
(a) Primer kitajskega izseka (odlomek 1).
(b) Del možnih odgovorov.
Slika 6.2: Nabor možnih pravilnih odgovorov za zgornji kitajski
izsek vse-
buje vse tone durove pentatonične lestvice z izhodǐsčem v
tonu H[.
Pri evropskih izsekih je bilo tako izmed vseh možnih odgovorov
po naši poe-
nostavljeni definiciji tonskih hierarhij pravilnih kar 60 %
odgovorov (15 tonov
od 25) za skladbe v duru in 68 % (17 od 25) za molove skladbe.
Pri kitajskih
-
Magistrska naloga 43
je bila možnost pravilnega odgovora z ugibanjem nekoliko
manǰsa, in sicer
44-odstotna (pravilnih je bilo 11 tonov od 25).
Evropski udeleženci so pravilneje reševali evropski kot
kitajski del, in
sicer so bili pri evropskem delu 94,2-odstotno uspešni, pri
kitajskem pa 89,7-
odstotno (uspešnost za evropski del – glasbeniki: 97,9 %,
neglasbeniki: 87,9
%; kitajski del – glasbeniki: 95,6 %, neglasbeniki: 79,5 %).
Primerjali smo
več kriterijev ter ali so med njimi statistično pomembne
razlike. Med obema
testnima blokoma (tj. v evropskem v primerjavi s kitajskim) so
bile po-
membne razlike znotraj obeh skupin udeležencev. Prav tako so
bile po-
membne statistične razlike med glasbeniki in neglasbeniki
znotraj posame-
znega testnega bloka. Natančni rezultati testov za preverjanje
razlik med
različnimi skupinami so navedeni v tabeli 6.3.
Tabela 6.3: Rezultati Wilcoxonovega testa vsote rangov
(primerjava glas-
benikov in neglasbenikov; W ) in Wilcoxonovega testa
enakovrednih parov
(primerjava evropske in kitajske glasbe; V ).
Udeleženci Glasba W V p
Glasbeniki : neglasbenikiEvropska 370 0,900
Kitajska 152 < 0,001
GlasbenikiEvropska : kitajska
0 < 0,001
Neglasbeniki 32 < 0,001
Kljub temu da so evropski udeleženci statistično pomembno
slabše reševali
kitajski del od evropskega, je bila njihova uspešnost zelo
visoka – združena
skupina glasbenikov in neglasbenikov je pri kitajskem bloku
dosegla skoraj
90-odstotno uspešnost, glasbeniki pa so bili skoraj popolnoma
uspešni. Po-
trdimo lahko torej hipotezo, da se hitro prilagodimo na
statistične tendence
glasbe nepoznanega sloga [22, 29, 31], pri tem pa pomembno vlogo
igra tudi
glasbena izkušenost oziroma sofistikacija.
Kot je že navedeno, je bila uspešnost evropskih udeležencev
94,2-odstotna
za evropski in 89,7-odstotna za kitajski blok. Model CHM (tako
CHM–eu
-
44 Špela Medvešek
kot CHM–cn) je pravilno nadaljeval prav vse skladbe v evropskem
ekspe-
rimentalnem bloku. Tako je bil torej na preizkusu z evropskimi
skladbami
100-odstotno uspešen in posledično bolj uspešen od
udeležencev.
Pri kitajskem eksperimentalnem bloku je bil CHM–cn prav tako
100-
odstotno uspešen, CHM–eu pa le 80-odstotno. Razlog, zakaj je
bil CHM–cn
na evropskem delu popolnoma uspešen, CHM–eu pa na kitajskem
delu ni bil,
je najverjetneje, da so vsi toni pentatonične lestvice
podmnožica diatonične
lestvice.
6.1.1 Analiza evropskega izseka
V tabeli 6.4 je predstavljena tonska hierarhija odlomka 3 (slika
5.1d, Sli-
ka 6.1a), po teoriji tonskih hierarhij, opisani v poglavju
3.1.2. Tonaliteta
skladbe je C-dur. Toni C-durove lestvice so opremljeni z
lestvičnimi sto-
pnjami (stolpec Stopnja). Stolpec Odgovor predstavlja
oddaljenost v pol-
tonih od zadnjega slǐsanega tona v poslušanem izseku. Če se
je izsek torej
zaključil na tonu E, so morali udeleženci za ton F drsnik
premakniti za eno
stopnjo (en polton) navzgor. Tabela vsebuje tudi vsote uteži za
odlomek 3,
kakršne je podal CHM.
V tonski hierarhiji imajo najvǐsje vrednosti toni, ki so del
lestvice, od
tega največ tonika (I. stopnja, v tem primeru C), sledi
dominanta (V. oz.
G), nato dominantna paralela (III. oz. E) in subdominanta (IV.
oz. F), še
nekoliko nižje sta tonična paralela (VI. oz. A) in
subdominantna paralela
(II. oz. D), najnižje pa vodilni ton (VII. oz. H) in
nediatonični toni (brez
označenih stopenj oz. v tem primeru vsi toni z #).
CHM–eu je v skladu s teorijo tonskih hierarhij najvǐsje uteži
dal tonom
ustrezne lestvice, z izjemo vodilnega tona (H oz. odgovor -5),
ki je dobil zelo
nizko utež, kljub temu da je del C-durove lestvice; vendar, kot
smo omenili
že prej, ima VII. stopnja tudi v tonski hierarhiji najnižjo
utež.
CHM–cn je očitno našel manj ujemajočih se vzorcev, saj so
njegove vsote
uteži veliko manǰse kot pri CHM–eu. Kljub temu je tudi CHM,
naučen na
kitajski učni množici, deloma prepoznal tonsko hierarhijo,
vendar je mogoče
-
Magistrska naloga 45
Tabela 6.4: Tonska hierarhija in vsote uteži CHM za odlomek 3.
Odebeljeno
je označeno dejansko nadaljevanje skladbe (C/–4) in najbolǰsa
odgovora glede
na CHM.
Ton Stopnja Odgovor TonalnostVsota uteži
CHM–eu CHM–cn
H VII. -5 2,88 1,14 -
C I. -4 6,35 14,26 6,89
C# -3 2,23 1,23 0,83
D II. -2 3,48 24,01 8,64
D# -1 2,33 4,40 -
E III. 0 4,38 20,42 4,11
F IV. 1 4,09 16,70 3,85
F# 2 2,52 6,08 0,40
G V. 3 5,19 17,05 10,85
G# 4 2,39 2,88 0,83
A VI. 5 3,66 8,07 2,73
opaziti, da so najvǐsje uteži prejeli odgovori, ki so del tako
diatonične (“evrop-
ske”) durove lestvice kot kitajske pentatonične lestvice.
V zgornji tabeli so predstavljeni zgolj toni, ki so od
izhodǐsčnega oddaljeni
za 5 poltonov (navzgor ali navzdol), saj so bili to odgovori, ki
so jih udeleženci
v veliki večini izbirali tako v našem eksperimentu (96,3 % za
evropske in 95,6
% za kitajske skladbe, gl. sliko 6.3) kot tudi v drugih, npr.
Carlsen 1981 [8].
Kot je že omenjeno, smo v tem poglavju kot nabor možnih
odgovorov iz-
brali zelo poenostavljeno različico zgornje tonske hierarhije.
Poenostavljeno
hierarhijo smo uporabili predvsem zato, da bi lahko primerjali
rezultate
evropskih in kitajskih izsekov, saj za kitajski tonalni sistem
še ne obstaja
podobna validirana hierarhija.
Podrobneje smo analizirali odgovore evropskih udeležencev na
evropskem
glasbenem izseku (odlomek 3, slika 5.1d). Preverjali smo, kako
dobro so se
melodična pričakovanja udeležencev skladala s predlaganim
modelom tonskih
-
46 Špela Medvešek
Slika 6.3: Frekvenčna porazdelitev odgovorov evropskih
udeležencev na
vseh 40 eksperimentalnih nalog.
hierarhij (in ne “pravilnim” odgovorov oz. dejanskim
nadaljevanjem izseka).
Rezultati udeležencev za odlomek 3 so predstavljeni v tabeli
6.5.
Tabela 6.5: Frekvenčna tabela odgovorov za odlomek 3 (dejanski
odgovor
je –4).
Odgovor Del lestvice? Glasb. Neglasb. Skupaj
-4 X 6 (17 %) 5 (24 %) 11 (19 %)
-2 X 29 (81 %) 7 (33 %) 36 (63 %)
-1 - 1 (5 %) 1 (2 %)
0 X - 3 (14 %) 3 (5 %)
1 X 1 (3 %) 4 (19 %) 5 (9 %)
2 - 1 (5 %) 1 (2 %)
Skupaj 36 (100 %) 21 (100 %) 57 (100 %)
Razpršenost odgovorov je bila med neglasbeniki večja kot med
glasbeniki,
kljub temu da je bila skupina glasbenikov skoraj dvakrat večja
od skupine ne-
glasbenikov. Za evropski eksperimentalni blok je bila povprečna
razpršenost
med glasbeniki 3,9 odgovorov, med neglasbeniki p