-
Faculteit Geneeskunde en Gezondheidswetenschappen
Academiejaar 2013-2014
Beoordeling van stotterernst voorspellen door het tellen en
timen van stottermomenten aan de hand van Praat-software
Dominique Geernaert
Promotor: Prof. Dr. P. Corthals
Masterproef voorgedragen tot het behalen van de graad van Master
in de
Logopedische en Audiologische wetenschappen
-
-
-
-
Faculteit Geneeskunde en Gezondheidswetenschappen
Academiejaar 2013-2014
Beoordeling van stotterernst voorspellen door het tellen en
timen van stottermomenten aan de hand van Praat-software
Dominique Geernaert
Promotor: Prof. Dr. P. Corthals
Masterproef voorgedragen tot het behalen van de graad van Master
in de
Logopedische en Audiologische wetenschappen
-
-
Dankwoord
Aangezien het tot stand komen van deze scriptie mede het
resultaat is van de
ondersteuning, samenwerking en inzet van verschillende personen,
wil ik graag tot
hen mijn woord van dank richten.
Allereerst wil ik mijn promotor Prof. Dr. P. Corthals bedanken
voor de begeleiding,
feedback en statistische ondersteuning.
Ten tweede dank ik alle mensen van het luisteraarspanel voor hun
tijd,
enthousiasme en medewerking. Jullie waren een onmisbare schakel
in dit
onderzoek.
De personen die bereid waren om mijn eindwerk na te lezen en mij
hierin verder te
helpen, verdienen uiteraard ook mijn welgemeende dank.
Mijn medestudenten Sarah, Silke, Ester, Rachel en Annelies wil
ik graag
bedanken voor de mentale steun, hulp en vriendschap doorheen dit
laatste jaar.
Bedankt voor jullie tips, geruststellingen en deugddoende
babbels.
Ten slotte wil ik heel graag mijn ouders, vriend, familie en
vrienden bedanken voor
de lieve ondersteuning, aanmoediging en hulp die ze me gaven
tijdens het
schrijven van deze thesis.
I
-
II
Inhoud
Dankwoord
..............................................................................................................
I
Inhoud
....................................................................................................................
II
Abstract
..................................................................................................................
1
Inleiding
..................................................................................................................
3
Methode
.................................................................................................................
8
Spraakstalen
.......................................................................................................
8
Analyseprotocol...................................................................................................
8
a) Annoteren
....................................................................................................
8
b) Script
...........................................................................................................
9
c) Resultaten
..................................................................................................
10
Luisteraarspanel
................................................................................................
10
Statistische analyse
..........................................................................................
11
Resultaten
............................................................................................................
14
Discussie
..............................................................................................................
17
Conclusie..............................................................................................................
21
Referenties
...........................................................................................................
22
Appendices
...........................................................................................................
24
Appendix I: Specifieke menustappen
................................................................
24
Appendix II: Instructies en invulformulier luisteraarspanel
................................ 25
-
Abstract
Doelstelling In dit onderzoek wordt er na gegaan of, en zo ja
welke, objectieve,
meetbare stotterparameters de stotterernst in zulke mate kunnen
bepalen dat het
de mening van de luisteraar weerspiegelt. Bovendien wordt
onderzocht of in deze
context de stottermomenten beter geteld dan wel getimed
worden.
Methodologie 51 spraakstalen van Engelstalige personen die
stotteren, afkomstig
van de website van 'UCLASS', werden via het softwareprogramma
'Praat'
geannoteerd volgens de taxonomie van Packman & Onslow.
Vervolgens werden
via één softwarescript verschillende getimede en getelde indices
berekend: van
elke stotterparameter werd de frequentie van voorkomen en zijn
(relatieve) duur
bepaald. Nadien werd de stotterernst van alle spraakstalen door
een panel van
148 luisteraars beoordeeld aan de hand van een
5-puntenschaal.
Resultaten Na statistische analyse werden er 6 parameters
gevonden met een
significante correlatie met de door de luisteraars beoordeelde
stotterernst.
Multipele regressie bracht volgende top 5 van beste voorspellers
aan het licht:
percentage vloeiende spraak, gemiddelde duur van vloeiende
spraak, percentage
herhalingen, percentage blokkeringen en verlengingen en ten
slotte telling van het
overbodig gedrag. Hun relatief belang op een schaal van 0 tot 1
is respectievelijk
0,37; 0,28; 0,25; 0,08 en 0,02.
Bevindingen De ernstperceptie van de luisteraars wordt met
andere woorden voor
zo'n 98% voorspeld door getimede parameters. Dit duidt, voor
logopedisten, het
belang aan van de nood aan toestellen die op een nauwkeurige
manier
stottermomenten kunnen timen. De top 5 stotterparameters en hun
relatief belang,
beiden verkregen dankzij deze studie, vormen een
aangrijpingspunt voor
stottertherapie.
1
-
Purpose This study investigates whether there are objective,
measurable
parameters that can determine the severity of someone's
stuttering in such a way
that it corresponds to a listeners' opinion. It was also
explored whether it's more
interesting to either time or to count the disfluencies.
Methodology 51 speech samples of English persons who stutter,
derived from the
website of 'UCLASS', were annotated by the software program
'Praat', using the
taxonomy of Packman & Onslow. Next, several parameters based
on timing and
counting were calculated by one software script . The frequency
of occurrence and
the (relative) duration of each parameter were determined. The
stuttering severity
of all speech samples was also judged by a panel of 148
listeners on the basis of
a 5 point severity scale.
Results Statistical analysis shows that 6 parameters have a
significant correlation
with the judged stuttering severity. The top 5 predictors, found
by multiple
regression, were percentage of fluent speech, average duration
of fluent speech,
percentage of repetitions, percentage of blocks and
prolongations and finally
counts of superfluous behavior. Their relative contribution on a
scale from 0 to 1 is
respectively: 0,37; 0,28; 0,25; 0,08 and 0,02.
Findings It turns out that 98% of the prediction of the severity
perception by the
listeners is determined by timed parameters. This indicates the
importance of tools
that can time disfluencies in an accurate way. The top 5
parameters and their
relative importance in predicting the severity perception, both
found in this study,
are a starting point for stuttering therapy.
2
-
Inleiding
Stotteren is een vloeiendheidsstoornis die welgekend is bij het
publiek. Ondanks
deze bekendheid blijkt een eenduidige omschrijving niet zo
eenvoudig. Stotteren is
een complex fenomeen waarover reeds talrijke theorieën zijn
gevormd door de
jaren heen. De definities in de vakliteratuur lopen hierdoor
vaak uiteen: sommige
baseren zich op de etiologie van stotteren ('Stammering is a
symptom in a
psychopathological condition classified as a pregenital
coversion neurosis'
Glauber, 1958, p.78), andere zijn eerder beschrijvend (Van
Borsel, 2011). De
definitie van Wingate (1964) omschrijft stotteren als een
verzameling van enerzijds
onvrijwillige, al dan niet hoorbare spraakkenmerken
(herhalingen, verlengingen,...)
en anderzijds bijkomende secundaire stotterkenmerken
(lichaamsbewegingen,
stereotiepe uitdrukkingen,...), alsook emoties en cognities
(angst, schaamte,
gespannenheid,...). In de ICF-definitie (International
Classification of Functioning,
Disability and Health) worden de ideeën van Yaruss (1998)
gereflecteerd. Ook hier
kijkt men verder dan enkel de observeerbare kenmerken
(herhalingen,
verlengingen, aarzelingen,...). Ze hebben aandacht voor de
algemene impact van
de stoornis (negatieve spreekattitude, schaamte, beperkte
sociale participatie,...)
en beschrijven zowel factoren die de stotteraar hinderen
(negatieve reacties), als
faciliterende factoren (hulpgroepen, stottertherapie,...).
In deze studie wordt de taxonomie van Packman & Onslow
(figuur 1) gebruikt, die
ook wel de 'Lidcombe behavorial data language of stuttering'
genoemd wordt
(Teesson, Packman & Onslow, 2003). Deze taxonomie bestaat
uit 3 categorieën
van observeerbare stotterverschijnselen: de herhaalde
spreekbewegingen
('repeated movements'), de gefixeerde spreekposities ('fixed
postures') en de
overbodige gedragingen ('superfluous behaviors'). De eerste
categorie omvat
herhalingen van ofwel lettergrepen ('zij-zij-zij-zij-zij
zwemt'/'ik eet een ba-ba-ba-
banaan') ofwel onvolledige lettergrepen ('hij k-k-k-k-kruipt
onder het hek') ofwel
lettergrepenreeksen ('in de tele-tele-teletijdsmachine'/ 'ik zie
ik zie ik zie het niet').
Onder de 'fixed postures' verstaan we enerzijds de hoorbare
verlengingen en
anderzijds de geluidloze blokkeringen. De derde categorie
bestaat uit alle
overbodige gedragingen die we opsplitsen in een verbaal deel
(tussenwerpsels en
revisies van zinnen) en een non-verbaal deel (kuchen, smakken,
blazen,...).
3
-
LIDCOMBEbehavioral data
language ofSTUTTERING
Repeated movements
-syllable repetition'Rs'
-incomplete syllable repetition'Ri'
-multisyllable repetition'Rm'
Fixed postures
-with audible airflow'Fp'
-without audible airflow'Fb'
Superfluous behaviors
-verbal (interjection, revision)'Si, Sr'
-nonverbal (visible/audible)'Sn'
FIGUUR 1: TAXONOMIE VAN PACKMAN & ONSLOW (CORTHALS,
2012)
Niet alleen uit diagnostisch belang, maar ook om de ontwikkeling
van het stotteren
te kunnen opvolgen en de effectiviteit van therapieën te
evalueren, is het
belangrijk om op een correcte manier stotteren te 'meten'. Om
iemands
stotterernst te bepalen, bestaan er verschillende methoden. Het
spreekt voor zich
dat men voor zo'n ernstbepaling de spraak van de stotteraar moet
te horen krijgen.
In praktisch alle ernstmetingen wordt dan ook gebruik gemaakt
van een
spraakstaal. Uiteraard streeft men bij de opname van zo'n
spraakstaal naar een zo
goed mogelijke kwaliteit en probeert men alle storende
achtergrondgeluiden te
vermijden (Van Borsel, 2011). Wat de duur van het spraakstaal
betreft, bestaan er
verschillende visies. Conture (2001) wees erop dat clinici niet
altijd controle
hebben over de grootte van het spraakstaal. Een studie van
Sawyer en Yairi bij -6
jarigen (2006) hield aan dat korte spraakstalen (bv. 300
woorden) voor zekere
basisgegevens zorgen, maar hoe langer zo'n spraakstaal is, hoe
correcter zijn
representatie zal zijn. Onvloeiendheden komen immers niet met
een bepaalde
regelmaat voor en zijn niet gelijk verdeeld over iemands spraak.
Korte
spraakstalen lopen het risico om enerzijds bepaalde
onvloeiendheden te
onderrepresenteren, maar anderzijds te overrepresenteren wanneer
bijvoorbeeld
4
-
een meer zeldzame onvloeiendheid toevallig voorkomt in het
spraakstaal. Meer
onderzoek is nodig om te bepalen hoe lang het spraakstaal
minimum moet zijn.
Wetende dat stotteren zowel visuele (vooral blokkades en
non-verbaal overbodig
gedrag zoals bv. oogknipperingen) als auditieve gedragingen
bevat, klinkt het
logisch dat stottermetingen die enkel gebaseerd zijn op
geluidsopnames mogelijks
de stotterernst onderschatten (Rousseau, Onslow, Packman &
Jones, 2008). De
studie van Rousseau, Onslow, Packman en Jones (2008) toont aan
dat dit het
geval is voor de stotterfrequentie (%SS: percentage of syllables
stuttered), maar
niet voor de stotterernst bij kinderen jonger dan 6 jaar (bij
volwassenen worden
deze verschillen veel minder gevonden). Wanneer men gebruik
maakt van
geluidsopnames wordt de %SS voor zo'n 20% onderschat vergeleken
met de
video- en geluidsopnames. Een mogelijke verklaring voor deze
bevindingen is dat
beelden de aandacht van de observeerder (het gaat hier om
ervaren spraak- en
taalpathologen) doen stijgen en beter toelaten om bij
onduidelijke, dubbelzinnige
stottermomenten uit te maken of het nu om een stottermoment ging
of niet. Er
moet echter wel opgelet worden dat de stotterernst bij video- en
geluidsopnames
niet overschat wordt. Het feit dat er geen verschillen worden
gevonden bij de
algemene stotterernst (9-puntenschaal) kan verklaard worden
doordat de
onderzoeker hierbij geen beslissingen moet maken of een
individueel
stottermoment nu gestotterd was of niet, hij moet een algemene
stotterernst
bepalen.
Eens men beschikt over een degelijk spraakstaal, bestaan er
zoals reeds eerder
vermeld verschillende methoden om de stotterernst te bepalen.
Bij de
'ernstschalen' kiest de beoordelaar op het einde van het
spraakstaal een
getalwaarde die aangeeft hoe ernstig hij het stotteren
percipieerde. Zo gebruikt het
Australische 'Lidcombe-programma' een tienpuntenschaal, waarbij
0 staat voor
'geen stotteren', 1 voor 'zeer licht stotteren' en 10 voor 'zeer
ernstig stotteren' (Van
Borsel, 2011). Op dezelfde manier bestaan er ook
zelf-evalutieschalen. Hierbij
gaat de stotteraar zelf zijn spraak beoordelen, zich baserend op
stotterfrequentie,
stotterernst en subjectieve, met stotteren geassocieerde
gevoelens (Huinck &
Rietveld, 2007). In een studie van O'Brian, Packman en Onslow
(2004) vond men
een sterke correlatie (r = 0,91) tussen de gemiddelde scores op
een 9-
puntenernstschaal en het percentage gestotterde lettergrepen
(%SS). Huinck en
5
-
Rietveld (2007) vonden ook grote correlaties tussen
zelfevaluatie en metingen
zoals SPM (spoken syllables per minute) en %SS. Deze laatst
genoemde meting
is wereldwijd verspreid en wordt erg veel gebruikt in zowel de
onderzoekswereld
als in de klinische praktijk (Van Borsel, 2011). %SS geeft aan
hoeveel procent van
de lettergrepen in een spraakstaal werden gestotterd. Deze
meting wordt meestal
in 'real time' uitgevoerd met een drukknopsysteem, maar kan ook
via transcriptie
gebeuren (O'Brian, Packman & Onslow, 2004). De studie van
Yarrus et al. (1998)
vergelijkt deze twee meettechnieken om stottermomenten te
tellen. Bij de
'transcript-based' techniek maakt de clinicus een gedetailleerde
orthografische
transcriptie van het spraakstaal en gaat hierin alle
onvloeiendheden aanduiden en
coderen. Deze meettechniek is gedetailleerder, maar meer
tijdsconsumerend dan
de 'real-time' techniek. Deze laatste houdt een snelle telling
in van het aantal en
type onvloeiendheden. De clinicus beluistert en bekijkt het
spraakstaal en noteert
tegelijkertijd bij elk woord of elke lettergeep of deze al dan
niet vloeiend werd
uitgesproken. De uitkomsten van deze twee meettechnieken hebben
een sterke,
significante, positieve correlatie. Men raadt aan om de
'transcript-based' techniek
te gebruiken bij het diagnosticeren en de 'real-time' techniek
bij tussentijdse
evaluaties tijdens de behandeling. Men moet er wel attent op
zijn dat bij de
'transcript-based' techniek de kans bestaat dat men gaat
'overanalyseren' en men
bij de 'real-time' techniek subtiele, lichte stottermomenten kan
missen. De
Stuttering Severity Instrument (SSI) (Riley, 1972) maakt naast
het percentage
gestotterde lettergrepen ook gebruik van de gemiddelde duur van
de drie langste
stottermomenten en het voorkomen van 'meebewegingen' om de
stotterernst te
meten. Een andere mogelijkheid om de stotterernst te bepalen is
de 'Illinois
Clinician Stuttering Severtity Scale (Yairi en Ambrose, 2005).
Er wordt gewerkt
met een spraakstaal van minstens 600 lettergrepen en men baseert
zich op vier
parameters: het aantal onvloeiendheden per honderd lettergrepen,
de gemiddelde
duur van de vijf langste herhalingen, de spanning bij de
onvloeiendheden en
secundair stottergedrag. Een Nederlandstalige test voor
+8-jarigen is de 'Test voor
stotterernst Lezers' (TvS-L) (Boey, 2007). Op basis van een
spraakstaal bij
conversatie en bij lezen beoordeelt men de stotterernst door te
kijken naar de
stotterfrequentie tijdens lezen en vertellen, de duur, de
vermijdings- en
uitstelgedragingen, de start- en duwgedragingen en
bijbewegingen.
6
-
Deze lijst met stotterernstmetingen is niet volledig, maar niet
onbelangrijk is om
even stil te staan bij de persoon die deze metingen uitvoert.
Hoe 'getraind' moet
men zijn om op een betrouwbare, representatieve manier de ernst
van iemands
stotteren te bepalen? Een studie van Einarsdottir en Ingham
(2008) bevestigt
vroegere onderzoeksbevindingen die aantoonden dat training
ervoor zorgt dat
men stottermomenten beter kan identificeren. Een opmerkelijke
bevinding in hun
onderzoek was dat zelfs zonder training de leerkrachten uit hun
studie reeds een
zeer degelijke beoordeling uitvoerden: gemiddeld 86,7% correct.
Na training
echter, was de accuraatheid nog verbeterd: gemiddeld 91,8%
correct.
Hoeveel systemen er ook bestaan om de stotterernst te bepalen,
de waarde van
een menselijk oordeel kan moeilijk overtroffen worden. De
stotteraars zijn immers
vooral geïnteresseerd in de mening van de luisteraars. Werken
met een
luisteraarspanel is dan ook de meettechniek bij uitstek. Jammer
genoeg is deze
manier van werken erg tijdsconsumerend en bovendien niet
realistisch. Daarom is
het waardevol om na te gaan welke objectieve parameters, die
door slechts één
iemand kunnen berekend worden aan de hand van een
softwareprogramma, de
mening van de luisteraar het best weergeven.
In deze studie wordt het softwareprogramma 'Praat' gebruikt om
de verschillende
stotterparameters uit de taxonomie van Packman en Onslow (zie
figuur 1) aan te
duiden in spraakstalen. Via scripting worden de
stotterparameters niet enkel
geteld, maar ook de relatieve duur van de onvloeiendheden wordt
nauwkeurig
bepaald.
Het doel van deze studie is na te gaan:
1. of er parameters bestaan om de stotterernst te bepalen,
2. welke (combinatie van) parameters het best overeenkomt met
een
luisteraaroordeel,
3. of onvloeiendheden timen dan wel tellen beter is om de
stotterernst te
bepalen.
7
-
Methode
Spraakstalen De eerste stap van deze studie bestond eruit
spraakstalen te verzamelen. Er
wordt gebruik gemaakt van bestaande spraakstalen die ter
beschikking gesteld
zijn door 'University College London' voor wetenschappelijk
gebruik. De
spraakstalen kunnen vrij gedownload worden op de website van
'UCLASS'
(University College Londen's Archive of Stuttered Speech):
http://www.uclass.psychol.ucl.ac.uk/Audio/mp3. UCLASS wordt
gefinancierd door 'The
Wellcome Trust'. Het gaat om 15 Engelstalige spraakstalen van
zowel vrouwelijke
(4) als mannelijke (11) deelnemers tussen 9 en 40 jaar oud. Qua
tijdsduur zijn -bij
benadering- telkens de eerste 60 seconden van de spraakstalen
geselecteerd
voor dit onderzoek. Voor de statistische gegevensverwerking werd
de dataset van
een gelijklopend onderzoek door studenten uit Virginia (36
UCLASS-spraakstalen)
samengevoegd met de uit deze studie verkregen data.
Analyseprotocol De audio-opnames worden in het softwareprogramma
'Praat' als wave-file
ingelezen en geannoteerd (a). Vervolgens wordt er een script
gebruikt (een op
maat gemaakt analyseprotocol) om de annotaties te verwerken (b)
en ten slotte
verschijnen automatisch de eindresultaten (c). De specifiek te
volgen
menustappen zijn terug te vinden in appendix 1.
a) Annoteren Deze stap houdt in dat de audio-opname wordt
beluisterd, gesegmenteerd
en gelabeld door de clinicus. In het 'view & edit' scherm
(zie figuur 2) kan
men het spraakstaal beluisteren en elk stottermoment segmenteren
en
labelen met vooraf afgesproken afkortingen (zie figuur 1). Zo
wordt
bijvoorbeeld een verlenging aangeduid met ‘Fp’ en een
lettergreepherhaling
met ‘Rs’. Een stottermoment zoals /k-k-k-k-k-kruis/ wordt als
een herhaling
gelabeld en niet als een verlenging aangezien /k/ een stopklank
is en deze
niet aanhoudend kan gefoneerd worden zoals in een verlenging.
Het label
'herhaling' (R), wordt gebruikt wanneer exact dezelfde woorden
worden
8
-
herhaald ('De jongen, de jongen, de jongen speelt in de tuin').
Bij een
'revisie' (Sr) gaat de stotteraar zijn zin herbeginnen -en
mogelijks hierdoor
een woord herhalen- omwille van een andere zinsopbouw of om,
eventueel
in het kader van vermijdingsgedrag, een ander woord te gebruiken
('Hij
speelt gr... hij speelt liever piano'). De vloeiende,
stottervrije stukken worden
aangeduid met het label ‘1’. Momenten zonder spraak, waarbij de
persoon
in kwestie bijvoorbeeld aan het nadenken is of in-/uitademt,
worden niet
meegeteld en als ‘0’ gelabeld. Deze afkortingen of ‘labels’
worden in het
script (zie stap 2) gebruikt met het oog op de verwerking.
FIGUUR 2: 'VIEW & EDIT' VENSTER
DE LABELS VAN ALLE SEGMENTEN VERSCHIJNEN OP EEN BALK ONDER DE
AUDIO-OPNAME. BIJ HET SEGMENTEREN IS DE EINDGRENS VAN HET ENE
SEGMENT DE BEGINGRENS VAN HET VOLGENDE SEGMENT.
b) Script In een volgende stap worden de geannoteerde
spraakstalen verwerkt door
een op maat gemaakt analyseprotocol: het script. Dit is een
broncode-
document dat de handmatig aangebrachte gegevens (labels en
segmentgrenzen) automatisch verwerkt en uitrekent.
9
-
c) Resultaten
labels telling timing
FIGUUR 3: 'PRAAT PICTURE' VENSTER
IN HET 'PRAAT PICTURE' VENSTER VERSCHIJNEN DE RESULTATEN IN
TABELVORM. DE EERSTE KOLOM BEVAT ALLE GEBRUIKTE LABELS. HOE VAAK
DEZE LABELS VOORKWAMEN IN HET SPRAAKSTAAL, WORDT OPGESOMD IN DE
TWEEDE KOLOM. IN DE LAATSTE DRIE KOLOMMEN KAN DE GEMIDDELDE DUUR,
HET TOTAAL AANTAL SECONDEN EN HET PERCENTAGE VAN VOORKOMEN
TERUGGEVONDEN WORDEN.
Luisteraarspanel De volgende stap bestond eruit om de
spraakstalen door een panel van luisteraars
te laten beoordelen. Via het social medium 'facebook' werden 28
personen
gerecruteerd. Het gaat om 23 vrouwen en 5 mannen tussen 17 en 70
jaar oud. De
beoordelaars werden in twee subgroepen verdeeld (naargelang de
datum dat ze
beschikbaar waren), respectievelijk 16 personen en 12 personen.
De tweede
groep (12 personen) kreeg de spraakstalen in omgekeerde volgorde
aangeboden
om zo het vermoeidheidseffect weg te werken. Elk spraakstaal van
één minuut
dienden ze qua ernst te beoordelen aan de hand van een
5-puntenschaal waarop
de schaalpunten 1 als 'niet ernstig', 3 als 'gemiddeld' en 5 als
'zeer ernstig'
benoemd waren. Vooraleer de beoordeling van de 15 spraakstalen
startte, kregen
de beoordelaars ter illustratie een spraakstaal te horen met een
score 3 (deze
werd bepaald aan de hand van een consensus-rating door 12
Engelstalig
luisteraars). Figuur 4 geeft aan dat er variatie was in de
ernstgradatie van de
spraakstalen. Alle scores werden door het panel gebruikt tijdens
de
beoordelingen. De instructies die aan het luisteraarspanel
werden gegeven, zijn
terug te vinden in appendix 2. Bij de studie uit Virginia ging
het om 120
beoordelaars die verdeeld werden in 3 subgroepen van 40
personen. Hun leeftijd
10
-
varieerde van 14 tot 62 jaar. Ze werden geselecteerd via
'convenience sampling'.
De 36 spraakstalen werden verdeeld in 3 deelverzamelingen van
elk 12 stalen.
Iedere groep beoordelaars kreeg dezelfde spraakstalen te horen
in een
verschillende volgorde. Ook in deze studie moesten ze de
gepercipieerde
stotterernst via een 5-puntenschaal aangeven en kregen ze als
referentiepunt
eerst een spraakstaal met een score 3 te horen.
FIGUUR 4: DOOR DE LUISTERAARS BEPAALDE ERNSTSCORES VAN ALLE
SPRAAKSTALEN
Statistische analyse Allereerst werd een Kolmogorov-Smirnovtest
gedaan om te achterhalen of de
gegevens normaal verdeeld waren. Dit was het geval voor de
ernstscore, maar
niet voor alle geannoteerde tellingen en chronometreringen (zie
tabel 1). Vandaar
het gebruik van non-parametrische correlaties. De multipele
regressie kon wel
doorgaan aangezien de afhankelijke variabele (ernstscore)
normaal verdeeld was.
Per stotterkenmerk ('R', 'F' en 'S') werd er gekeken naar de
correlatie met de
ernstscore en werd het 'gewicht' als predictor voor de
ernstscore nagegaan. Zo
werd er een top 5 bekomen van beste voorspellers voor de
ernstscore (zie figuur
5). Bij de berekeningen van de correlaties, werden de
verschillende subtypes van
de onvloeiendheden samengenomen (dus Ri + Rs + Rm, Fp + Fb, Si +
Sr + Sn)
aangezien niet elk subtype voorkwam in alle spraakstalen.
11
-
TABEL 1: KOLMOGOROV-SMIRNOVTEST
12
-
FIGUUR 5: RELATIEF BELANG VAN DE PARAMETERS OP EEN SCHAAL VAN 0
TOT 1
13
-
Resultaten
Zoals te zien in tabel 2, blijken er in totaal 6 parameters te
zijn die een significante
correlatie vertonen met de gemiddelde gepercipieerde
stotterernst van het
luisteraarspanel. Het betreft 3 getimede parameters (% vloeiende
spraak, %
blokkeringen en verlengingen en % herhalingen) en 3 getelde
parameters (aantal
blokkeringen en verlengingen, aantal herhalingen en aantal
overbodige
gedragingen).
Timing van de vloeiende spraak is de parameter met de grootste
-uiteraard
negatieve- correlatie (r = -0,697, p = 0,01). Het klinkt
inderdaad logisch dat, hoe
meer seconden van het spraakstaal uit vloeiende stukken spraak
bestaat, hoe
minder ernstig het stotteren wordt bevonden. Opvallend echter is
het feit dat
wanneer de vloeiende stukken spraak worden geteld in plaats van
getimed, er
geen significante correlatie optreedt. Telling van deze
parameter is met andere
woorden geen betrouwbare voorspeller om de mening van de
luisteraar te
achterhalen. Een spraakstaal van 1 minuut waarin er 10 keer
gemiddeld 2
seconden vloeiende spraak wordt geteld, zal naar schatting meer
ernstig worden
gescoord dan een staal dat slechts 2 stukken stottervrije spraak
bevat, maar wel
van telkens 20 seconden lang. Hieruit wordt duidelijk dat
telling van de vloeiende
spraak een vertekend beeld kan geven van de stotterernst en dat
timing voor meer
representatieve resultaten zorgt.
Bij de parameter 'herhalingen' levert zowel telling als timing
een significante
(positieve) correlatie op; respectievelijk r = 0,425 en r =
0,480 (met p telkens =
0,01). Hetzelfde geldt voor de 'blokkeringen en verlengingen';
respectievelijk r =
0,530 en r = 0,534 (p = 0,01). De correlaties liggen telkens
opmerkelijk iets hoger
bij timing.
Met 'overbodige gedragingen' trachten stotteraars hun
onvloeiendheden te
voorkomen, te verbergen of uit te stellen. Interessant genoeg,
lijken deze
'ontwijkingsmanoeuvres' te lukken; hoe meer overbodige
gedragingen er in het
spraakstaal worden geteld, hoe minder ernstig het stotteren
wordt gepercipieerd.
Dat blijkt uit de negatieve, significante correlatie van telling
van de overbodige
14
-
gedragingen (r = -0,286, p = 0,05). Tevens is dit de enige
parameter waarbij timing
geen significante correlatie oplevert.
Algemeen kan er gesteld worden dat de duur van de
stotterparameters (timing)
vaker en beter correleert met de ernstperceptie van de
luisteraars.
Via multipele regressie werden alle stotterparameters (zowel
timing als telling
ervan) met elkaar gecombineerd en gecorreleerd aan de algemene
stotterernst
om zo tot de 'formule' te komen die de beste voorspeller is van
de mening van de
luisteraar wat de stotterernst betreft. In de formule wordt de
relatieve bijdrage van
elke parameter berekend. De top 5 van de beste voorspellers is
weergegeven in
figuur 5. Op de horizontale as wordt het 'gewicht' van elke
parameter in de
voorspelling duidelijk; hoe langer de balk, hoe meer aandeel de
parameter heeft.
Zo wordt 65% van de voorspelling bepaald door timing van de
vloeiende spraak
(% en gemiddelde duur), ongeveer 25% door het percentage
herhalingen, zo'n 8%
door het percentage blokkeringen en verlengingen en ten slotte
ongeveer 2% door
telling van het overbodig gedrag. De ernstperceptie van de
luisteraars wordt met
andere woorden voor zo'n 98% voorspeld door getimede
parameters.
15
-
TABEL 2: CORRELATIES VAN DE STOTTERPARAMETERS MET DE ALGEMENE
STOTTERERNST
** Correlation is significant at the 0.01 level (2-tailed); *
Correlation is significant at the 0.05 level (2-tailed)
MEANRATING_total
Spearman's rho
MEANRATING_total
CorrelationCoefficient 1,000
Sig. (2-tailed) .
N 52
fluent_count
CorrelationCoefficient ,045
Sig. (2-tailed) ,752
N 52
fluent_percent
CorrelationCoefficient -,697**
Sig. (2-tailed) ,000
N 52
Fb+p_count
CorrelationCoefficient ,530**
Sig. (2-tailed) ,000
N 52
Fb+p_percent
CorrelationCoefficient ,534**
Sig. (2-tailed) ,000
N 52
Rs+i+m_count
CorrelationCoefficient ,425**
Sig. (2-tailed) ,002
N 52
Rs+i+m_percent
CorrelationCoefficient ,480**
Sig. (2-tailed) ,000
N 52
Si+r+n_count
CorrelationCoefficient -,286*
Sig. (2-tailed) ,040
N 52
Si+r+n_percent
CorrelationCoefficient -,175
Sig. (2-tailed) ,215
N 52
16
-
Discussie
Wie of wat bepaalt hoe ernstig de vloeiendheidsproblemen zijn
van een persoon
die stottert? Wat telt voor deze laatst genoemde, is de mening
van de luisteraars.
Het menselijk oor (en oog) is met andere woorden nog steeds dé
meettechniek bij
uitstek. Telkens een luisteraarspanel verzamelen om iemands
stotterernst te
bepalen zou echter zeer tijdsrovend en vooral onrealistisch
zijn. Een handigere en
bovendien veel snellere manier van werken is aan de slag gaan
met een systeem
dat met objectieve, meetbare parameters werkt die een
weerspiegeling zijn van de
mening van de luisteraars en bovendien door slechts één persoon
kunnen
berekend worden. Dit is mogelijk met 'Praat'. Met dit
softwareprogramma kunnen
verschillende stotterindexen via annotatie en scripting uit een
spraakstaal
geëxtraheerd worden. Er rest nog enkel de vraag welke
(combinatie) van die
indexen nu het best overeenstemt met de mening van de
luisteraars.
Werken met 'Praat' brengt verschillende voordelen met zich mee.
Ten eerste
kunnen de stottermomenten in het spraakstaal niet alleen geteld
worden, maar
kan ook telkens de duur ervan nauwkeurig bepaald worden. Ten
tweede kan de
audio-opname steeds herbeluisterd worden en kunnen de labels van
de
onvloeiendheden desgevallend aangepast worden. Een derde
voordeel van 'Praat'
is het feit dat na de annotatie met slechts één script, en dus
één bewerking via
één muisklik, een hele reeks aan indexen wordt bekomen. Na de
annotatie wordt
aldus op zeer korte tijd een grote hoeveelheid aan nauwkeurige
resultaten
verkregen.
Een nadeel echter aan 'Praat' is het feit dat non-verbale
overbodige gedragingen
die niet hoorbaar zijn (denk aan oogknipperingen) onmogelijk
kunnen
gedetecteerd worden. Er wordt immers enkel met audiobestanden
gewerkt en niet
met audiovisueel materiaal. Zoals reeds eerder in de inleiding
vermeld, toonden
Rousseau et al. (2008) aan dat stottermetingen die enkel
gebaseerd zijn op
geluidsopnames de stotterfrequentie (%SS: percentage gestotterde
syllaben) voor
zo'n 20% onderschatten bij -6 jarigen. Deze ernstonderschatting
wordt niet
gevonden bij de score voor de algemene stotterernst
(9-puntenschaal) aangezien
de beoordelaar hierbij geen beslissingen moet nemen of een
individueel
17
-
stottermoment nu gestotterd was of niet, maar een globale
beoordeling moet
geven. De bevindingen van Rousseau et al. gelden voor metingen
in het begin van
klinische onderzoeken. Voor metingen die plaatsvinden na de
behandeling is het
risico op onderschatten veel minder aangezien het %SS dan veel
lager is. In de
toekomst zou het gebruik van videomateriaal de eventuele
ernstonderschatting
kunnen opvangen.
De verwerkingsduur voor de annotatie is een tweede nadeel van de
werkmethode
met 'Praat'. Deze ligt hand in hand met de lengte van het
spraakstaal wat op zijn
beurt dan weer te maken heeft met de betrouwbaarheid van de
meettechniek.
Hoeveel seconden/onvloeiendheden moet het spraakstaal lang zijn
om een
representatief beeld te krijgen van de stotterernst? Verder
onderzoek is nodig om
uit te maken wat de minimumlengte van een spraakstaal hoort te
zijn (Corthals,
2012). Een andere zijde van betrouwbaarheid is de
'interbeoordelaars-
betrouwbaarheid'; de mate waarin er unanimiteit heerst tussen de
resultaten van
verschillende beoordelaars. Via een voorafgaande training waarin
typische,
audiovisuele voorbeelden worden gegeven van annotaties kan
de
interbeoordelaarsbetrouwbaarheid in positieve zin toenemen
(Corthals, 2009).
Naast betrouwbaarheid moet een test ook validiteit bezitten.
Aldus wordt er
teruggekomen op de vraag welke indexen nu het best correleren
met de mening
van de luisteraars. Het is duidelijk dat er een ander beeld naar
voren komt
wanneer iemands stottermomenten worden getimed of geteld. Zo
kunnen twee
personen een zelfde aantal verlengingen en blokkades hebben in
hun spraakstaal,
maar kan de ene bijvoorbeeld opmerkelijk langere verlengingen
vertonen. Op
basis van telling zouden deze twee personen een gelijkaardige
score krijgen, maar
na timing wordt duidelijk dat de ene persoon een veel hogere
stotterernst 'verdient'
dan de andere, wat ook zou terugkeren in de mening van de
luisteraars. Het is
uiteraard zo dat de ene stotterparameter nu eenmaal een betere
kandidaat is om
te timen in plaats van te tellen (zoals in het voorbeeld; de
verlengingen) en
omgekeerd. Algemeen kan er echter gesteld worden dat de getimede
parameters
vaker en beter overeenstemmen met de mening van de luisteraars.
De resultaten
van een studie van Curran en Hood (1997) gaven aan dat
onvloeiendheden die
18
-
gefragmenteerd (herhalingen en verlengingen) en hoorbaar zijn,
als meer ernstig
worden gepercipieerd. Ook bleek duidelijk dat naarmate een
herhaling uit meer
delen bestond, de ernstperceptie steeg (Curran & Hood,
1997). Deze laatste
bevinding klinkt zeer logisch en zal zich enkel kunnen uiten in
de duur -en niet in
de telling- van de stotterparameter.
Wanneer de resultaten van twee beoordelaars naast elkaar worden
gelegd, wordt
duidelijk dat timen een veiligere manier van 'meten' is dan
tellen. Het is immers
realistisch dat de ene beoordelaar een zeer kort/subtiel
stottermoment al eens zal
missen. Wanneer dit een aantal keer voorkomt, zullen de
tellingresultaten al snel
een groot verschil vertonen. De timingresultaten lijden hier
beduidend veel minder
onder (Corthals, 2009).
Via het hier gebruikte Praat-script wordt er een profiel van de
persoon die stottert
bekomen. Al snel wordt duidelijk welke types van onvloeiendheden
het frequentst
voorkomen en welke de meeste tijd in beslag nemen. Dit profiel
vormt dan ook
een bron waaruit aanknopingspunten voor de stottertherapie
kunnen voortvloeien.
Naast het streven naar zoveel mogelijk vloeiende spraak, zou
werken aan de duur
van de herhalingen, blokkeringen en verlengingen en werken aan
het aantal
overbodige gedragingen volgens de resultaten van deze studie een
positieve
invloed moeten hebben op hoe ernstig hun onvloeiendheden door de
luisteraars
worden gepercipieerd.
Door de onvloeiendheden te timen kunnen verborgen
therapie-effecten aan het
licht gebracht worden. Een persoon die stottert kan immers na
x-aantal
weken/maanden stottertherapie nog steeds evenveel herhalingen,
blokkeringen
en/of verlengingen vertonen, maar mogelijks is hij/zij er wel in
geslaagd om de
duur van zijn/haar onvloeiendheden te verminderen zonder dat de
therapeute, en
misschien zelfs de patiënt, zich hiervan bewust was (Corthals,
2009).
Het 'overbodig gedrag' lijkt volgens de significante, negatieve
correlatie te slagen
in zijn rol als 'ontwijkingsmanoeuvre'. Aangezien deze
correlatie echter alle types
van overbodig gedrag bevat, kan de vraag gesteld worden of de
verschillende
types afzonderlijk ook dit resultaat zouden opleveren. Uit de
resultaten van het
gelijklopende onderzoek door studenten uit Virginia bleek enkel
de telling van de
revisies een significante, negatieve correlatie te hebben met de
algemene
19
-
stotterernst (niet gepubliceerde dissertatie). Het waren met
andere woorden enkel
de revisies die de stotteraars als trucje konden gebruiken om
vloeiender over te
komen bij de luisteraars. Het lijkt inderdaad aanneembaar dat de
andere
overbodige gedragingen zoals het kuchen en smakken een eerder
negatief effect
hebben bij de luisteraars. Dit zijn non-verbale gedragingen die
als storend,
onwennig en/of onvloeiend kunnen aangevoeld worden door de
luisteraar. De
interjecties hebben mogelijk minder de capaciteit om een
vloeiende indruk te
maken. Verder onderzoek zou kunnen uitmaken of deze bevindingen
ook gelden
wanneer er gewerkt wordt met audiovisueel materiaal. Wellicht
zorgt de
aanwezigheid van het beeldmateriaal voor een ander effect en
resultaat.
Er kan geconcludeerd worden dat het percentage vloeiende spraak,
een getimede
parameter, de gemakkelijkste en bovendien belangrijkste
parameter is bij het
voorspellen van de stotterernst zoals een panel van luisteraars
die zou
percipiëren. De andere parameters uit de top 5 mogen echter niet
in waarde
onderschat worden aangezien zij zoals reeds eerder vermeld een
belangrijk
aangrijpingspunt vormen naar behandeling toe.
De bevindingen van deze studie duiden voor logopedisten het
belang aan van de
nood aan een instrument (zoals bijvoorbeeld 'Praat') dat naast
telling, vooral
nauwkeurige timing van de onvloeiendheden toelaat.
20
-
Conclusie
1. Bestaan er parameters om de stotterernst te bepalen?
Er werden 6 parameters gevonden die een significante correlatie
vertonen
met de gemiddelde, door de luisteraars beoordeelde
stotterernst:
% (timing) Aantal (telling)
Vloeiende spraak Overbodige gedragingen
Blokkeringen & verlengingen Blokkeringen &
verlengingen
Herhalingen Herhalingen
2. Welke combinatie van parameters komt het best overeen met
een
luisteraaroordeel?
De mening van de luisteraar wordt het best voorspeld door
volgende top 5:
− percentage vloeiende spraak (37%)
− gemiddelde duur van vloeiende spraak (28%)
− percentage herhalingen (25%)
− percentage blokkeringen en verlengingen (8%)
− telling van het overbodig gedrag (2%)
3. Is onvloeiendheden timen dan wel tellen beter om de
stotterernst te
bepalen?
Algemeen kan er gesteld worden dat de duur van de
stotterparameters
(timing) vaker en beter correleert met de ernstperceptie van de
luisteraars.
21
-
Referenties
Boey, R. (2007). Test voor Stotterernst Lezers (TvS-L).
Herentals: Vlaamse
Vereniging voor Logopedisten.
Conture, E. (2001). Stuttering: Its nature, diagnosis, and
treatment. Needham
Heights: MA: Allyn & Bacon.
Corthals, P. (2012). Onvloeiendheden timen en tellen in "Praat":
een tutorial.
LOGOPEDIE, 68-75.
Corthals, P. (5-8 Aug. 2009). Timing and Tallying Dysfluencies
using Praat
computer software. 5th World Congress on Fluency Disorders. Rio
de Janeiro,
Brazil.
Curran, M. F., & Hood, S. B. (1977). Listener ratings of
severity for specific
disfluency types in children. Journal of Fluency Disorders, 2,
87-97.
Einarsdóttir, J., & Ingham, J. R. (2008). The effect of
stuttering measurement
training on judging stuttering occurrence in preschool children
who stutter. Journal
of Fluency Disorders, 33, 167-179.
Huinck, W., & Rietveld, T. (2007). The validity of a simple
outcome measure to
assess stuttering therapy. Folia Phoniatrica et Logopaedica, 59,
91-99.
O'Brian, S., Packman, A., Onslow, M., & O'Brian, N. (2004).
Measurement of
stuttering in adults: comparison of stuttering-rate and
severity-scaling methods.
Journal of Speech, Language, and Hearing Research, 47,
1081-1087.
Riley, G. (1972). A stuttering severity instrument for children
and adults. Journal of
Speech and Hearing Disorders, 37, 314-322.
Rousseau, I., Onslow, M., Packmann, A., & Jones, M. (2008).
Comparisons of
audio and audiovisual measures of stuttering frequency and
severity on preschool-
age children. American Journal of Speech-Language Pathology, 17,
173-178.
Sawyer, J., & Yairi, E. (2006). The effect of sample size on
the assessment of
stuttering severity. American Journal of Speech-Language
Pathology, 15, 36-44.
22
-
Teessin, K., Packman, A., & Onslow, M. (2003). The Lidcombe
behavioral data
language of stuttering. Journal of Speech, Language and Hearing
Research, 44,
1009-1015.
Throneburg, R. N., & Yairi, E. (2001). Durational,
Proportionate, and absolute
frequency characteristics of disfluencies: a longitudinal study
regarding
persistence and recovery. Journal of Speech, Language, and
Hearing Research,
44, 38-51.
Van Borsel, J. (2011). Basisbegrippen logopedie Deel 2:
communicatiestoornissen, Stotteren en broddelen. Leuven
(België): Acco.
Wingate, M. E. (1964). A standard definition of stuttering.
Journal of Speech and
Hearing Disorders, 29, 484-489.
Yairi, E., & Ambrose, N. (2005). Early childhood stuttering.
Austin: TX: Pro-Ed.
Yaruss, J. S., Max, M., Newman, R., & Campbell, J. H.
(1998). Comparing real-
time and transcript-based techniques for measuring stuttering.
Journal of Fluency
Disorders, 23, 137-151.
23
-
Appendices
Appendix I: Specifieke menustappen
• Annoteren
− open het softwareprogramma 'Praat'
− kies in het 'Praat Objects' venster voor 'open' en 'read from
file'
− kies het gewenste bestand dat geannoteerd moet worden
− klik op het gekozen spraakstaal zodanig dat dit grijs
wordt
− kies voor 'annotate' en 'to textgrid'
− in het 'view & edit' venster kunnen grenzen gemaakt worden
door op
'enter' te klikken en verwijderd worden via 'alt' +
'backspace'
− let op: geen extra spaties voor of achter de labels
− opslaan via 'file' en 'save Textgrid as text file' (Ctrl
S)
• Scripting
− voeg het gewenste TextGrid-bestand in het 'Praat Objects'
venster in
− selecteer dit bestand
− kies voor 'Praat' en 'open praat script'
− let er op dat de cursor in de eerste alinea staat en dus voor
de
textgrid
− klik op 'run' in het broncode-venster (zie figuur 6)
FIGUUR 6: BRONCODE-VENSTER
24
-
Appendix II: Instructies en invulformulier luisteraarspanel
Welkom allemaal. Eerst en vooral wil ik jullie bedanken voor
jullie deelname. Mijn
thesis gaat -samenvattend gezegd- over het bepalen van
stotterernst. In het kader
hiervan gaan jullie zo dadelijk -één voor één- vijftien
mannelijke en vrouwelijke,
Engelstalige mensen te horen krijgen die stotteren. Je hoort hen
elk één minuut
praten. Hun leeftijd varieert van zeven tot veertig jaar. Het
feit dat ze Engels
spreken doet eigenlijk niet ter zake omdat jullie hen niet
moeten verstaan, jullie
moeten enkel op de onvloeiendheden letten. Jullie moeten telkens
aan de hand
van een vijfpuntenschaal bepalen hoe erg je dit geval van
stotteren vindt, waarbij
een score 'één' aanduidt dat je het niet zo ernstig vindt en een
score 'vijf' dat je het
juist heel ernstig vindt. Als voorbeeld laat ik nu iemand horen
die een 'gemiddelde
ernst' zou scoren, een score 'drie' met andere woorden. Zo
kunnen jullie ten
opzichte van deze ernst de andere beoordelingen afwegen. Na
ieder
geluidsfragment krijgen jullie eventjes de tijd om na te denken
over jullie score.
Jullie mogen gedurende het hele half uur de cijfers nog
veranderen, mochten jullie
bijvoorbeeld het vorige toch ernstiger vinden na het horen van
een volgend
fragment. Ten slotte wil ik jullie vragen om je niet te laten
leiden door hetgeen je
buren schrijven, er is geen juist of fout antwoord, ik ben
benieuwd naar jullie
persoonlijke mening! Zijn er nog vragen?
25
-
26
Naam:..............................................................................................................................
Leeftijd:............................................................................................................................
Beroep/ Studierichting:
...................................................................................................
Datum:.............................................................................................................................
1= NIET ERNSTIG, 5= HEEL ERNSTIG
1 2 3 4 5
1) jongen, 14 jaar
2) jongen, 14 jaar
3) jongen, 14 jaar
4) meisje, 11 jaar
5) meisje, 11 jaar
6) jongen, 14 jaar
7) jongen, 11 jaar
8) jongen, 7 jaar
9) man, 20 jaar
10) man, 40 jaar
11) jongen, 9 jaar
12) meisje, 15 jaar
13) meisje, 11 jaar
14) jongen, 12 jaar
15) jongen, 11 jaar
-
DankwoordInhoudAbstractInleidingMethode
SpraakstalenAnalyseprotocola) Annoteren b) Scriptc) Resultaten
LuisteraarspanelStatistische analyse
ResultatenDiscussieConclusieReferentiesAppendices Appendix I:
Specifieke menustappen Appendix II: Instructies en invulformulier
luisteraarspanel