New Beoordeling van stotterernst voorspellen door het tellen en … · 2014. 12. 18. · Bevindingen De ernstperceptie van de luisteraars wordt met andere woorden voor zo'n 98% voorspeld

Faculteit Geneeskunde en Gezondheidswetenschappen

Academiejaar 2013-2014

Beoordeling van stotterernst voorspellen door het tellen en

timen van stottermomenten aan de hand van Praat-software

Dominique Geernaert

Promotor: Prof. Dr. P. Corthals

Masterproef voorgedragen tot het behalen van de graad van Master in de

Logopedische en Audiologische wetenschappen

Dankwoord

Aangezien het tot stand komen van deze scriptie mede het resultaat is van de

ondersteuning, samenwerking en inzet van verschillende personen, wil ik graag tot

hen mijn woord van dank richten.

Allereerst wil ik mijn promotor Prof. Dr. P. Corthals bedanken voor de begeleiding,

feedback en statistische ondersteuning.

Ten tweede dank ik alle mensen van het luisteraarspanel voor hun tijd,

enthousiasme en medewerking. Jullie waren een onmisbare schakel in dit

onderzoek.

De personen die bereid waren om mijn eindwerk na te lezen en mij hierin verder te

helpen, verdienen uiteraard ook mijn welgemeende dank.

Mijn medestudenten Sarah, Silke, Ester, Rachel en Annelies wil ik graag

bedanken voor de mentale steun, hulp en vriendschap doorheen dit laatste jaar.

Bedankt voor jullie tips, geruststellingen en deugddoende babbels.

Ten slotte wil ik heel graag mijn ouders, vriend, familie en vrienden bedanken voor

de lieve ondersteuning, aanmoediging en hulp die ze me gaven tijdens het

schrijven van deze thesis.

I

II

Inhoud

Dankwoord .............................................................................................................. I

Inhoud .................................................................................................................... II

Abstract .................................................................................................................. 1

Inleiding .................................................................................................................. 3

Methode ................................................................................................................. 8

Spraakstalen ....................................................................................................... 8

Analyseprotocol................................................................................................... 8

a) Annoteren .................................................................................................... 8

b) Script ........................................................................................................... 9

c) Resultaten .................................................................................................. 10

Luisteraarspanel ................................................................................................ 10

Statistische analyse .......................................................................................... 11

Resultaten ............................................................................................................ 14

Discussie .............................................................................................................. 17

Conclusie.............................................................................................................. 21

Referenties ........................................................................................................... 22

Appendices ........................................................................................................... 24

Appendix I: Specifieke menustappen ................................................................ 24

Appendix II: Instructies en invulformulier luisteraarspanel ................................ 25

Abstract

Doelstelling In dit onderzoek wordt er na gegaan of, en zo ja welke, objectieve,

meetbare stotterparameters de stotterernst in zulke mate kunnen bepalen dat het

de mening van de luisteraar weerspiegelt. Bovendien wordt onderzocht of in deze

context de stottermomenten beter geteld dan wel getimed worden.

Methodologie 51 spraakstalen van Engelstalige personen die stotteren, afkomstig

van de website van 'UCLASS', werden via het softwareprogramma 'Praat'

geannoteerd volgens de taxonomie van Packman & Onslow. Vervolgens werden

via één softwarescript verschillende getimede en getelde indices berekend: van

elke stotterparameter werd de frequentie van voorkomen en zijn (relatieve) duur

bepaald. Nadien werd de stotterernst van alle spraakstalen door een panel van

148 luisteraars beoordeeld aan de hand van een 5-puntenschaal.

Resultaten Na statistische analyse werden er 6 parameters gevonden met een

significante correlatie met de door de luisteraars beoordeelde stotterernst.

Multipele regressie bracht volgende top 5 van beste voorspellers aan het licht:

percentage vloeiende spraak, gemiddelde duur van vloeiende spraak, percentage

herhalingen, percentage blokkeringen en verlengingen en ten slotte telling van het

overbodig gedrag. Hun relatief belang op een schaal van 0 tot 1 is respectievelijk

0,37; 0,28; 0,25; 0,08 en 0,02.

Bevindingen De ernstperceptie van de luisteraars wordt met andere woorden voor

zo'n 98% voorspeld door getimede parameters. Dit duidt, voor logopedisten, het

belang aan van de nood aan toestellen die op een nauwkeurige manier

stottermomenten kunnen timen. De top 5 stotterparameters en hun relatief belang,

beiden verkregen dankzij deze studie, vormen een aangrijpingspunt voor

stottertherapie.

1

Purpose This study investigates whether there are objective, measurable

parameters that can determine the severity of someone's stuttering in such a way

that it corresponds to a listeners' opinion. It was also explored whether it's more

interesting to either time or to count the disfluencies.

Methodology 51 speech samples of English persons who stutter, derived from the

website of 'UCLASS', were annotated by the software program 'Praat', using the

taxonomy of Packman & Onslow. Next, several parameters based on timing and

counting were calculated by one software script . The frequency of occurrence and

the (relative) duration of each parameter were determined. The stuttering severity

of all speech samples was also judged by a panel of 148 listeners on the basis of

a 5 point severity scale.

Results Statistical analysis shows that 6 parameters have a significant correlation

with the judged stuttering severity. The top 5 predictors, found by multiple

regression, were percentage of fluent speech, average duration of fluent speech,

percentage of repetitions, percentage of blocks and prolongations and finally

counts of superfluous behavior. Their relative contribution on a scale from 0 to 1 is

respectively: 0,37; 0,28; 0,25; 0,08 and 0,02.

Findings It turns out that 98% of the prediction of the severity perception by the

listeners is determined by timed parameters. This indicates the importance of tools

that can time disfluencies in an accurate way. The top 5 parameters and their

relative importance in predicting the severity perception, both found in this study,

are a starting point for stuttering therapy.

2

Inleiding

Stotteren is een vloeiendheidsstoornis die welgekend is bij het publiek. Ondanks

deze bekendheid blijkt een eenduidige omschrijving niet zo eenvoudig. Stotteren is

een complex fenomeen waarover reeds talrijke theorieën zijn gevormd door de

jaren heen. De definities in de vakliteratuur lopen hierdoor vaak uiteen: sommige

baseren zich op de etiologie van stotteren ('Stammering is a symptom in a

psychopathological condition classified as a pregenital coversion neurosis'

Glauber, 1958, p.78), andere zijn eerder beschrijvend (Van Borsel, 2011). De

definitie van Wingate (1964) omschrijft stotteren als een verzameling van enerzijds

onvrijwillige, al dan niet hoorbare spraakkenmerken (herhalingen, verlengingen,...)

en anderzijds bijkomende secundaire stotterkenmerken (lichaamsbewegingen,

stereotiepe uitdrukkingen,...), alsook emoties en cognities (angst, schaamte,

gespannenheid,...). In de ICF-definitie (International Classification of Functioning,

Disability and Health) worden de ideeën van Yaruss (1998) gereflecteerd. Ook hier

kijkt men verder dan enkel de observeerbare kenmerken (herhalingen,

verlengingen, aarzelingen,...). Ze hebben aandacht voor de algemene impact van

de stoornis (negatieve spreekattitude, schaamte, beperkte sociale participatie,...)

en beschrijven zowel factoren die de stotteraar hinderen (negatieve reacties), als

faciliterende factoren (hulpgroepen, stottertherapie,...).

In deze studie wordt de taxonomie van Packman & Onslow (figuur 1) gebruikt, die

ook wel de 'Lidcombe behavorial data language of stuttering' genoemd wordt

(Teesson, Packman & Onslow, 2003). Deze taxonomie bestaat uit 3 categorieën

van observeerbare stotterverschijnselen: de herhaalde spreekbewegingen

('repeated movements'), de gefixeerde spreekposities ('fixed postures') en de

overbodige gedragingen ('superfluous behaviors'). De eerste categorie omvat

herhalingen van ofwel lettergrepen ('zij-zij-zij-zij-zij zwemt'/'ik eet een ba-ba-ba-

banaan') ofwel onvolledige lettergrepen ('hij k-k-k-k-kruipt onder het hek') ofwel

lettergrepenreeksen ('in de tele-tele-teletijdsmachine'/ 'ik zie ik zie ik zie het niet').

Onder de 'fixed postures' verstaan we enerzijds de hoorbare verlengingen en

anderzijds de geluidloze blokkeringen. De derde categorie bestaat uit alle

overbodige gedragingen die we opsplitsen in een verbaal deel (tussenwerpsels en

revisies van zinnen) en een non-verbaal deel (kuchen, smakken, blazen,...).

3

LIDCOMBEbehavioral data

language ofSTUTTERING

Repeated movements

-syllable repetition'Rs'

-incomplete syllable repetition'Ri'

-multisyllable repetition'Rm'

Fixed postures

-with audible airflow'Fp'

-without audible airflow'Fb'

Superfluous behaviors

-verbal (interjection, revision)'Si, Sr'

-nonverbal (visible/audible)'Sn'

FIGUUR 1: TAXONOMIE VAN PACKMAN & ONSLOW (CORTHALS, 2012)

Niet alleen uit diagnostisch belang, maar ook om de ontwikkeling van het stotteren

te kunnen opvolgen en de effectiviteit van therapieën te evalueren, is het

belangrijk om op een correcte manier stotteren te 'meten'. Om iemands

stotterernst te bepalen, bestaan er verschillende methoden. Het spreekt voor zich

dat men voor zo'n ernstbepaling de spraak van de stotteraar moet te horen krijgen.

In praktisch alle ernstmetingen wordt dan ook gebruik gemaakt van een

spraakstaal. Uiteraard streeft men bij de opname van zo'n spraakstaal naar een zo

goed mogelijke kwaliteit en probeert men alle storende achtergrondgeluiden te

vermijden (Van Borsel, 2011). Wat de duur van het spraakstaal betreft, bestaan er

verschillende visies. Conture (2001) wees erop dat clinici niet altijd controle

hebben over de grootte van het spraakstaal. Een studie van Sawyer en Yairi bij -6

jarigen (2006) hield aan dat korte spraakstalen (bv. 300 woorden) voor zekere

basisgegevens zorgen, maar hoe langer zo'n spraakstaal is, hoe correcter zijn

representatie zal zijn. Onvloeiendheden komen immers niet met een bepaalde

regelmaat voor en zijn niet gelijk verdeeld over iemands spraak. Korte

spraakstalen lopen het risico om enerzijds bepaalde onvloeiendheden te

onderrepresenteren, maar anderzijds te overrepresenteren wanneer bijvoorbeeld

4

een meer zeldzame onvloeiendheid toevallig voorkomt in het spraakstaal. Meer

onderzoek is nodig om te bepalen hoe lang het spraakstaal minimum moet zijn.

Wetende dat stotteren zowel visuele (vooral blokkades en non-verbaal overbodig

gedrag zoals bv. oogknipperingen) als auditieve gedragingen bevat, klinkt het

logisch dat stottermetingen die enkel gebaseerd zijn op geluidsopnames mogelijks

de stotterernst onderschatten (Rousseau, Onslow, Packman & Jones, 2008). De

studie van Rousseau, Onslow, Packman en Jones (2008) toont aan dat dit het

geval is voor de stotterfrequentie (%SS: percentage of syllables stuttered), maar

niet voor de stotterernst bij kinderen jonger dan 6 jaar (bij volwassenen worden

deze verschillen veel minder gevonden). Wanneer men gebruik maakt van

geluidsopnames wordt de %SS voor zo'n 20% onderschat vergeleken met de

video- en geluidsopnames. Een mogelijke verklaring voor deze bevindingen is dat

beelden de aandacht van de observeerder (het gaat hier om ervaren spraak- en

taalpathologen) doen stijgen en beter toelaten om bij onduidelijke, dubbelzinnige

stottermomenten uit te maken of het nu om een stottermoment ging of niet. Er

moet echter wel opgelet worden dat de stotterernst bij video- en geluidsopnames

niet overschat wordt. Het feit dat er geen verschillen worden gevonden bij de

algemene stotterernst (9-puntenschaal) kan verklaard worden doordat de

onderzoeker hierbij geen beslissingen moet maken of een individueel

stottermoment nu gestotterd was of niet, hij moet een algemene stotterernst

bepalen.

Eens men beschikt over een degelijk spraakstaal, bestaan er zoals reeds eerder

vermeld verschillende methoden om de stotterernst te bepalen. Bij de

'ernstschalen' kiest de beoordelaar op het einde van het spraakstaal een

getalwaarde die aangeeft hoe ernstig hij het stotteren percipieerde. Zo gebruikt het

Australische 'Lidcombe-programma' een tienpuntenschaal, waarbij 0 staat voor

'geen stotteren', 1 voor 'zeer licht stotteren' en 10 voor 'zeer ernstig stotteren' (Van

Borsel, 2011). Op dezelfde manier bestaan er ook zelf-evalutieschalen. Hierbij

gaat de stotteraar zelf zijn spraak beoordelen, zich baserend op stotterfrequentie,

stotterernst en subjectieve, met stotteren geassocieerde gevoelens (Huinck &

Rietveld, 2007). In een studie van O'Brian, Packman en Onslow (2004) vond men

een sterke correlatie (r = 0,91) tussen de gemiddelde scores op een 9-

puntenernstschaal en het percentage gestotterde lettergrepen (%SS). Huinck en

5

Rietveld (2007) vonden ook grote correlaties tussen zelfevaluatie en metingen

zoals SPM (spoken syllables per minute) en %SS. Deze laatst genoemde meting

is wereldwijd verspreid en wordt erg veel gebruikt in zowel de onderzoekswereld

als in de klinische praktijk (Van Borsel, 2011). %SS geeft aan hoeveel procent van

de lettergrepen in een spraakstaal werden gestotterd. Deze meting wordt meestal

in 'real time' uitgevoerd met een drukknopsysteem, maar kan ook via transcriptie

gebeuren (O'Brian, Packman & Onslow, 2004). De studie van Yarrus et al. (1998)

vergelijkt deze twee meettechnieken om stottermomenten te tellen. Bij de

'transcript-based' techniek maakt de clinicus een gedetailleerde orthografische

transcriptie van het spraakstaal en gaat hierin alle onvloeiendheden aanduiden en

coderen. Deze meettechniek is gedetailleerder, maar meer tijdsconsumerend dan

de 'real-time' techniek. Deze laatste houdt een snelle telling in van het aantal en

type onvloeiendheden. De clinicus beluistert en bekijkt het spraakstaal en noteert

tegelijkertijd bij elk woord of elke lettergeep of deze al dan niet vloeiend werd

uitgesproken. De uitkomsten van deze twee meettechnieken hebben een sterke,

significante, positieve correlatie. Men raadt aan om de 'transcript-based' techniek

te gebruiken bij het diagnosticeren en de 'real-time' techniek bij tussentijdse

evaluaties tijdens de behandeling. Men moet er wel attent op zijn dat bij de

'transcript-based' techniek de kans bestaat dat men gaat 'overanalyseren' en men

bij de 'real-time' techniek subtiele, lichte stottermomenten kan missen. De

Stuttering Severity Instrument (SSI) (Riley, 1972) maakt naast het percentage

gestotterde lettergrepen ook gebruik van de gemiddelde duur van de drie langste

stottermomenten en het voorkomen van 'meebewegingen' om de stotterernst te

meten. Een andere mogelijkheid om de stotterernst te bepalen is de 'Illinois

Clinician Stuttering Severtity Scale (Yairi en Ambrose, 2005). Er wordt gewerkt

met een spraakstaal van minstens 600 lettergrepen en men baseert zich op vier

parameters: het aantal onvloeiendheden per honderd lettergrepen, de gemiddelde

duur van de vijf langste herhalingen, de spanning bij de onvloeiendheden en

secundair stottergedrag. Een Nederlandstalige test voor +8-jarigen is de 'Test voor

stotterernst Lezers' (TvS-L) (Boey, 2007). Op basis van een spraakstaal bij

conversatie en bij lezen beoordeelt men de stotterernst door te kijken naar de

stotterfrequentie tijdens lezen en vertellen, de duur, de vermijdings- en

uitstelgedragingen, de start- en duwgedragingen en bijbewegingen.

6

Deze lijst met stotterernstmetingen is niet volledig, maar niet onbelangrijk is om

even stil te staan bij de persoon die deze metingen uitvoert. Hoe 'getraind' moet

men zijn om op een betrouwbare, representatieve manier de ernst van iemands

stotteren te bepalen? Een studie van Einarsdottir en Ingham (2008) bevestigt

vroegere onderzoeksbevindingen die aantoonden dat training ervoor zorgt dat

men stottermomenten beter kan identificeren. Een opmerkelijke bevinding in hun

onderzoek was dat zelfs zonder training de leerkrachten uit hun studie reeds een

zeer degelijke beoordeling uitvoerden: gemiddeld 86,7% correct. Na training

echter, was de accuraatheid nog verbeterd: gemiddeld 91,8% correct.

Hoeveel systemen er ook bestaan om de stotterernst te bepalen, de waarde van

een menselijk oordeel kan moeilijk overtroffen worden. De stotteraars zijn immers

vooral geïnteresseerd in de mening van de luisteraars. Werken met een

luisteraarspanel is dan ook de meettechniek bij uitstek. Jammer genoeg is deze

manier van werken erg tijdsconsumerend en bovendien niet realistisch. Daarom is

het waardevol om na te gaan welke objectieve parameters, die door slechts één

iemand kunnen berekend worden aan de hand van een softwareprogramma, de

mening van de luisteraar het best weergeven.

In deze studie wordt het softwareprogramma 'Praat' gebruikt om de verschillende

stotterparameters uit de taxonomie van Packman en Onslow (zie figuur 1) aan te

duiden in spraakstalen. Via scripting worden de stotterparameters niet enkel

geteld, maar ook de relatieve duur van de onvloeiendheden wordt nauwkeurig

bepaald.

Het doel van deze studie is na te gaan:

1. of er parameters bestaan om de stotterernst te bepalen,

2. welke (combinatie van) parameters het best overeenkomt met een

luisteraaroordeel,

3. of onvloeiendheden timen dan wel tellen beter is om de stotterernst te

bepalen.

7

Methode

Spraakstalen De eerste stap van deze studie bestond eruit spraakstalen te verzamelen. Er

wordt gebruik gemaakt van bestaande spraakstalen die ter beschikking gesteld

zijn door 'University College London' voor wetenschappelijk gebruik. De

spraakstalen kunnen vrij gedownload worden op de website van 'UCLASS'

(University College Londen's Archive of Stuttered Speech):

http://www.uclass.psychol.ucl.ac.uk/Audio/mp3. UCLASS wordt gefinancierd door 'The

Wellcome Trust'. Het gaat om 15 Engelstalige spraakstalen van zowel vrouwelijke

(4) als mannelijke (11) deelnemers tussen 9 en 40 jaar oud. Qua tijdsduur zijn -bij

benadering- telkens de eerste 60 seconden van de spraakstalen geselecteerd

voor dit onderzoek. Voor de statistische gegevensverwerking werd de dataset van

een gelijklopend onderzoek door studenten uit Virginia (36 UCLASS-spraakstalen)

samengevoegd met de uit deze studie verkregen data.

Analyseprotocol De audio-opnames worden in het softwareprogramma 'Praat' als wave-file

ingelezen en geannoteerd (a). Vervolgens wordt er een script gebruikt (een op

maat gemaakt analyseprotocol) om de annotaties te verwerken (b) en ten slotte

verschijnen automatisch de eindresultaten (c). De specifiek te volgen

menustappen zijn terug te vinden in appendix 1.

a) Annoteren Deze stap houdt in dat de audio-opname wordt beluisterd, gesegmenteerd

en gelabeld door de clinicus. In het 'view & edit' scherm (zie figuur 2) kan

men het spraakstaal beluisteren en elk stottermoment segmenteren en

labelen met vooraf afgesproken afkortingen (zie figuur 1). Zo wordt

bijvoorbeeld een verlenging aangeduid met ‘Fp’ en een lettergreepherhaling

met ‘Rs’. Een stottermoment zoals /k-k-k-k-k-kruis/ wordt als een herhaling

gelabeld en niet als een verlenging aangezien /k/ een stopklank is en deze

niet aanhoudend kan gefoneerd worden zoals in een verlenging. Het label

'herhaling' (R), wordt gebruikt wanneer exact dezelfde woorden worden

8

herhaald ('De jongen, de jongen, de jongen speelt in de tuin'). Bij een

'revisie' (Sr) gaat de stotteraar zijn zin herbeginnen -en mogelijks hierdoor

een woord herhalen- omwille van een andere zinsopbouw of om, eventueel

in het kader van vermijdingsgedrag, een ander woord te gebruiken ('Hij

speelt gr... hij speelt liever piano'). De vloeiende, stottervrije stukken worden

aangeduid met het label ‘1’. Momenten zonder spraak, waarbij de persoon

in kwestie bijvoorbeeld aan het nadenken is of in-/uitademt, worden niet

meegeteld en als ‘0’ gelabeld. Deze afkortingen of ‘labels’ worden in het

script (zie stap 2) gebruikt met het oog op de verwerking.

FIGUUR 2: 'VIEW & EDIT' VENSTER

DE LABELS VAN ALLE SEGMENTEN VERSCHIJNEN OP EEN BALK ONDER DE AUDIO-OPNAME. BIJ HET SEGMENTEREN IS DE EINDGRENS VAN HET ENE SEGMENT DE BEGINGRENS VAN HET VOLGENDE SEGMENT.

b) Script In een volgende stap worden de geannoteerde spraakstalen verwerkt door

een op maat gemaakt analyseprotocol: het script. Dit is een broncode-

document dat de handmatig aangebrachte gegevens (labels en

segmentgrenzen) automatisch verwerkt en uitrekent.

9

c) Resultaten

labels telling timing

FIGUUR 3: 'PRAAT PICTURE' VENSTER

IN HET 'PRAAT PICTURE' VENSTER VERSCHIJNEN DE RESULTATEN IN TABELVORM. DE EERSTE KOLOM BEVAT ALLE GEBRUIKTE LABELS. HOE VAAK DEZE LABELS VOORKWAMEN IN HET SPRAAKSTAAL, WORDT OPGESOMD IN DE TWEEDE KOLOM. IN DE LAATSTE DRIE KOLOMMEN KAN DE GEMIDDELDE DUUR, HET TOTAAL AANTAL SECONDEN EN HET PERCENTAGE VAN VOORKOMEN TERUGGEVONDEN WORDEN.

Luisteraarspanel De volgende stap bestond eruit om de spraakstalen door een panel van luisteraars

te laten beoordelen. Via het social medium 'facebook' werden 28 personen

gerecruteerd. Het gaat om 23 vrouwen en 5 mannen tussen 17 en 70 jaar oud. De

beoordelaars werden in twee subgroepen verdeeld (naargelang de datum dat ze

beschikbaar waren), respectievelijk 16 personen en 12 personen. De tweede

groep (12 personen) kreeg de spraakstalen in omgekeerde volgorde aangeboden

om zo het vermoeidheidseffect weg te werken. Elk spraakstaal van één minuut

dienden ze qua ernst te beoordelen aan de hand van een 5-puntenschaal waarop

de schaalpunten 1 als 'niet ernstig', 3 als 'gemiddeld' en 5 als 'zeer ernstig'

benoemd waren. Vooraleer de beoordeling van de 15 spraakstalen startte, kregen

de beoordelaars ter illustratie een spraakstaal te horen met een score 3 (deze

werd bepaald aan de hand van een consensus-rating door 12 Engelstalig

luisteraars). Figuur 4 geeft aan dat er variatie was in de ernstgradatie van de

spraakstalen. Alle scores werden door het panel gebruikt tijdens de

beoordelingen. De instructies die aan het luisteraarspanel werden gegeven, zijn

terug te vinden in appendix 2. Bij de studie uit Virginia ging het om 120

beoordelaars die verdeeld werden in 3 subgroepen van 40 personen. Hun leeftijd

10

varieerde van 14 tot 62 jaar. Ze werden geselecteerd via 'convenience sampling'.

De 36 spraakstalen werden verdeeld in 3 deelverzamelingen van elk 12 stalen.

Iedere groep beoordelaars kreeg dezelfde spraakstalen te horen in een

verschillende volgorde. Ook in deze studie moesten ze de gepercipieerde

stotterernst via een 5-puntenschaal aangeven en kregen ze als referentiepunt

eerst een spraakstaal met een score 3 te horen.

FIGUUR 4: DOOR DE LUISTERAARS BEPAALDE ERNSTSCORES VAN ALLE SPRAAKSTALEN

Statistische analyse Allereerst werd een Kolmogorov-Smirnovtest gedaan om te achterhalen of de

gegevens normaal verdeeld waren. Dit was het geval voor de ernstscore, maar

niet voor alle geannoteerde tellingen en chronometreringen (zie tabel 1). Vandaar

het gebruik van non-parametrische correlaties. De multipele regressie kon wel

doorgaan aangezien de afhankelijke variabele (ernstscore) normaal verdeeld was.

Per stotterkenmerk ('R', 'F' en 'S') werd er gekeken naar de correlatie met de

ernstscore en werd het 'gewicht' als predictor voor de ernstscore nagegaan. Zo

werd er een top 5 bekomen van beste voorspellers voor de ernstscore (zie figuur

5). Bij de berekeningen van de correlaties, werden de verschillende subtypes van

de onvloeiendheden samengenomen (dus Ri + Rs + Rm, Fp + Fb, Si + Sr + Sn)

aangezien niet elk subtype voorkwam in alle spraakstalen.

11

TABEL 1: KOLMOGOROV-SMIRNOVTEST

12

FIGUUR 5: RELATIEF BELANG VAN DE PARAMETERS OP EEN SCHAAL VAN 0 TOT 1

13

Resultaten

Zoals te zien in tabel 2, blijken er in totaal 6 parameters te zijn die een significante

correlatie vertonen met de gemiddelde gepercipieerde stotterernst van het

luisteraarspanel. Het betreft 3 getimede parameters (% vloeiende spraak, %

blokkeringen en verlengingen en % herhalingen) en 3 getelde parameters (aantal

blokkeringen en verlengingen, aantal herhalingen en aantal overbodige

gedragingen).

Timing van de vloeiende spraak is de parameter met de grootste -uiteraard

negatieve- correlatie (r = -0,697, p = 0,01). Het klinkt inderdaad logisch dat, hoe

meer seconden van het spraakstaal uit vloeiende stukken spraak bestaat, hoe

minder ernstig het stotteren wordt bevonden. Opvallend echter is het feit dat

wanneer de vloeiende stukken spraak worden geteld in plaats van getimed, er

geen significante correlatie optreedt. Telling van deze parameter is met andere

woorden geen betrouwbare voorspeller om de mening van de luisteraar te

achterhalen. Een spraakstaal van 1 minuut waarin er 10 keer gemiddeld 2

seconden vloeiende spraak wordt geteld, zal naar schatting meer ernstig worden

gescoord dan een staal dat slechts 2 stukken stottervrije spraak bevat, maar wel

van telkens 20 seconden lang. Hieruit wordt duidelijk dat telling van de vloeiende

spraak een vertekend beeld kan geven van de stotterernst en dat timing voor meer

representatieve resultaten zorgt.

Bij de parameter 'herhalingen' levert zowel telling als timing een significante

(positieve) correlatie op; respectievelijk r = 0,425 en r = 0,480 (met p telkens =

0,01). Hetzelfde geldt voor de 'blokkeringen en verlengingen'; respectievelijk r =

0,530 en r = 0,534 (p = 0,01). De correlaties liggen telkens opmerkelijk iets hoger

bij timing.

Met 'overbodige gedragingen' trachten stotteraars hun onvloeiendheden te

voorkomen, te verbergen of uit te stellen. Interessant genoeg, lijken deze

'ontwijkingsmanoeuvres' te lukken; hoe meer overbodige gedragingen er in het

spraakstaal worden geteld, hoe minder ernstig het stotteren wordt gepercipieerd.

Dat blijkt uit de negatieve, significante correlatie van telling van de overbodige

14

gedragingen (r = -0,286, p = 0,05). Tevens is dit de enige parameter waarbij timing

geen significante correlatie oplevert.

Algemeen kan er gesteld worden dat de duur van de stotterparameters (timing)

vaker en beter correleert met de ernstperceptie van de luisteraars.

Via multipele regressie werden alle stotterparameters (zowel timing als telling

ervan) met elkaar gecombineerd en gecorreleerd aan de algemene stotterernst

om zo tot de 'formule' te komen die de beste voorspeller is van de mening van de

luisteraar wat de stotterernst betreft. In de formule wordt de relatieve bijdrage van

elke parameter berekend. De top 5 van de beste voorspellers is weergegeven in

figuur 5. Op de horizontale as wordt het 'gewicht' van elke parameter in de

voorspelling duidelijk; hoe langer de balk, hoe meer aandeel de parameter heeft.

Zo wordt 65% van de voorspelling bepaald door timing van de vloeiende spraak

(% en gemiddelde duur), ongeveer 25% door het percentage herhalingen, zo'n 8%

door het percentage blokkeringen en verlengingen en ten slotte ongeveer 2% door

telling van het overbodig gedrag. De ernstperceptie van de luisteraars wordt met

andere woorden voor zo'n 98% voorspeld door getimede parameters.

15

TABEL 2: CORRELATIES VAN DE STOTTERPARAMETERS MET DE ALGEMENE STOTTERERNST

** Correlation is significant at the 0.01 level (2-tailed); * Correlation is significant at the 0.05 level (2-tailed)

MEANRATING_total

Spearman's rho

MEANRATING_total

CorrelationCoefficient 1,000

Sig. (2-tailed) .

N 52

fluent_count

CorrelationCoefficient ,045

Sig. (2-tailed) ,752

N 52

fluent_percent

CorrelationCoefficient -,697**


N 52

Fb+p_count

CorrelationCoefficient ,530**


N 52

Fb+p_percent



N 52

Rs+i+m_count



N 52

Rs+i+m_percent



N 52

Si+r+n_count

CorrelationCoefficient -,286*


N 52

Si+r+n_percent

CorrelationCoefficient -,175


N 52

16

Discussie

Wie of wat bepaalt hoe ernstig de vloeiendheidsproblemen zijn van een persoon

die stottert? Wat telt voor deze laatst genoemde, is de mening van de luisteraars.

Het menselijk oor (en oog) is met andere woorden nog steeds dé meettechniek bij

uitstek. Telkens een luisteraarspanel verzamelen om iemands stotterernst te

bepalen zou echter zeer tijdsrovend en vooral onrealistisch zijn. Een handigere en

bovendien veel snellere manier van werken is aan de slag gaan met een systeem

dat met objectieve, meetbare parameters werkt die een weerspiegeling zijn van de

mening van de luisteraars en bovendien door slechts één persoon kunnen

berekend worden. Dit is mogelijk met 'Praat'. Met dit softwareprogramma kunnen

verschillende stotterindexen via annotatie en scripting uit een spraakstaal

geëxtraheerd worden. Er rest nog enkel de vraag welke (combinatie) van die

indexen nu het best overeenstemt met de mening van de luisteraars.

Werken met 'Praat' brengt verschillende voordelen met zich mee. Ten eerste

kunnen de stottermomenten in het spraakstaal niet alleen geteld worden, maar

kan ook telkens de duur ervan nauwkeurig bepaald worden. Ten tweede kan de

audio-opname steeds herbeluisterd worden en kunnen de labels van de

onvloeiendheden desgevallend aangepast worden. Een derde voordeel van 'Praat'

is het feit dat na de annotatie met slechts één script, en dus één bewerking via

één muisklik, een hele reeks aan indexen wordt bekomen. Na de annotatie wordt

aldus op zeer korte tijd een grote hoeveelheid aan nauwkeurige resultaten

verkregen.

Een nadeel echter aan 'Praat' is het feit dat non-verbale overbodige gedragingen

die niet hoorbaar zijn (denk aan oogknipperingen) onmogelijk kunnen

gedetecteerd worden. Er wordt immers enkel met audiobestanden gewerkt en niet

met audiovisueel materiaal. Zoals reeds eerder in de inleiding vermeld, toonden

Rousseau et al. (2008) aan dat stottermetingen die enkel gebaseerd zijn op

geluidsopnames de stotterfrequentie (%SS: percentage gestotterde syllaben) voor

zo'n 20% onderschatten bij -6 jarigen. Deze ernstonderschatting wordt niet

gevonden bij de score voor de algemene stotterernst (9-puntenschaal) aangezien

de beoordelaar hierbij geen beslissingen moet nemen of een individueel

17

stottermoment nu gestotterd was of niet, maar een globale beoordeling moet

geven. De bevindingen van Rousseau et al. gelden voor metingen in het begin van

klinische onderzoeken. Voor metingen die plaatsvinden na de behandeling is het

risico op onderschatten veel minder aangezien het %SS dan veel lager is. In de

toekomst zou het gebruik van videomateriaal de eventuele ernstonderschatting

kunnen opvangen.

De verwerkingsduur voor de annotatie is een tweede nadeel van de werkmethode

met 'Praat'. Deze ligt hand in hand met de lengte van het spraakstaal wat op zijn

beurt dan weer te maken heeft met de betrouwbaarheid van de meettechniek.

Hoeveel seconden/onvloeiendheden moet het spraakstaal lang zijn om een

representatief beeld te krijgen van de stotterernst? Verder onderzoek is nodig om

uit te maken wat de minimumlengte van een spraakstaal hoort te zijn (Corthals,

2012). Een andere zijde van betrouwbaarheid is de 'interbeoordelaars-

betrouwbaarheid'; de mate waarin er unanimiteit heerst tussen de resultaten van

verschillende beoordelaars. Via een voorafgaande training waarin typische,

audiovisuele voorbeelden worden gegeven van annotaties kan de

interbeoordelaarsbetrouwbaarheid in positieve zin toenemen (Corthals, 2009).

Naast betrouwbaarheid moet een test ook validiteit bezitten. Aldus wordt er

teruggekomen op de vraag welke indexen nu het best correleren met de mening

van de luisteraars. Het is duidelijk dat er een ander beeld naar voren komt

wanneer iemands stottermomenten worden getimed of geteld. Zo kunnen twee

personen een zelfde aantal verlengingen en blokkades hebben in hun spraakstaal,

maar kan de ene bijvoorbeeld opmerkelijk langere verlengingen vertonen. Op

basis van telling zouden deze twee personen een gelijkaardige score krijgen, maar

na timing wordt duidelijk dat de ene persoon een veel hogere stotterernst 'verdient'

dan de andere, wat ook zou terugkeren in de mening van de luisteraars. Het is

uiteraard zo dat de ene stotterparameter nu eenmaal een betere kandidaat is om

te timen in plaats van te tellen (zoals in het voorbeeld; de verlengingen) en

omgekeerd. Algemeen kan er echter gesteld worden dat de getimede parameters

vaker en beter overeenstemmen met de mening van de luisteraars. De resultaten

van een studie van Curran en Hood (1997) gaven aan dat onvloeiendheden die

18

gefragmenteerd (herhalingen en verlengingen) en hoorbaar zijn, als meer ernstig

worden gepercipieerd. Ook bleek duidelijk dat naarmate een herhaling uit meer

delen bestond, de ernstperceptie steeg (Curran & Hood, 1997). Deze laatste

bevinding klinkt zeer logisch en zal zich enkel kunnen uiten in de duur -en niet in

de telling- van de stotterparameter.

Wanneer de resultaten van twee beoordelaars naast elkaar worden gelegd, wordt

duidelijk dat timen een veiligere manier van 'meten' is dan tellen. Het is immers

realistisch dat de ene beoordelaar een zeer kort/subtiel stottermoment al eens zal

missen. Wanneer dit een aantal keer voorkomt, zullen de tellingresultaten al snel

een groot verschil vertonen. De timingresultaten lijden hier beduidend veel minder

onder (Corthals, 2009).

Via het hier gebruikte Praat-script wordt er een profiel van de persoon die stottert

bekomen. Al snel wordt duidelijk welke types van onvloeiendheden het frequentst

voorkomen en welke de meeste tijd in beslag nemen. Dit profiel vormt dan ook

een bron waaruit aanknopingspunten voor de stottertherapie kunnen voortvloeien.

Naast het streven naar zoveel mogelijk vloeiende spraak, zou werken aan de duur

van de herhalingen, blokkeringen en verlengingen en werken aan het aantal

overbodige gedragingen volgens de resultaten van deze studie een positieve

invloed moeten hebben op hoe ernstig hun onvloeiendheden door de luisteraars

worden gepercipieerd.

Door de onvloeiendheden te timen kunnen verborgen therapie-effecten aan het

licht gebracht worden. Een persoon die stottert kan immers na x-aantal

weken/maanden stottertherapie nog steeds evenveel herhalingen, blokkeringen

en/of verlengingen vertonen, maar mogelijks is hij/zij er wel in geslaagd om de

duur van zijn/haar onvloeiendheden te verminderen zonder dat de therapeute, en

misschien zelfs de patiënt, zich hiervan bewust was (Corthals, 2009).

Het 'overbodig gedrag' lijkt volgens de significante, negatieve correlatie te slagen

in zijn rol als 'ontwijkingsmanoeuvre'. Aangezien deze correlatie echter alle types

van overbodig gedrag bevat, kan de vraag gesteld worden of de verschillende

types afzonderlijk ook dit resultaat zouden opleveren. Uit de resultaten van het

gelijklopende onderzoek door studenten uit Virginia bleek enkel de telling van de

revisies een significante, negatieve correlatie te hebben met de algemene

19

stotterernst (niet gepubliceerde dissertatie). Het waren met andere woorden enkel

de revisies die de stotteraars als trucje konden gebruiken om vloeiender over te

komen bij de luisteraars. Het lijkt inderdaad aanneembaar dat de andere

overbodige gedragingen zoals het kuchen en smakken een eerder negatief effect

hebben bij de luisteraars. Dit zijn non-verbale gedragingen die als storend,

onwennig en/of onvloeiend kunnen aangevoeld worden door de luisteraar. De

interjecties hebben mogelijk minder de capaciteit om een vloeiende indruk te

maken. Verder onderzoek zou kunnen uitmaken of deze bevindingen ook gelden

wanneer er gewerkt wordt met audiovisueel materiaal. Wellicht zorgt de

aanwezigheid van het beeldmateriaal voor een ander effect en resultaat.

Er kan geconcludeerd worden dat het percentage vloeiende spraak, een getimede

parameter, de gemakkelijkste en bovendien belangrijkste parameter is bij het

voorspellen van de stotterernst zoals een panel van luisteraars die zou

percipiëren. De andere parameters uit de top 5 mogen echter niet in waarde

onderschat worden aangezien zij zoals reeds eerder vermeld een belangrijk

aangrijpingspunt vormen naar behandeling toe.

De bevindingen van deze studie duiden voor logopedisten het belang aan van de

nood aan een instrument (zoals bijvoorbeeld 'Praat') dat naast telling, vooral

nauwkeurige timing van de onvloeiendheden toelaat.

20

Conclusie

1. Bestaan er parameters om de stotterernst te bepalen?

Er werden 6 parameters gevonden die een significante correlatie vertonen

met de gemiddelde, door de luisteraars beoordeelde stotterernst:

% (timing) Aantal (telling)

Vloeiende spraak Overbodige gedragingen

Blokkeringen & verlengingen Blokkeringen & verlengingen

Herhalingen Herhalingen

2. Welke combinatie van parameters komt het best overeen met een

luisteraaroordeel?

De mening van de luisteraar wordt het best voorspeld door volgende top 5:

− percentage vloeiende spraak (37%)

− gemiddelde duur van vloeiende spraak (28%)

− percentage herhalingen (25%)

− percentage blokkeringen en verlengingen (8%)

− telling van het overbodig gedrag (2%)

3. Is onvloeiendheden timen dan wel tellen beter om de stotterernst te

bepalen?

Algemeen kan er gesteld worden dat de duur van de stotterparameters

(timing) vaker en beter correleert met de ernstperceptie van de luisteraars.

21

Referenties

Boey, R. (2007). Test voor Stotterernst Lezers (TvS-L). Herentals: Vlaamse

Vereniging voor Logopedisten.

Conture, E. (2001). Stuttering: Its nature, diagnosis, and treatment. Needham

Heights: MA: Allyn & Bacon.

Corthals, P. (2012). Onvloeiendheden timen en tellen in "Praat": een tutorial.

LOGOPEDIE, 68-75.

Corthals, P. (5-8 Aug. 2009). Timing and Tallying Dysfluencies using Praat

computer software. 5th World Congress on Fluency Disorders. Rio de Janeiro,

Brazil.

Curran, M. F., & Hood, S. B. (1977). Listener ratings of severity for specific

disfluency types in children. Journal of Fluency Disorders, 2, 87-97.

Einarsdóttir, J., & Ingham, J. R. (2008). The effect of stuttering measurement

training on judging stuttering occurrence in preschool children who stutter. Journal

of Fluency Disorders, 33, 167-179.

Huinck, W., & Rietveld, T. (2007). The validity of a simple outcome measure to

assess stuttering therapy. Folia Phoniatrica et Logopaedica, 59, 91-99.

O'Brian, S., Packman, A., Onslow, M., & O'Brian, N. (2004). Measurement of

stuttering in adults: comparison of stuttering-rate and severity-scaling methods.

Journal of Speech, Language, and Hearing Research, 47, 1081-1087.

Riley, G. (1972). A stuttering severity instrument for children and adults. Journal of

Speech and Hearing Disorders, 37, 314-322.

Rousseau, I., Onslow, M., Packmann, A., & Jones, M. (2008). Comparisons of

audio and audiovisual measures of stuttering frequency and severity on preschool-

age children. American Journal of Speech-Language Pathology, 17, 173-178.

Sawyer, J., & Yairi, E. (2006). The effect of sample size on the assessment of

stuttering severity. American Journal of Speech-Language Pathology, 15, 36-44.

22

Teessin, K., Packman, A., & Onslow, M. (2003). The Lidcombe behavioral data

language of stuttering. Journal of Speech, Language and Hearing Research, 44,

1009-1015.

Throneburg, R. N., & Yairi, E. (2001). Durational, Proportionate, and absolute

frequency characteristics of disfluencies: a longitudinal study regarding

persistence and recovery. Journal of Speech, Language, and Hearing Research,

44, 38-51.

Van Borsel, J. (2011). Basisbegrippen logopedie Deel 2:

communicatiestoornissen, Stotteren en broddelen. Leuven (België): Acco.

Wingate, M. E. (1964). A standard definition of stuttering. Journal of Speech and

Hearing Disorders, 29, 484-489.

Yairi, E., & Ambrose, N. (2005). Early childhood stuttering. Austin: TX: Pro-Ed.

Yaruss, J. S., Max, M., Newman, R., & Campbell, J. H. (1998). Comparing real-

time and transcript-based techniques for measuring stuttering. Journal of Fluency

Disorders, 23, 137-151.

23

Appendices

Appendix I: Specifieke menustappen

• Annoteren

− open het softwareprogramma 'Praat'

− kies in het 'Praat Objects' venster voor 'open' en 'read from file'

− kies het gewenste bestand dat geannoteerd moet worden

− klik op het gekozen spraakstaal zodanig dat dit grijs wordt

− kies voor 'annotate' en 'to textgrid'

− in het 'view & edit' venster kunnen grenzen gemaakt worden door op

'enter' te klikken en verwijderd worden via 'alt' + 'backspace'

− let op: geen extra spaties voor of achter de labels

− opslaan via 'file' en 'save Textgrid as text file' (Ctrl S)

• Scripting

− voeg het gewenste TextGrid-bestand in het 'Praat Objects' venster in

− selecteer dit bestand

− kies voor 'Praat' en 'open praat script'

− let er op dat de cursor in de eerste alinea staat en dus voor de

textgrid

− klik op 'run' in het broncode-venster (zie figuur 6)

FIGUUR 6: BRONCODE-VENSTER

24

Appendix II: Instructies en invulformulier luisteraarspanel

Welkom allemaal. Eerst en vooral wil ik jullie bedanken voor jullie deelname. Mijn

thesis gaat -samenvattend gezegd- over het bepalen van stotterernst. In het kader

hiervan gaan jullie zo dadelijk -één voor één- vijftien mannelijke en vrouwelijke,

Engelstalige mensen te horen krijgen die stotteren. Je hoort hen elk één minuut

praten. Hun leeftijd varieert van zeven tot veertig jaar. Het feit dat ze Engels

spreken doet eigenlijk niet ter zake omdat jullie hen niet moeten verstaan, jullie

moeten enkel op de onvloeiendheden letten. Jullie moeten telkens aan de hand

van een vijfpuntenschaal bepalen hoe erg je dit geval van stotteren vindt, waarbij

een score 'één' aanduidt dat je het niet zo ernstig vindt en een score 'vijf' dat je het

juist heel ernstig vindt. Als voorbeeld laat ik nu iemand horen die een 'gemiddelde

ernst' zou scoren, een score 'drie' met andere woorden. Zo kunnen jullie ten

opzichte van deze ernst de andere beoordelingen afwegen. Na ieder

geluidsfragment krijgen jullie eventjes de tijd om na te denken over jullie score.

Jullie mogen gedurende het hele half uur de cijfers nog veranderen, mochten jullie

bijvoorbeeld het vorige toch ernstiger vinden na het horen van een volgend

fragment. Ten slotte wil ik jullie vragen om je niet te laten leiden door hetgeen je

buren schrijven, er is geen juist of fout antwoord, ik ben benieuwd naar jullie

persoonlijke mening! Zijn er nog vragen?

25

26

Naam:..............................................................................................................................

Leeftijd:............................................................................................................................

Beroep/ Studierichting: ...................................................................................................

Datum:.............................................................................................................................

1= NIET ERNSTIG, 5= HEEL ERNSTIG

1 2 3 4 5

1) jongen, 14 jaar

2) jongen, 14 jaar

3) jongen, 14 jaar

4) meisje, 11 jaar

5) meisje, 11 jaar

6) jongen, 14 jaar

7) jongen, 11 jaar

8) jongen, 7 jaar

9) man, 20 jaar

10) man, 40 jaar

11) jongen, 9 jaar

12) meisje, 15 jaar

13) meisje, 11 jaar

14) jongen, 12 jaar

15) jongen, 11 jaar

DankwoordInhoudAbstractInleidingMethode SpraakstalenAnalyseprotocola) Annoteren b) Scriptc) Resultaten

LuisteraarspanelStatistische analyse

ResultatenDiscussieConclusieReferentiesAppendices Appendix I: Specifieke menustappen Appendix II: Instructies en invulformulier luisteraarspanel

New Beoordeling van stotterernst voorspellen door het tellen en … · 2014. 12. 18. · Bevindingen De ernstperceptie van de luisteraars wordt met andere woorden voor zo'n 98% voorspeld

Documents