Pausduration och bedömning av talflyt Tobias Lövgren

UMEÅ UNIVERSITET
Institutionen för klinisk vetenskap
Enheten för logopedi
30
Pausduration och bedömning av talflyt
Tobias Lövgren
Examensarbete i logopedi, 20 p
Höstterminen 2004
Handledare:
Jan van Doorn
SAMMANFATTNING
I litteraturen ges en antydan till att pausduration bör ha betydelse för bedömning av talet som
icke-flytande i kontrast till flytande. Det har däremot ej gått att finna några resultat när det
gäller hur pausdurationer påverkar bedömningen. Det finns dock tröskelvärden föreslagna för
intervallduration (200 ms) när det gäller upplevda pauser. I den aktuella studien undersöks
möjligheten att finna ett tröskelvärde för när man börjar bedöma talet som ickeflytande.
Två olika talmaterial prövades för manipulation. Naturligt flytande tal från nyhetsuppläsare
användes för att simulera fyra nivåer av talflyt, genom att stegvis förlänga vissa intervall.
Trettiotvå personer fick avgöra om de tyckte att talet var flytande eller ickeflytande efter att
ha lyssnat på fyra exempel med olika intervalldurationer.
Det fanns en signifikant ökning av andelen ickeflytbedömningar mellan yttranden vars
intervall hade förlängts till 500% av ordinarie duration. Mellan intervall förlängda till 250%
av ordinarie duration och intervall förlängda 1000% fanns också en signifikant skillnad i
bedömning.
Trots begränsat material och antal lyssnare, bedöms resultatet kunna bekräfta tidigare
påståenden om att pausduration bör inverka vid bedömningen av talflyt. Den auditiva gränsen
för pauser verkar också relevant här, då värdet 200 ms fanns i omfånget för de yttranden där
den första signifikanta skillnaden i bedömning skedde. Inga generella slutsatser kan dock
dras.
2
ETISK PRÖVNING
Detta forskningsprojekt har genomförts i enlighet med grundläggande etiska principer
för att skydda försökspersonerna i forskningen. Forskningsplanen utformades så att
grundläggande etiska forskningsprinciper upprätthölls, särskilt att:
•
Forskningen kunde förväntas ge ett bidrag till ökad kunskap och att den baserades på
studier av relevant aktuell litteratur och kunskapsbas.
•
Forskningen utfördes och handleddes av personer med erfarenhet, kvalifikationer och
kompetens tillräcklig för studien i fråga.
•
Respekt för integritet och välmående för försökspersonerna upprätthölls.
•
Deltagandet i studien skedde på helt frivillig basis och rekryterandet av försökspersonerna
skedde på lämpligt sätt.
•
Försökspersonerna informerades om syftet med studien, att deltagandet var frivilligt och
att de utan följder kunde dra sig ur studien om de så önskade. De gav sitt medgivande
genom att lämna tillbaka svarsformuläret.
•
Forskningsdata förvarades på ett sådant sätt att anonymitet försäkrades och data var endast
tillgänglig för de forskningsansvariga.
•
Användandet av forskningsdata krävde tillåtelse från handledare och avidentifierades före
användning i forskning. Efter slutförd studie arkiverades rådata på institutionen ansvarig
för forskningen.
3
TACK
Jan van Doorn
För råd och beröm och för statistiken
Anders Asplund
För att du alltid finns till hands när det krånglar
Klasskompisarna
För att ni ville lyssna
Eva Strangert
För att du tog dig tid
Thierry Deschamps
”Ton manipulation”
Försökspersonerna
För att ni också ville lyssna
4
INNEHÅLLSFÖRTECKNING
BAKGRUND
Definitioner
Talflyt
Ickeflyt
Pauser
Pausduration i bedömningar av talflyt
Exempel på flytande och ickeflytande tal
Naturligt tal
Simulerat ickeflyt
Syfte
1
Frågeställningar
3
METOD
Utprovning av talmaterialet
Spontantal med naturligt ickeflyt
Analys av talmaterialet
Utprovning av manipulationen
Värdering av manipulationen
Uppläst tal
Inspelning av talmaterialet
Utprovning av manipulationen
Värdering av manipulationen
Förberedelse av material för pilotstudie
Pilotstudie av lyssnarbedömningar
Lyssnarbedömning
Databearbetning
4
4
4
4
4
5
5
5
6
7
7
8
9
9
1
1
1
1
2
2
2
3
RESULTAT
Bedömning av talflyt
Beskrivning av de fyra betingelserna
Bedömning av yttrandena
Bedömning av talarna
10
10
10
10
12
DISKUSSION
Metod
Resultat
Slutsatser
13
13
13
15
REFERENSER
16
Bilaga 1. Svarsformulär.
Bilaga 2. Instruktion.
Bilaga 3. Design.
Bilaga 4-7. Intervallet ATT GRUPPERNA vid F0%, F250%, F500% respektive F1000%.
5
BAKGRUND
Inom logopedi och stamningsforskning har man länge använt beteckningarna ”flyt” och
”ickeflyt”. Beteckningarna beskrevs redan1868 av Jackson (Leahy, 1989). Vi vet att olika
personer ställer olika krav på att tala flytande. På samma sätt är vad som upplevs som flytande
tal mycket individuellt.
Definitioner
Talflyt
Flyt är svårt att definiera. Det definieras kanske bäst som frånvaro av alla mätbara kända
former av avbrott i tal (Hedge, 1978). Faktum är dock att de flesta forskare har fokuserat på
dess motsats; ickeflyt (Guitar, 1998).
Ickeflyt
Ickeflyt innebär bland annat upprepningar av ord och fraser, samt pauser och inskottsljud. En
talsekvens som innehåller hög grad av sådana bedöms ofta som ickeflytande. Det finns många
typer av ickeflyt, och de kan bl.a. delas in i typiska ickeflyt som förekommer hos
normaltalaren och atypiska (Gregory & Hill, 1984) som är att betrakta som mer tillhörande ett
stamningsbeteende. Pauser på grund av tvekan är ett exempel på normala (typiska) ickeflyt
som förekommer hos normaltalaren (Gregory, 1993). Förekomsten och placeringen av pauser
bidrar till upplevelsen av talflyt. Då en talare stannar upp ofta och/eller på ställen i satsen som
ej är syntaktiskt motiverade låter han ickeflytande (Dalton & Hardcastle, 1977).
Pauser
Ett akustisk korrelat till pauser är tysta intervall. Den auditiva gränsen för ett tyst intervall att
uppfattas som en paus bedöms vara kring 200 msec (Zellner, 1994). I undersökningar av
distributionen av pausduration har det också varit tradition att utesluta tysta intervall som är
mindre än 200- 300 msec (Kirsner, Dunn, Hird, Parkin & Clark, 2002). Det är dock viktigt att
tillägga att lyssnare kan uppleva även kortare intervall som pauser. I en uppgift att markera
pauser i ett talmaterial via avlyssning, var det kortaste intervallet 60 msec (Jönsson,
Hagström, Hoff & Thorin, 2004). Strangert (1990) rapporterade tillfällen då pauser
upplevdes trots frånvaro av tysta intervall. Detta fenomen kan dock sannolikt bero på att det
finns andra akustiska korrelat som bidrar till upplevelsen av en paus, däribland prepausal
lengthening som innebär förlängning av ord och fonem som föregår segmentet för den
bedömda pausen (Strangert, 1993).
Pausduration i bedömningar av talflyt
I en perceptuell studie fann Amir & Yairi (2002) en perceptuell tröskel för durationen på
intervall mellan upprepade stavelser och ord där lyssnarna började gå över från att bedöma
talet som stamning, till att bedöma det som normalt ickeflyt. Pausduration påstås också bidra
vid diagnosticering av flytande/ickeflytande afasi. Det är å andra sidan svårt att säga exakt hur
denna bidrar eftersom endast subjektiva kriterier används i bedömningen (Kirsner et al.,1964).
Syftet med de två exemplen ovan är att visa att pausduration kan vara relevant som faktor i
bedömning av talflyt, både utifrån akustiska och perceptuella kriterier.
1
Exempel på ickeflytande och flytande tal
Spontantalet innehåller ofta pauser på ej syntaktiskt motiverade ställen (tvekpauser). De
ickeflyt som ofta förekommer är ett resultat av problem med planeringen av talet då denna
måste ske parallellt med planeringen av det språkliga innehållet (Strangert, 1993). Det
resulterar i det karakteristiska sätt att tala som är typiskt för normaltalarens spontantal.
Vid professionell nyhetsuppläsning förefaller nyheterna presenteras i ett relativt snabbt tempo
med få och korta pauser. Här finns också avsnitt av långsamt tal som ackompanjeras av ett
avbrott eller en paus före starkt betonade ord. Kraftfull markering av betoning kombineras
med en mycket distinkt artikulation. Det finns starka skäl att förutsätta att nyhetsuppläsaren
pauserar på ett mycket medvetet och strategiskt sätt för att på ett effektivt sätt få fram sitt
budskap (Strangert, 1993).
Naturligt tal
Lyssnarbedömnigar och analys av ickeflyt är de två huvudinriktiningarna i forskningen kring
skillnader mellan normalt ickeflytande tal och stamning. Lyssnarbedömnigar blev
betydelsefulla i och med förklaringen av den diagnosogena teorin (Johnson, 1942) enligt
vilken stamning orsakas av lyssnares felaktiga bedömningar av normala ickeflytande tal.
Lyssnares bedömningar av talflyt sägs kunna variera lika mycket som talet de bedömer
(Conture, 1990). Bedömnigar av hur en talare kommunicerar påverkas också av en mängd
sociala, kulturella och experimentella faktorer. Dessa faktorer påverkar de subjektiva
bedömningarna när det gäller t.e.x talflyt hos en viss talare (Susca & Healey, 2001b). Även
professionella bedömningar kan variera mycket. Ett och samma yttrande kan bedömas som
stamning av en erfaren logoped och som normalt ickeflyt av en annan (Cordes & Ingham,
1995).
En annan viktig faktor för bedömningen är instruktionerna. Genom ändrade instruktioner kan
samma tillfälle av ickeflyt vid olika tillfällen bedömas som både normalt ickeflyt och
stamning. Leach, Wolfolk, Fucci och Gonzales (1997) rapporterade dock hög interbedömarreliabilitet när det gällde att identifiera lätt och måttlig grad av ickeflytande tal (Amir & Yairi
2001).
Simulerat ickeflyt
I samband med lyssnarbedömningar har det varit vanligt att manipulera talet hos stammande
personer för att kunna undersöka hur mängden ickeflyt, och olika egenskaper hos ickeflyt
påverkar bedömningen av talet. Simulering av ickeflyt möjliggör manipulation av variabler
som annars är omöjliga att kontrollera i naturligt tal. Vid lyssnarbedömningar har det varit en
tradition att dela in talet i flytande respektive ickeflytande, även när man inte frågat efter
stamning (Susca & Healey, 2001b). Susca & Healey (2001a) åstadkom en procentuell ökning
av andelen ickeflyt i ett talmaterial för att simulera sex olika nivåer av flyt respektive ickeflyt.
Amir & Yairi (2001) använde manipulation för att skapa fyra durationskategorier av tysta
intervall. De förlängde intervall mellan upprepade stavelser i talmaterial från stamande
personer för att finna ett tröskelvärde för intervalldurationen där ett stamningstillfälle går över
till att uppfattas som ett normalt ickeflyt. Då intervallen var längre än 70 msec skedde en
signifikant ökning av bedömningar av talet som normalt ickeflyt. Det är viktigt att förtydliga
att det ej var en kategorisk förändring det handlade om.
2
Syfte
Syftet med denna studie var att undersöka normalt ickeflyt. Jag ville använda manipulation av
pauser i normaltal för att se hur detta går att använda som metod för att simulera olika nivåer
av talflyt. Simuleringen skulle utföras genom att manipulera durationen på tysta intervall
(inpirerat av Amir & Yairi (2001) och på så vis skapa en procentuell ökning av ickeflyt
(inpirerat av Susca & Healey (2001). Motiv för studien var att det finns tidigare forskning
som tyder på att pauser bidrar till bedömningen av ickeflyt. Det finns också tidigare resultat
som rör vad som bidrar till upplevelsen av en paus. Med utgångspunkt från dessa borde det
vara möjligt att simulera pauser och på så vis simulera ickeflyt. En ökning av pausdurationen
borde också kunna ge en ökad upplevelse av ickeflytande tal.
Frågeställningar
Går det att simulera normalt ickeflytande tal av olika grad genom att öka pausdurationen?
Går det att finna ett tröskelvärde för när man börjar bedöma talet som ickeflytande när det
gäller pausduration?
3
METOD
Utprovning av talmaterialet
Två talmaterial prövades ut för manipulationen.1) Spontantal med naturliga ickeflyt.
2) Uppläst tal.
Spontantal med naturliga ickeflyt
Först prövades ett talmaterial som innehöll naturliga ickeflyt, och utnyttja befintliga pauser,
då det i annat fall kan vara svårt att få ett bra resultat vid manipulationen. En antydan till detta
ges också i stamningslitteraturen. Susca & Healey (2001b) hävdar att det är oklart hur nära
man kommer upplevelsen av ett autentiskt stamningsbeteende när man använder talmaterial
från icke stammande normaltalare när man ska simulera stamning. Detsamma borde också
gälla användningen av flytande tal utan naturliga ickeflyt vid en simulering av ickeflytande tal
(op.cit.).
De kriterier som ställdes upp för talmaterialet var att det skulle vara normaltalande personer.
Talarna skulle befinna sig i en situation då de inte var fullständigt förberedda på vad de skulle
säga, detta för att garantera förekomst av ickeflyt (jfr beskrivningen av spontantalet som ges i
bakgrunden). De skulle dessutom tala svenska utan brytning. Motiv till detta var att undvika
en inverkan på bedömningen av att lyssnarna, trots tydlig instruktion skulle bedöma språkliga
aspekter. För att ytterligare minska risken för att någon lyssnare skulle bedöma språket
bedömdes det som viktigt att i instruktionen tydligt förklara, att det inte var språket som
skulle bedömas. Hur instruktionen utfördes beskrivs i detalj under rubriken Pilotstudie av
lyssnarbedömning.
Analys av talmaterialet
Två avsnitt, totalt två timmar av TV-programmet Frågor till Riksdagen (SVT) spelade in på
VHS-kassett. Därefter genomfördes en första granskning av hela materialet. Programmet
bestod genomgående av c:a en minut långa frågor av till största delen kommunalpolitiker.
Frågorna varvades med en minuts svar av riksdagsledamöter.
För att få en uppfattning om distributionen av ickeflyt hos dessa talare och en överblick över
materialet, transkriberades samtliga ickeflyt som förekom hos svarande politiker på
videobandet. Tiden på räkneverket antecknades intill transkriptionerna för att kunna gå
tillbaka senare och titta på specifika ickeflyt. Sedan sammanställdes de i en tabell efter typ av
ickeflyt enligt Searl, Gabel och Fulks (2002).
Utprovning av manipulation
Den första frågan kring metoden blev att komma fram till vilka ickeflyt som skulle vara mest
lämpade för manipulationen. Nio tydliga tvekpauser förekom före ord med klusil initialt.
Tvekpauser var extra tydliga och lätta att identifiera före tonlösa klusiler. De bedömdes också
vara enkla att manipulera då de innehöll tysta intervall. Ett segment i talvågen som är fritt från
periodicitet bedömdes vara enkelt att förlänga då en liknande procedur använts av Amir och
Yairi (2001).
4
Två typer av manipulation prövades; dels förlängning och dels minskning av intervall. Nio
fraser som var och en innehöll en tvekpaus, spelades över från VHS-kasett och gjordes om till
ljudfiler via audio output från VHS-video till sound recorder i Audition version 1.0. Fraserna
sparades som nio separata ljudfiler. Efter genomlyssning av en fras markerades segmentet
kring klusilen. Ett parti från den centrala delen av det tysta intervallet markerades, kopierades
och sattes in i talvågen. På detta sätt kunde tystnad enkelt adderas så att intervallet fick
önskad duration. Därefter prövades den amdra typen av manipulation (minskning av
intervall). Det genomfördes genom att en önskad portion av intervallet klipptes bort.
Resultatet av detta blev två fraser; en fras med med en naturlig tvekpaus vars tysta intervall
förlängts ytterligare, och en med reducerat tyst intervall.
Värdering av manipulationen
Vid en genomlyssning av materialet tillsammans med kurskamrater bedömdes att det gick att
reducera intrycket av en tvekpaus med denna metod. Det bedömdes också som att det gick att
återskapa ett intryck av en paus/tvekpaus från ett förkortat intervall genom att addera tystnad
till talvågen. Däremot gick det inte att skapa ett intryck av ickeflytande tal, då det rörde sig
om allt för korta talexempel som bara innehöll ett enda tillfälle av ickeflyt. Dalton och
Hardcastle (1977) hävdar också enligt Guitar (1998) att frekvensen av ickeflyt inverkar på om
talet upplevs som ickeflytande. Därför valdes i stället längre yttranden på minst 15 sekunder
för att göra det möjligt att addera fler tillfällen av ickeflyt till yttrandet.
En tonlös klusil identifierades i talvågen där det ej fanns någon naturlig paus. Det tysta
intervallet som föregick klusilens explosionsfas förlängdes enligt samma procedur som
beskrivs ovan. Denna procedur upprepades på ett flertal intervall i talmaterialet med politikers
tal. Vid de flesta tillfällen uppstod ett syntetiskt ljud i tiden för det tysta intervallet. Detta
antas ha berott på att det ofta fanns bakgrundsljud i lokalen som skapade periodicitet i
talvågen när segment duplicerades. Då det dessutom inte fanns tillräckligt många talexempel
från videoinspelningen som var längre än 15 sekunder och var helt fria från andra ickeflyt än
tvekpauser kunde detta material ej användas.
Uppläst tal
Eftersom det inte gick att finna tillräckligt långa yttranden utan andra ickeflyt än pauser i
talmaterialet med politiker, valdes i stället nyhetsuppläsningar att prövas som talmaterial (se
exempel på ickeflytande och flytande tal på sid 5).
Inspelning av talmaterial
Ett 10-tal nyhetssändningar från SVT och TV4 spelades in på VHS-kasett. Materialet
granskades och endast de uppläsningar som gjordes i TV-studio då nyhetsuppläsaren visades i
bild valdes ut för vidare analys. Sexton nyhetsuppläsningar återstod efter att nyheter med
negativt/obehagligt innehåll (mord osv.) eller som innehöll andra ickeflyt än pauser sållats
bort.
5
Utprovning av manipulation
Ur materialet valdes 10 nyhetsuppläsningar ut för vidare analys. Dessa spelades över från
VHS-kassett till datorprogrammet Praat version 4.2. Praat valdes att användas då det
innehåller en effektiv funktion för att manipulera durationer.
Nyhetsuppläsningarna sparades som tio separata ljudfiler som omformaterades till ett format
för manipilation.
En mer detaljerad genomlyssning gjordes och intressanta partier eller yttranden
transkriberades. I första hand identifierades tonlösa klusiler enligt tidigare procedur. Även ett
antal andra tysta intervall som fanns i ett av yttrandena valdes dock för manipulation (se
yttrande 3 nedan).
Resultatet av urvalet blev fyra yttranden som vart och ett bestod av en talsekvens från en
nyhetsuppläsning. Talarna bestod av två kvinnor och två män.
En ortografisk transkription av talmaterialet visas nedan. Målområden för manipulationen har
markerats med fetstil, och intervallens längd har angivits inom ”/ /” i millisekunder. Värdena
inom ”/ /” visar intervallens längd hos var och en av de fyra variationer som senare skapades
av respektive yttrande (den första siffran efter ”/” är värdet för intervallet i ej manipulerat
yttrande). Hur variationerna skapades beskrivs under Förberedelse för pilotstudie.
Yttrande 1
En upptäckt vid Karolinska Institutet kan få stor betydelse för patienter med /27, 65, 121,
247/typ-två-diabetes. Ett forskarlag har /51, 120, 197, 349/ kartlagt den insulinproducerande
betacellen och har upp /110, 132, 164, 330/ täckt hur insulinproduktionen /31, 67, 98, 184/
kan regleras genom att man tar bort en del av cellen.
Yttrande 2
Och först ska vi berätta att den kraftigaste jordbävningen på fem år nu på morgonen skakade
stora delar av Taiwan. Jordbävningen mätte sju komma noll /53, 105, 184, 340/ på
richterskalan vilket är förhållandevis /41, 93, 180, 339/ kraftigt, men epicentrum låg under
havet, elva mil öster om Taiwans öst /53, 114, 237, 450/ kust.
Yttrande 3 ( Innehöll naturliga ickeflyt).
Den svenska säkerhetspolisen ägnar allt mer resurser åt att spana på grupper av islamistiska
extremister som man hävdar finns /102, 237, 479, 975/ i Sverige. Säpo tror att /48, 112, 241,
444/ grupperna vistas i Sverige för att planera / 46, 82, 174, 254/ nya terrordåd och för att
rekrytera nya /40, 119, 253, 505/ terrorister bland unga svenska muslimer.
Yttrande 4
Brittiska forskare har utvecklat en metod för att förvara vaccin så att det inte behöver vara
/73, 226, 416, 139/ kallt. Det här kan leda /73, 287, 559, 169/ till att hanteringen av vaccin
blir billigare och att fler barn i u-länderna /44, 133, 251, 82/ kan vaccineras.
6
I de flesta fall har occlusioner i tonlösa klusier förlängts. Undantag från detta finns i yttrande
3 där intervallen finns/i, att/grupperna och planera/nya skilde sig från de övriga genom att
det efterföljdes av vokal, nasal respektive tonande klusil. Intervallen planera/nya, samt
nya/terrorister bedömdes som naturliga ickeflyt (tvekpauser). Dessa intervall togs med som
en jämförelse då de gav bra resultat vid manipulationen.
Yttrande 3 valdes således att användas som jämförelse vid tolkningen av resultatet.
I yttrande 4 valdes intervallen vara / kallt, leda /till, u-länderna / kan.
Intervallen förlängdes procentuellt för att få en mer naturlig fördelning mellan pausdurationerna i yttrandena jämfört med om samtliga intervall hade förlängts till en viss absolut
duration. Ursprungliga durationer i de utvalda intervallen ökades med 1000% (med andra ord
förlängdes tio gånger). De ursprungliga intervallen i de fyra yttrandena var i genomsnitt 59
ms långa (range 27-110 ms). Manipulationen resulterade i att dessa intervall i genomsnitt blev
437 msec (range 184-975 ms). Yttrande 1 innehöll fyra ickeflyt 37 ord, yttrande 2 innehöll
3/42, yttrande 3: 4/43, yttrande 4: 3/36.
Värdering av manipulationen
De manipulerade yttrandena lyssnades av tillsammans med kurskamrater för att bedöma
talflyt. En preliminär bedömning av naturligheten utfördes också. Talet kunde bedömas som
ickeflytande. Då intervallen gick att förlänga utan att någon periodicitet uppstod i talvågen,
kunde manipulationen sägas vara av god kvalitet.
Förberedelse av material för pilotstudie
Två ytterligare nivåer av talflyt skapades genom att upprepa proceduren som beskrivits ovan,
men nu med två andra relativa durationer. Genom att välja relative duration 5.0 respektive
20.0 uppstod ytterligare åtta yttranden. Fyra yttranden med 500% ökning av ordinarie
intervall, och fyra yttranden med en ökning på 2000%. Resultatet blev totalt 16 yttranden;
fyra originalinspelningar under fyra olika betingelser som namngavs med avseende på
procentuell förlängning av ordinarie intervall: FO% (ej manipulerad), F500% F1000% och
F2000%.
Filerna gjordes om till ljudfiler (wav-filer ). Därefter mättes samtliga nya intervall. Ett
extremvärde som uppkom minskades med 66% (då intervallet var tre gånger så långt som de
övriga) för att undvika att detta ensamt skulle påverka bedömningen av yttrandet i allt för hög
grad. Ett ytterligare motiv till det var att just detta extremvärde förekom inom ett ord.
(Yttrande 1: upptäckt). Det andra exemplet på paus inom ord förminskades på samma sätt.
Detta resulterade i en minskning av durationen med 66% i dessa två intervall.
De 16 färdigbearbetade ljudfilerna ordnades enligt Latin Squares Design så att 16 lyssnare
kunde lyssna på fyra yttranden, ett från varje talare och ett från varje betingelse. Resultatet
blev en CD-skiva med 64 ljudspår grupperade så att de fyra första spåren på skivan
motsvarade det material som lyssnare 1 skulle höra. Följande fyra spår skulle bedömas av
lyssnare 2 och så vidare. Varje variation av varje yttrande skulle således komma att bedömas
av fyra lyssnare vid ett tillfälle vardera.
7
Ytterligare två yttranden valdes ut från talmaterialet för att användas som övningsexempel.
Det ena yttrandet förekom i originalutförande. Det andra yttrandet manipulerades enligt
metoden för F2000% . Dessa två filer lades som två spår på en separat CD-skiva med det ej
manipulerade exemplet först.
Pilotstudie av lyssnarbedömningar
En pilotstudie av lyssnarbedömning av talflyt utfördes med 16 otränade lyssnare.
Försökspersonerna bestod av kvinnor och män mellan 18 och 54 år. Urvalet av
försökspersoner utgick endast från praktiska skäl, nämligen att personerna var tillgängliga vid
tillfället. Inga övriga kriterier användes för urvalet förutom att de ej skulle ha erfarenhet av
bedömningar av tal eller erfarenhet/kunskap av stamning.
Hörlurar av typ AKG K 130 användes. Avlyssningen gjordes via stereoanläggning i ett tyst
rum med endast försöksledaren och bedömaren närvarande i rummet.
Ett svarsformulär användes som fylldes i av försöksledaren. Försöksledaren satt mitt emot
bedömaren vid avlyssningen. Avlyssningen förbereddes genom att anteckna lyssnarnummer
och nummer för de ljudspår som skulle avlyssnas av den aktuella lyssnaren på svarsformuläret intill svarskolumnerna (bilaga 1). Lyssnarna gavs en kort muntlig instruktion
(bilaga 2).
Efter att ha lyssnat på ett yttrande ombads bedömaren svara antingen ”talet flyter” eller
”talet flyter inte”. Svaren markerades av försöksledaren med ett kryss i svarsformuläret. När
avlyssningen var färdig fylldes uppgifter om bedömaren i på formuläret angående ålder,
utbildningsnivå och kön för att eventuellt undersöka olikheter i bedömning. Inga jämförelser
gjordes dock avseende detta.
En preliminär sammanräkning av resultatet visade att ett fel hade skett då ljudspåren lades på
CD:n. Fördelningen mellan antalet presentationer var därför inte helt jämn mellan de 16
yttrandena. Svaren räknades ändå samman för att få en preliminär uppfattning om hur
betingelserna påverkat bedömningen. En trend man kunde se var en kraftig ökning av
bedömda ickeflyt redan vid F500% jämfört med FO%. Vid FO% bedömdes endast ett av 16
yttranden som ickeflytande och vid F500% bedömdes hela 12 av 16 yttranden som ickeflytande.
För att få en mindre abrupt förändring i bedömningen togs F2000% bort och ett nytt
förhållande skapades med samma procedur som tidigare men som var 250%. Det nya F250%
blev nu det näst kortaste förhållandet, och bytte då plats i ordningen med F500%. Att ta bort
förhållandet 2000% bedömdes ej vara något problem då antalet bedömda ickeflyt inte ökade
mellan F1000 % och F2000 %. En ny CD skapades enligt tidigare procedur. Designen visas i
bilaga (bilaga 3). De fyra betingelserna för intervallet att/grupperna visas akustiskt i bilaga
4).
Inga naturliga pauser fanns på de utvalda ställena i det ej manipulerade förhållandet
(undantaget yttrande 3). Därför kan vi inte betrakta det första manipulerade förhållandet
(F250%) som en förlängd pausduration. Det är snarare det första förhållandet som har pauser
överhuvudtaget på de aktuella ställena. Det som har skett i F250% är således att pauser
eventuellt har uppstått där det ej tidigare fanns några pauser.
8
Lyssnarbedömning
En ny lyssnarbedömning gjordes med 32 lyssnare; 14 män och 18 kvinnor i åldrarna 20 till 32
år som gick på vård/hälsovetenskapligt program (sjuksköterske-, läkar-, arbetsterapeut,
tandhygienist samt biomedicinprogrammet) på Umeå universitet. De valdes av praktiska skäl
då de vid tillfället fanns tillgängliga på universitetets medicinska bibliotek. Försökspersonerna
hade ingen erfarenhet av bedömning av tal, och hade inte läst fonetik. De hade ingen
erfarenhet av stamning, med undantag av en person som ändå valdes att tas med i studien då
han ej genomgått stamningsterapi. Bedömningen utfördes exakt som beskrivits tidigare, med
två undantag. Det första var att CD:n användes i två omgångar då lyssnarantalet var dubbelt
så stort (lyssnare nr 17 presenterades spår 1, 18 spår 2, osv.). Det andra var att en bärbar CDspelare användes. Volymen ställdes in vid det första övningsexemplet med Lyssnare nummer
1. Därefter justerades aldrig volymen.
Databearbetning
De yttranden som bedömdes som ickeflytande noterades på ett excel kalkylblad för var och en
av de fyra talarna. Resultatet analyserades statistiskt med ett Kruskall–Wallis test i
kombination med ett post hoc Mann-Whitney U test (skillnaderna mellan antalet ickeflytbedömningar värderades separat för varje förhållande via Kruskall-Wallis test). Data för vart
och ett av de 16 yttrandena undersöktes sedan grafiskt för att se om det gick att finna någon
form av tröskelvärde för pausdurationen.
9
RESULTAT
Bedömning av talflyt
Den procentuella fördelningen av ickeflyt-bedömningar för respektive förhållande visas i
Tabell 1 samt Figur 1.
Tabell 1. Andel yttranden bedömda som ickeflytande vid de fyra betingelserna för intervallen.
Betingelse för intervall
% av yttrandena bedömda ickeflytande
( n = 32 för varje betingelse )
Intervall ökade 0% (ej manipulerade)
12,5%
Intervall ökade 250% *
34,4%
Intervall ökade 500% *
71,9%
Intervall ökade 1000%*
93,8%
* Den procentuella ökningen gäller ej samtliga intervall. Två extremvärden hade modifierats. Det procentuella
värdet 250%, 500% och 1000% ska därför betraktas endast som en generell beskrivning av de fyra betingelserna.
Ett Kruskal–Wallis test visade att graden av förlängning hade en signifikant effekt H(3) =
12,23 p< ,01 på bedömningen. Vidare visade ett post hoc Mann–Whitney U test att det
förelåg en signifikant skillnad mellan yttranden med ordinarie intervall och de yttranden vars
intervall hade ökats med 500% och 1000 %, samt mellan betingelserna F250% och F1000%.
Dock fanns ingen signifikant förändring i bedömningen mellan betingelserna F0% och
F250%.
Beskrivning av de fyra betingelserna
Då frågeställningen gällde ett absolut tröskelvärde, och inte relativ förändring av intervallet,
är det intressant att också redovisa hur durationerna påverkade bedömningen.
I tabell 2 beskrivs de fyra förhållandena med avseende på dess intervalldurationer.
Tabell 2. Längsta intervall, omfång och medelvärde på intervall angivet i millisekunder (ms) hos respektive
betingelse.
Betingelse för intervall
0% (ej manipulerade)
250%
500%
1000%
Längsta intervall
(ms)
110
237
479
975
Omfång (range)
(ms)
27- 110
65 – 237
98 – 479
184 - 975
Medelvärde
(ms)
59
123
229
437
intervall
Bedömning av yttrandena
För att visa specifikt hur olika durationer påverkade bedömningen, redovisas nedan hur de 16
yttrandena bedömdes var för sig. I figur 2 visas hur yttrandena bedömdes beroende på dess
genomsnittliga intervallduration (n=8 för varje yttrande).
10
Andel yttranden
bedömda ickeflytande
Bedömning beroende av genomsnittlig
intervallduration
10
8
6
4
2
0
49 55 63 66 96 104 130 145 153 200 215 277 321 376 408 618
Genomsnitt intervallduration (msec)
Figur 2. Bedömning beroende av genomsnittlig intervallduration (n=8). De 16 yttrandena har rangordnats
längs kategoriaxeln efter genomsnittlig intervallduration.
Som en jämförelse redovisas även bedömningen med avseende på yttrandets längsta intervall.
I figur 3 visas hur de 16 yttrandena bedömdes med avseende på längsta intervall (n=8 för
varje yttrande).
Bedömning beroende av längsta intervallduration
9
Andel yttranden bedömda
ickeflytande
8
7
6
5
4
3
2
1
0
53 73 102 110 114 132 169 197 237 237 287 349 450 479 559 975
Längsta intervallduration ( msec)
Figur 3. Bedömning av yttrandets längsta intervall. De 16 yttrandena har rangordnats längs kategoriaxeln efter
längsta intervall.
11
Bedömning av talarna
Vart och ett av yttrandena (yttrande 1 till och med 4) härrör från var och en av fyra talare. För
att bekräfta att resultatet ej primärt var en effekt av talarna sammanställdes andelen ickeflytbedömningar specifikt för de fyra talarna. Detta utfördes först för originalinspelningarna
(F0%), och sedan sammantaget för alla de 16 yttrandena. I figur 4 respektive 5 visas hur
talarna bedömdes i F0% respektive hur de bedömdes totalt.
Bedömning av talarna i original
andel bedömda
ickeflytande
30%
25%
20%
15%
Serie1
10%
5%
0%
1
2
3
4
talare
Figur 4. Bedömning av talare 1, 2, 3 och 4 i F0% (ej manipulerad). Andel av yttrandena som bedömdes
ickeflytande.
Antalet ickeflyt-bedömningar som totalt tilldelades talarna visas i figur 5 (n=32).
Hur talarna bedömdes totalt
Totalt antal yttrandenl bedömda som
ickeflytande
25
20
15
Serie1
10
5
0
1
2
3
4
talare
Figur 5. Bedömning av talare 1, 2, 3 och 4. Totalt antal ickeflyt-bedömningar som tilldelades talarna (n=32).
12
DISKUSSION
Metod
Att tvinga lyssnarna att bedöma talet kategoriskt som antingen flyt eller ickeflyt var viktig för
att svara på frågeställningen (går det att finna ett tröskelvärde för när man börjar bedöma talet
som normalt ickeflytande när det gäller pausduration). Detta eftersom det tidigare har visats
att lyssnare ej gör en kategorisk bedömning av talflyt. Talflyt bedöms snarare utmed ett
kontinuum från helt flytande till i hög grad ickeflytande (Femrell & Holmqvist, 2000). Då
lyssnarbedömningar varierar mycket mellan individuella lyssnare, var det av stor betydelse att
använda sig av en grupp lyssnare.
Resultatet av manipulationen kan ej bedömas som naturligt tal då det innehåller enbart en typ
av ickeflyt. Dessutom innebar det en nästan konsekvent pausering före tonlösa klusiler (av
totalt 13 pauser var, 11 före tonande klusiler). Detta skiljer det manipulerade talet från
naturligt tal, som i stället innehåller en variation av olika typer av ickeflyt. En brist i
manipulationen var att ingen smoothing-procedur1 utfördes. Detta gav i ett fåtal fall ett knappt
hörbart bi-ljud i transitionerna.
Det kan vara så att nyhetsuppläsares tal är extra känsliga för den här typen av manipulation,
och lyssnaren ställer extra höga krav på professionella uppläsare. Dessutom var antagligen de
flesta av talarna/rösterna kända av lyssnarna. Ett möjligt scenario är också att någon lyssnare
kan ha hört något av det individuella yttrandet vid tidigare tillfälle, och minns hur det lät i
original. Detta bör dock ej förekomma vid mer än något enstaka fall, och borde därför inte
nämnvärt påverka bedömningen. Att lyssnarna däremot ställer högre krav på professionella
talare är dock troligt.
Resultat
Resultatet tolkas som en effekt av förlängning av vissa intervall. Resultatet visar således att ju
större förlängningen av vissa intervaller var, desto fler yttranden bedömdes som ickeflytande.
En successiv ökning av andelen ickeflyt-bedömningar kan faktiskt observeras från och med
det kortaste, till och med det längsta förhållandet (tabell 1, figur 1). En signifikant ökning av
ickeflyt-bedömningar förelåg mellan yttranden med ej manipulerade intervall och yttranden
med vissa intervall förlängda till 500% av ordinarie duration. En signifikant ökning av
andelen yttranden bedömda som ickeflytande förelåg också mellan yttranden med intervall
förlängda till 250% och de vars intervall förlängts till 1000% av sin ordinarie duration (tabell
2).
Det är viktigt att poängtera att de procentuella värdena 250%, 500% och 1000% ska betraktas
endast som en generell beskrivning av betingelserna då vissa intervall modifierades efter den
procentuella förlängningen. Medelvärden på intervall är ej aktuella att diskutera här då
omfånget (range) var alltför stort. En stegvis ökning av durationen på intervallen förelåg dock
mellan de fyra betingelserna, även om vi räknar med de två modifierade intervallen.
_______________________
1
Gradvis minskning av amplituden i transitionerna mellan sammanfogade segment.
13
Det var alltså nödvändigt att förlänga intervallen till mer än 250% för att få en signifikant
ökning av ickeflyt-bedömningar. Mellan betingelsen F0% och F250% fanns ju ingen
signifikant skillnad i bedömningen. När intervallen däremot förlängts till 500% ökade
andelen ickeflyt-bedömningar däremot signifikant (med hela 60%; 12,5%-71,9%).
Som svar på frågeställningen (Går det att finna ett tröskelvärde för när man börjar bedöma
talet som normalt ickeflytande när det gäller pausduration?) kan man säga att det var
nödvändigt att öka intervallen till mer än 250% av ordinarie duration för att talet skulle
bedömas som ickeflytande i fler fall än flytande. Det förefaller också som att vid en viss grad
av förlängning (F500%) började talet i betydligt större utsträckning bedömas som
ickeflytande än som flytande (i 71,9% av fallen).
En av orsakerna till förändringen i bedömningen kan vara att det vid en viss intervallduration
sker en ökad upplevelse av pauser och av pausering. Det är också värt att notera att värdet 200
msec fanns inom omfånget för intervallen hos den betingelse som gav den första signifikanta
skillnaden i bedömning. Detta värde har angivits som auditiv gräns för pauser (Zellner,
1994). Även efter detta värde fortsatte i och för sig ickeflytbedömningarna att öka men inte i
samma grad.
Det är viktigt att nämna här att ickeflyt kan ha upplevts redan i ej manipulerat förhållande
trots att inga intervall fanns som borde motsvara tvekpauser. Detta nämner jag utifrån att
12,5% av bedömda yttranden i F0% bedömdes som ickeflytande. Här får vi användning av
talare 3 som jämförelse för att titta på hur naturliga pauser i F0% påverkade bedömningen.
Med tanke på förekomst av naturliga pauser borde talare 3 få fler ickeflyt-bedömningar än de
övriga talarna i ej manipulerat förhållande. Så ser det dock inte ut om vi tittar på figur 1. Vi
kan här se att talare 1 tilldelades lika många ickeflytbedömningar som talare 3 i
originalutförande. Två av talarna fick däremot inga ickeflyt-bedömningar i originalutförandet.
När det gällde totalt antal ickeflytbedömningar hos respektive talare finns inte heller någon
utmärkande skillnad hos talare 3.
Här blir det också aktuellt att diskutera placeringen och mängden av pauser. Eftersom dessa
variabler var konstanta från och med F250% kan de ej ensamma ha stått för resultatet. I
sådant fall skulle en skillnad endast ha funnits vid en viss duration där man börjat uppfatta
pauser. Därefter borde ingen ökning av antal ickeflytbedömningar ha skett.
En tolkning av vad som skett här är att när pauser började uppfattas på vissa ställen (F250%)
ökade antalet ickeflyt-bedömningar. Placeringen av pauserna (de flesta på ej syntaktiskt
motiverat ställe) bör ha varit en bidragande faktor men kan inte ensamt stå för resultatet. I
sådant fall skulle ingen fortsatt ökning i bedömning ha skett efter det första manipulerade
förhållandet (F250%). Detsamma gäller antalet pauser som ju också hölls konstant i
respektive yttrande från och med F250%. Om vi antar att pauser börjar upplevas vid en viss
duration, och att man därefter ej tar hänsyn till pausernas längd, borde bedömningen ej öka
successivt med ökad pausduration. Den borde i så fall stabiliseras efter ett visst värde. Det
enda som skett efter att pauser eventuellt har börjat uppfattas är ju en successiv förlängning av
dessa pauser.
14
Det är här mycket viktigt att betona skillnaden mellan ett ökat antal ickeflyt-bedömningar och
ökad grad av ickeflyt i ett yttrande. Den aktuella studien visar endast skillnader i andelen
yttranden kategoriserade som ickeflytande efter en uppmaning att försöka kategorisera dem
så. Den aktuella studien bör ändå kunna användas för att bekräfta tidigare påståenden av
Kirshner et al (2002) och Amir & Yairi (2001) om att intervallduration/pausduration är
relevant att ta hänsyn till i fråga om talflyt, åtminstone som en bidragande faktor.
Slutsatser
Trots att talet här var syntetiskt manipulerat förefaller en ökning av pausdurationer kunna
användas för att simulera normalt ickeflytande tal. En successivt ökad grad av ickeflytande tal
förefaller också gå att simulera genom en stegvis ökning av pausdurationer.
Vad gäller ett tröskelvärde för pausdurationen där man börjar bedöma talet som ickeflytande
förefaller det som att talet börjar bedömas som ickeflytande i fler fall än som flytande vid en
viss betingelse för pausdurationen. På grund av ett begränsat talmaterial och få
försökspersoner bör man dock inte dra några allmängiltiga slutsatser om på vilket sätt, eller i
vilken omfattning, intervalldurationen påverkar upplevelsen av talflytet.
15
REFERENSER
Amir, O. & Yairi, E. (2002). The effect of temporal manipulation on the perception of
disfluencies as normal or stuttering. Journal of Communication Disorders 35, 63-82.
Bloodstein, O. (1995). A Handbook on stuttering. 5th edition. San Diego: Singular Publishing
Group, Inc.
Conture, E. (1990) Stuttering 2nd edition. Englewood Cliffs, N.J.: Prentice-Hall.
Cordes, A. & Ingham. R. (1995) Judgements of stuttered and nonstuttered intervals by
recognized authorities in stuttering research. Journal of Speech and Hearing Research 38: 3341.
Dalton, P. & Hardcastle, W.J. (1977) Disorders of fluency. New York: Elsevier.
Femrell, L. & Holmqvist, M. (2000). Stammande och normaltalande personers bedömning av
talflyt och stamning. Umeå universitet. Mastersuppsats.
Gregory, H. (1993) A clinician’s perspective: Comments on identification of stuttering,
prevention and early intervention. Journal of Fluency Disorders 18: 389-402.
Gregory, H. & Hill. D. (1984) Stuttering therapy for children. Perkins W. (ed.) In Stuttering
disorders. N.Y.: Thieme-Stratton
Guitar, B. (1998). Stuttering: An Integrated Approach to Its Nature and Treatment. 2nd
edition. Baltimore: Williams & Wilkins.
Hedge, M.-N. (1978) Fluency and fluency disorders: Their definition, measurement, and
modification. Journal of Fluency Disorders 3: 51-71.
Johnson, W. (1942) A study of the onset and development of stuttering. Journal of Speech
Development 7: 251-257.
Jönsson, D., Hagström, P., Hoff, S., & Thorin, D. (ej utgiven rapport i fonetik). Hur låter
tystnaden? Korrelation mellan fysiskt existerande pauser och uppfattade pauser i spontant tal.
Umeå universitet: Institutionen för fonetik.
Kirsner, K., Dunn, J., Hird, K., Parkin, T & Clark, C. (2002). Time for a pause. Proceedings
of the 9th Australian International Conference on Speech Science & Technology. Melbourne,
December 2-5 2002: Australian Speech Science & Technology Association Inc.
Leach, E.A., Wolfolk, W.B., Fucci, D. & Gonzales, M.D. (1997) An investigation of
simulated stuttering by normal speakers. Paper presented at the American Speech-Languagehearing Association Convention, Boston.
Leahy, M. (1989) Fluency and Fluency Development. University of Dublin: School of
Clinical Speech and Language studies. Föreläsning vid Third European Postgraduate Course
in Language Pathology. Brussels, September 12-23.
16
Lundberg, A. (1999). Stamning: Grundbok för behandlare. Göteborg: Anders Lundberg och
Lianen Konsult.
Searl, J.P., Gabel, R. M. & Fulks, J.S. (2002). Speech disfluency in centenarians. Journal of
Fluency Disorders 35, 383-392.
Strangert, E. (1990). Perceived pauses, silent intervals, and syntactic boudaries. PHONUM 1,
35-38. University of Umeå: Department of phonetics.
Strangert, E. (1993). Speaking style and pausing. PHONUM 2, 121-137. University of Umeå:
Department of phonetics.
Susca, M. & Healey, E. C. (2001a). Listeners perceptions along a fluency-disfluency
continuum: a phenomenological analysis. Journal of Fluency Disorders 27, 135-161.
Susca, M. & Healey, E. C. (2001b). Perceptions of simulated stuttering and fluency. Journal
of Speech, Language and hearing Research 44, 61-72.
Zellner, B. (1994). Pauses and the temporal structure of speech; E. Keller (Ed.) Fundamentals
of speech synthesis and speech recognition, 41-62.
17
Bilaga 1
Svarsformulär
Lyssnare nr
_____
Ålder
_____
Kön (M / K) ______
Eftergymnasial utbildning
Antal år
______
Gymnasial utbildning
Antal år
______
Talet flyter
Talet flyter inte
1
2
3
4
5
6
18
Bilaga 2
Instruktion
Du ska bedöma talflyt. När man pratar kan talet flyta mer eller mindre, och det handlar inte
om i fall man kan tala til exempel flytande svenska, det vill säga kan språket flytande.
Förstår du ? Du ska nu få lyssna på 4 talare som var och en pratar i ungefär 15 sekunder.
Din uppgift är att svara om du upplever att talet flyter eller om du tycker att det inte flyter.Det
lite besvärliga är att du måste bestämma dig för ett av alternativen. Du väljer det du tycker
stämmer bäst som svar. Vi vet att olika personer bedömer detta mycket olik och därför vill jag
ha just din bedömning. Det är viktigt att du förstår att det inte är ett kunskapstest och det
finns inga rätt eller fel svar. Det är just din upplevelse jag är intresserad av.
Vi börjar med 2 övningsexempel.
19
Bilaga 3
Design
L1
L2
L3
L4
3a
3b
3c
3d
4b
4c
4d
4a
2d
2a
2b
2c
1c
1d
1a
1b
L5
L6
L7
L8
1c
1d
1a
1b
4a
4b
4d
4c
2d
2c
2b
2a
3b
3a
3c
3d
L9
L10
L11
L12
2d
2b
2c
2a
3a
3c
3d
3b
4b
4d
4a
4c
1c
1a
1b
1d
L13
L14
L15
L16
2b
2c
2d
2a
1a
1d
1c
1b
3c
3a
3b
3d
4d
4b
4a
4c
L17
L18
L19
L20
3a
3b
3c
3d
4b
4c
4d
4a
2d
2a
2b
2c
1c
1d
1a
1b
L21
L22
L23
L24
1c
1d
1a
1b
4a
4b
4d
4c
2d
2c
2b
2a
3b
3a
3c
3d
L25
L26
L27
L28
2d
2b
2c
2a
3a
3c
3d
3b
4b
4d
4a
4c
1c
1a
1b
1d
L29
L30
L31
L32
2b
2c
2d
2a
1a
1d
1c
1b
3c
3a
3b
3d
4d
4b
4a
4c
L=Lyssnare( kolumn 1)
Yttrande; nummer och förhållande ses i kolumn 2-5 (a=F0%, b=F500%, c=F1000%,
d=250%).
20
21
22
23
24