UMEÅ UNIVERSITET Institutionen för klinisk vetenskap Enheten för logopedi 30 Pausduration och bedömning av talflyt Tobias Lövgren Examensarbete i logopedi, 20 p Höstterminen 2004 Handledare: Jan van Doorn SAMMANFATTNING I litteraturen ges en antydan till att pausduration bör ha betydelse för bedömning av talet som icke-flytande i kontrast till flytande. Det har däremot ej gått att finna några resultat när det gäller hur pausdurationer påverkar bedömningen. Det finns dock tröskelvärden föreslagna för intervallduration (200 ms) när det gäller upplevda pauser. I den aktuella studien undersöks möjligheten att finna ett tröskelvärde för när man börjar bedöma talet som ickeflytande. Två olika talmaterial prövades för manipulation. Naturligt flytande tal från nyhetsuppläsare användes för att simulera fyra nivåer av talflyt, genom att stegvis förlänga vissa intervall. Trettiotvå personer fick avgöra om de tyckte att talet var flytande eller ickeflytande efter att ha lyssnat på fyra exempel med olika intervalldurationer. Det fanns en signifikant ökning av andelen ickeflytbedömningar mellan yttranden vars intervall hade förlängts till 500% av ordinarie duration. Mellan intervall förlängda till 250% av ordinarie duration och intervall förlängda 1000% fanns också en signifikant skillnad i bedömning. Trots begränsat material och antal lyssnare, bedöms resultatet kunna bekräfta tidigare påståenden om att pausduration bör inverka vid bedömningen av talflyt. Den auditiva gränsen för pauser verkar också relevant här, då värdet 200 ms fanns i omfånget för de yttranden där den första signifikanta skillnaden i bedömning skedde. Inga generella slutsatser kan dock dras. 2 ETISK PRÖVNING Detta forskningsprojekt har genomförts i enlighet med grundläggande etiska principer för att skydda försökspersonerna i forskningen. Forskningsplanen utformades så att grundläggande etiska forskningsprinciper upprätthölls, särskilt att: • Forskningen kunde förväntas ge ett bidrag till ökad kunskap och att den baserades på studier av relevant aktuell litteratur och kunskapsbas. • Forskningen utfördes och handleddes av personer med erfarenhet, kvalifikationer och kompetens tillräcklig för studien i fråga. • Respekt för integritet och välmående för försökspersonerna upprätthölls. • Deltagandet i studien skedde på helt frivillig basis och rekryterandet av försökspersonerna skedde på lämpligt sätt. • Försökspersonerna informerades om syftet med studien, att deltagandet var frivilligt och att de utan följder kunde dra sig ur studien om de så önskade. De gav sitt medgivande genom att lämna tillbaka svarsformuläret. • Forskningsdata förvarades på ett sådant sätt att anonymitet försäkrades och data var endast tillgänglig för de forskningsansvariga. • Användandet av forskningsdata krävde tillåtelse från handledare och avidentifierades före användning i forskning. Efter slutförd studie arkiverades rådata på institutionen ansvarig för forskningen. 3 TACK Jan van Doorn För råd och beröm och för statistiken Anders Asplund För att du alltid finns till hands när det krånglar Klasskompisarna För att ni ville lyssna Eva Strangert För att du tog dig tid Thierry Deschamps ”Ton manipulation” Försökspersonerna För att ni också ville lyssna 4 INNEHÅLLSFÖRTECKNING BAKGRUND Definitioner Talflyt Ickeflyt Pauser Pausduration i bedömningar av talflyt Exempel på flytande och ickeflytande tal Naturligt tal Simulerat ickeflyt Syfte 1 Frågeställningar 3 METOD Utprovning av talmaterialet Spontantal med naturligt ickeflyt Analys av talmaterialet Utprovning av manipulationen Värdering av manipulationen Uppläst tal Inspelning av talmaterialet Utprovning av manipulationen Värdering av manipulationen Förberedelse av material för pilotstudie Pilotstudie av lyssnarbedömningar Lyssnarbedömning Databearbetning 4 4 4 4 4 5 5 5 6 7 7 8 9 9 1 1 1 1 2 2 2 3 RESULTAT Bedömning av talflyt Beskrivning av de fyra betingelserna Bedömning av yttrandena Bedömning av talarna 10 10 10 10 12 DISKUSSION Metod Resultat Slutsatser 13 13 13 15 REFERENSER 16 Bilaga 1. Svarsformulär. Bilaga 2. Instruktion. Bilaga 3. Design. Bilaga 4-7. Intervallet ATT GRUPPERNA vid F0%, F250%, F500% respektive F1000%. 5 BAKGRUND Inom logopedi och stamningsforskning har man länge använt beteckningarna ”flyt” och ”ickeflyt”. Beteckningarna beskrevs redan1868 av Jackson (Leahy, 1989). Vi vet att olika personer ställer olika krav på att tala flytande. På samma sätt är vad som upplevs som flytande tal mycket individuellt. Definitioner Talflyt Flyt är svårt att definiera. Det definieras kanske bäst som frånvaro av alla mätbara kända former av avbrott i tal (Hedge, 1978). Faktum är dock att de flesta forskare har fokuserat på dess motsats; ickeflyt (Guitar, 1998). Ickeflyt Ickeflyt innebär bland annat upprepningar av ord och fraser, samt pauser och inskottsljud. En talsekvens som innehåller hög grad av sådana bedöms ofta som ickeflytande. Det finns många typer av ickeflyt, och de kan bl.a. delas in i typiska ickeflyt som förekommer hos normaltalaren och atypiska (Gregory & Hill, 1984) som är att betrakta som mer tillhörande ett stamningsbeteende. Pauser på grund av tvekan är ett exempel på normala (typiska) ickeflyt som förekommer hos normaltalaren (Gregory, 1993). Förekomsten och placeringen av pauser bidrar till upplevelsen av talflyt. Då en talare stannar upp ofta och/eller på ställen i satsen som ej är syntaktiskt motiverade låter han ickeflytande (Dalton & Hardcastle, 1977). Pauser Ett akustisk korrelat till pauser är tysta intervall. Den auditiva gränsen för ett tyst intervall att uppfattas som en paus bedöms vara kring 200 msec (Zellner, 1994). I undersökningar av distributionen av pausduration har det också varit tradition att utesluta tysta intervall som är mindre än 200- 300 msec (Kirsner, Dunn, Hird, Parkin & Clark, 2002). Det är dock viktigt att tillägga att lyssnare kan uppleva även kortare intervall som pauser. I en uppgift att markera pauser i ett talmaterial via avlyssning, var det kortaste intervallet 60 msec (Jönsson, Hagström, Hoff & Thorin, 2004). Strangert (1990) rapporterade tillfällen då pauser upplevdes trots frånvaro av tysta intervall. Detta fenomen kan dock sannolikt bero på att det finns andra akustiska korrelat som bidrar till upplevelsen av en paus, däribland prepausal lengthening som innebär förlängning av ord och fonem som föregår segmentet för den bedömda pausen (Strangert, 1993). Pausduration i bedömningar av talflyt I en perceptuell studie fann Amir & Yairi (2002) en perceptuell tröskel för durationen på intervall mellan upprepade stavelser och ord där lyssnarna började gå över från att bedöma talet som stamning, till att bedöma det som normalt ickeflyt. Pausduration påstås också bidra vid diagnosticering av flytande/ickeflytande afasi. Det är å andra sidan svårt att säga exakt hur denna bidrar eftersom endast subjektiva kriterier används i bedömningen (Kirsner et al.,1964). Syftet med de två exemplen ovan är att visa att pausduration kan vara relevant som faktor i bedömning av talflyt, både utifrån akustiska och perceptuella kriterier. 1 Exempel på ickeflytande och flytande tal Spontantalet innehåller ofta pauser på ej syntaktiskt motiverade ställen (tvekpauser). De ickeflyt som ofta förekommer är ett resultat av problem med planeringen av talet då denna måste ske parallellt med planeringen av det språkliga innehållet (Strangert, 1993). Det resulterar i det karakteristiska sätt att tala som är typiskt för normaltalarens spontantal. Vid professionell nyhetsuppläsning förefaller nyheterna presenteras i ett relativt snabbt tempo med få och korta pauser. Här finns också avsnitt av långsamt tal som ackompanjeras av ett avbrott eller en paus före starkt betonade ord. Kraftfull markering av betoning kombineras med en mycket distinkt artikulation. Det finns starka skäl att förutsätta att nyhetsuppläsaren pauserar på ett mycket medvetet och strategiskt sätt för att på ett effektivt sätt få fram sitt budskap (Strangert, 1993). Naturligt tal Lyssnarbedömnigar och analys av ickeflyt är de två huvudinriktiningarna i forskningen kring skillnader mellan normalt ickeflytande tal och stamning. Lyssnarbedömnigar blev betydelsefulla i och med förklaringen av den diagnosogena teorin (Johnson, 1942) enligt vilken stamning orsakas av lyssnares felaktiga bedömningar av normala ickeflytande tal. Lyssnares bedömningar av talflyt sägs kunna variera lika mycket som talet de bedömer (Conture, 1990). Bedömnigar av hur en talare kommunicerar påverkas också av en mängd sociala, kulturella och experimentella faktorer. Dessa faktorer påverkar de subjektiva bedömningarna när det gäller t.e.x talflyt hos en viss talare (Susca & Healey, 2001b). Även professionella bedömningar kan variera mycket. Ett och samma yttrande kan bedömas som stamning av en erfaren logoped och som normalt ickeflyt av en annan (Cordes & Ingham, 1995). En annan viktig faktor för bedömningen är instruktionerna. Genom ändrade instruktioner kan samma tillfälle av ickeflyt vid olika tillfällen bedömas som både normalt ickeflyt och stamning. Leach, Wolfolk, Fucci och Gonzales (1997) rapporterade dock hög interbedömarreliabilitet när det gällde att identifiera lätt och måttlig grad av ickeflytande tal (Amir & Yairi 2001). Simulerat ickeflyt I samband med lyssnarbedömningar har det varit vanligt att manipulera talet hos stammande personer för att kunna undersöka hur mängden ickeflyt, och olika egenskaper hos ickeflyt påverkar bedömningen av talet. Simulering av ickeflyt möjliggör manipulation av variabler som annars är omöjliga att kontrollera i naturligt tal. Vid lyssnarbedömningar har det varit en tradition att dela in talet i flytande respektive ickeflytande, även när man inte frågat efter stamning (Susca & Healey, 2001b). Susca & Healey (2001a) åstadkom en procentuell ökning av andelen ickeflyt i ett talmaterial för att simulera sex olika nivåer av flyt respektive ickeflyt. Amir & Yairi (2001) använde manipulation för att skapa fyra durationskategorier av tysta intervall. De förlängde intervall mellan upprepade stavelser i talmaterial från stamande personer för att finna ett tröskelvärde för intervalldurationen där ett stamningstillfälle går över till att uppfattas som ett normalt ickeflyt. Då intervallen var längre än 70 msec skedde en signifikant ökning av bedömningar av talet som normalt ickeflyt. Det är viktigt att förtydliga att det ej var en kategorisk förändring det handlade om. 2 Syfte Syftet med denna studie var att undersöka normalt ickeflyt. Jag ville använda manipulation av pauser i normaltal för att se hur detta går att använda som metod för att simulera olika nivåer av talflyt. Simuleringen skulle utföras genom att manipulera durationen på tysta intervall (inpirerat av Amir & Yairi (2001) och på så vis skapa en procentuell ökning av ickeflyt (inpirerat av Susca & Healey (2001). Motiv för studien var att det finns tidigare forskning som tyder på att pauser bidrar till bedömningen av ickeflyt. Det finns också tidigare resultat som rör vad som bidrar till upplevelsen av en paus. Med utgångspunkt från dessa borde det vara möjligt att simulera pauser och på så vis simulera ickeflyt. En ökning av pausdurationen borde också kunna ge en ökad upplevelse av ickeflytande tal. Frågeställningar Går det att simulera normalt ickeflytande tal av olika grad genom att öka pausdurationen? Går det att finna ett tröskelvärde för när man börjar bedöma talet som ickeflytande när det gäller pausduration? 3 METOD Utprovning av talmaterialet Två talmaterial prövades ut för manipulationen.1) Spontantal med naturliga ickeflyt. 2) Uppläst tal. Spontantal med naturliga ickeflyt Först prövades ett talmaterial som innehöll naturliga ickeflyt, och utnyttja befintliga pauser, då det i annat fall kan vara svårt att få ett bra resultat vid manipulationen. En antydan till detta ges också i stamningslitteraturen. Susca & Healey (2001b) hävdar att det är oklart hur nära man kommer upplevelsen av ett autentiskt stamningsbeteende när man använder talmaterial från icke stammande normaltalare när man ska simulera stamning. Detsamma borde också gälla användningen av flytande tal utan naturliga ickeflyt vid en simulering av ickeflytande tal (op.cit.). De kriterier som ställdes upp för talmaterialet var att det skulle vara normaltalande personer. Talarna skulle befinna sig i en situation då de inte var fullständigt förberedda på vad de skulle säga, detta för att garantera förekomst av ickeflyt (jfr beskrivningen av spontantalet som ges i bakgrunden). De skulle dessutom tala svenska utan brytning. Motiv till detta var att undvika en inverkan på bedömningen av att lyssnarna, trots tydlig instruktion skulle bedöma språkliga aspekter. För att ytterligare minska risken för att någon lyssnare skulle bedöma språket bedömdes det som viktigt att i instruktionen tydligt förklara, att det inte var språket som skulle bedömas. Hur instruktionen utfördes beskrivs i detalj under rubriken Pilotstudie av lyssnarbedömning. Analys av talmaterialet Två avsnitt, totalt två timmar av TV-programmet Frågor till Riksdagen (SVT) spelade in på VHS-kassett. Därefter genomfördes en första granskning av hela materialet. Programmet bestod genomgående av c:a en minut långa frågor av till största delen kommunalpolitiker. Frågorna varvades med en minuts svar av riksdagsledamöter. För att få en uppfattning om distributionen av ickeflyt hos dessa talare och en överblick över materialet, transkriberades samtliga ickeflyt som förekom hos svarande politiker på videobandet. Tiden på räkneverket antecknades intill transkriptionerna för att kunna gå tillbaka senare och titta på specifika ickeflyt. Sedan sammanställdes de i en tabell efter typ av ickeflyt enligt Searl, Gabel och Fulks (2002). Utprovning av manipulation Den första frågan kring metoden blev att komma fram till vilka ickeflyt som skulle vara mest lämpade för manipulationen. Nio tydliga tvekpauser förekom före ord med klusil initialt. Tvekpauser var extra tydliga och lätta att identifiera före tonlösa klusiler. De bedömdes också vara enkla att manipulera då de innehöll tysta intervall. Ett segment i talvågen som är fritt från periodicitet bedömdes vara enkelt att förlänga då en liknande procedur använts av Amir och Yairi (2001). 4 Två typer av manipulation prövades; dels förlängning och dels minskning av intervall. Nio fraser som var och en innehöll en tvekpaus, spelades över från VHS-kasett och gjordes om till ljudfiler via audio output från VHS-video till sound recorder i Audition version 1.0. Fraserna sparades som nio separata ljudfiler. Efter genomlyssning av en fras markerades segmentet kring klusilen. Ett parti från den centrala delen av det tysta intervallet markerades, kopierades och sattes in i talvågen. På detta sätt kunde tystnad enkelt adderas så att intervallet fick önskad duration. Därefter prövades den amdra typen av manipulation (minskning av intervall). Det genomfördes genom att en önskad portion av intervallet klipptes bort. Resultatet av detta blev två fraser; en fras med med en naturlig tvekpaus vars tysta intervall förlängts ytterligare, och en med reducerat tyst intervall. Värdering av manipulationen Vid en genomlyssning av materialet tillsammans med kurskamrater bedömdes att det gick att reducera intrycket av en tvekpaus med denna metod. Det bedömdes också som att det gick att återskapa ett intryck av en paus/tvekpaus från ett förkortat intervall genom att addera tystnad till talvågen. Däremot gick det inte att skapa ett intryck av ickeflytande tal, då det rörde sig om allt för korta talexempel som bara innehöll ett enda tillfälle av ickeflyt. Dalton och Hardcastle (1977) hävdar också enligt Guitar (1998) att frekvensen av ickeflyt inverkar på om talet upplevs som ickeflytande. Därför valdes i stället längre yttranden på minst 15 sekunder för att göra det möjligt att addera fler tillfällen av ickeflyt till yttrandet. En tonlös klusil identifierades i talvågen där det ej fanns någon naturlig paus. Det tysta intervallet som föregick klusilens explosionsfas förlängdes enligt samma procedur som beskrivs ovan. Denna procedur upprepades på ett flertal intervall i talmaterialet med politikers tal. Vid de flesta tillfällen uppstod ett syntetiskt ljud i tiden för det tysta intervallet. Detta antas ha berott på att det ofta fanns bakgrundsljud i lokalen som skapade periodicitet i talvågen när segment duplicerades. Då det dessutom inte fanns tillräckligt många talexempel från videoinspelningen som var längre än 15 sekunder och var helt fria från andra ickeflyt än tvekpauser kunde detta material ej användas. Uppläst tal Eftersom det inte gick att finna tillräckligt långa yttranden utan andra ickeflyt än pauser i talmaterialet med politiker, valdes i stället nyhetsuppläsningar att prövas som talmaterial (se exempel på ickeflytande och flytande tal på sid 5). Inspelning av talmaterial Ett 10-tal nyhetssändningar från SVT och TV4 spelades in på VHS-kasett. Materialet granskades och endast de uppläsningar som gjordes i TV-studio då nyhetsuppläsaren visades i bild valdes ut för vidare analys. Sexton nyhetsuppläsningar återstod efter att nyheter med negativt/obehagligt innehåll (mord osv.) eller som innehöll andra ickeflyt än pauser sållats bort. 5 Utprovning av manipulation Ur materialet valdes 10 nyhetsuppläsningar ut för vidare analys. Dessa spelades över från VHS-kassett till datorprogrammet Praat version 4.2. Praat valdes att användas då det innehåller en effektiv funktion för att manipulera durationer. Nyhetsuppläsningarna sparades som tio separata ljudfiler som omformaterades till ett format för manipilation. En mer detaljerad genomlyssning gjordes och intressanta partier eller yttranden transkriberades. I första hand identifierades tonlösa klusiler enligt tidigare procedur. Även ett antal andra tysta intervall som fanns i ett av yttrandena valdes dock för manipulation (se yttrande 3 nedan). Resultatet av urvalet blev fyra yttranden som vart och ett bestod av en talsekvens från en nyhetsuppläsning. Talarna bestod av två kvinnor och två män. En ortografisk transkription av talmaterialet visas nedan. Målområden för manipulationen har markerats med fetstil, och intervallens längd har angivits inom ”/ /” i millisekunder. Värdena inom ”/ /” visar intervallens längd hos var och en av de fyra variationer som senare skapades av respektive yttrande (den första siffran efter ”/” är värdet för intervallet i ej manipulerat yttrande). Hur variationerna skapades beskrivs under Förberedelse för pilotstudie. Yttrande 1 En upptäckt vid Karolinska Institutet kan få stor betydelse för patienter med /27, 65, 121, 247/typ-två-diabetes. Ett forskarlag har /51, 120, 197, 349/ kartlagt den insulinproducerande betacellen och har upp /110, 132, 164, 330/ täckt hur insulinproduktionen /31, 67, 98, 184/ kan regleras genom att man tar bort en del av cellen. Yttrande 2 Och först ska vi berätta att den kraftigaste jordbävningen på fem år nu på morgonen skakade stora delar av Taiwan. Jordbävningen mätte sju komma noll /53, 105, 184, 340/ på richterskalan vilket är förhållandevis /41, 93, 180, 339/ kraftigt, men epicentrum låg under havet, elva mil öster om Taiwans öst /53, 114, 237, 450/ kust. Yttrande 3 ( Innehöll naturliga ickeflyt). Den svenska säkerhetspolisen ägnar allt mer resurser åt att spana på grupper av islamistiska extremister som man hävdar finns /102, 237, 479, 975/ i Sverige. Säpo tror att /48, 112, 241, 444/ grupperna vistas i Sverige för att planera / 46, 82, 174, 254/ nya terrordåd och för att rekrytera nya /40, 119, 253, 505/ terrorister bland unga svenska muslimer. Yttrande 4 Brittiska forskare har utvecklat en metod för att förvara vaccin så att det inte behöver vara /73, 226, 416, 139/ kallt. Det här kan leda /73, 287, 559, 169/ till att hanteringen av vaccin blir billigare och att fler barn i u-länderna /44, 133, 251, 82/ kan vaccineras. 6 I de flesta fall har occlusioner i tonlösa klusier förlängts. Undantag från detta finns i yttrande 3 där intervallen finns/i, att/grupperna och planera/nya skilde sig från de övriga genom att det efterföljdes av vokal, nasal respektive tonande klusil. Intervallen planera/nya, samt nya/terrorister bedömdes som naturliga ickeflyt (tvekpauser). Dessa intervall togs med som en jämförelse då de gav bra resultat vid manipulationen. Yttrande 3 valdes således att användas som jämförelse vid tolkningen av resultatet. I yttrande 4 valdes intervallen vara / kallt, leda /till, u-länderna / kan. Intervallen förlängdes procentuellt för att få en mer naturlig fördelning mellan pausdurationerna i yttrandena jämfört med om samtliga intervall hade förlängts till en viss absolut duration. Ursprungliga durationer i de utvalda intervallen ökades med 1000% (med andra ord förlängdes tio gånger). De ursprungliga intervallen i de fyra yttrandena var i genomsnitt 59 ms långa (range 27-110 ms). Manipulationen resulterade i att dessa intervall i genomsnitt blev 437 msec (range 184-975 ms). Yttrande 1 innehöll fyra ickeflyt 37 ord, yttrande 2 innehöll 3/42, yttrande 3: 4/43, yttrande 4: 3/36. Värdering av manipulationen De manipulerade yttrandena lyssnades av tillsammans med kurskamrater för att bedöma talflyt. En preliminär bedömning av naturligheten utfördes också. Talet kunde bedömas som ickeflytande. Då intervallen gick att förlänga utan att någon periodicitet uppstod i talvågen, kunde manipulationen sägas vara av god kvalitet. Förberedelse av material för pilotstudie Två ytterligare nivåer av talflyt skapades genom att upprepa proceduren som beskrivits ovan, men nu med två andra relativa durationer. Genom att välja relative duration 5.0 respektive 20.0 uppstod ytterligare åtta yttranden. Fyra yttranden med 500% ökning av ordinarie intervall, och fyra yttranden med en ökning på 2000%. Resultatet blev totalt 16 yttranden; fyra originalinspelningar under fyra olika betingelser som namngavs med avseende på procentuell förlängning av ordinarie intervall: FO% (ej manipulerad), F500% F1000% och F2000%. Filerna gjordes om till ljudfiler (wav-filer ). Därefter mättes samtliga nya intervall. Ett extremvärde som uppkom minskades med 66% (då intervallet var tre gånger så långt som de övriga) för att undvika att detta ensamt skulle påverka bedömningen av yttrandet i allt för hög grad. Ett ytterligare motiv till det var att just detta extremvärde förekom inom ett ord. (Yttrande 1: upptäckt). Det andra exemplet på paus inom ord förminskades på samma sätt. Detta resulterade i en minskning av durationen med 66% i dessa två intervall. De 16 färdigbearbetade ljudfilerna ordnades enligt Latin Squares Design så att 16 lyssnare kunde lyssna på fyra yttranden, ett från varje talare och ett från varje betingelse. Resultatet blev en CD-skiva med 64 ljudspår grupperade så att de fyra första spåren på skivan motsvarade det material som lyssnare 1 skulle höra. Följande fyra spår skulle bedömas av lyssnare 2 och så vidare. Varje variation av varje yttrande skulle således komma att bedömas av fyra lyssnare vid ett tillfälle vardera. 7 Ytterligare två yttranden valdes ut från talmaterialet för att användas som övningsexempel. Det ena yttrandet förekom i originalutförande. Det andra yttrandet manipulerades enligt metoden för F2000% . Dessa två filer lades som två spår på en separat CD-skiva med det ej manipulerade exemplet först. Pilotstudie av lyssnarbedömningar En pilotstudie av lyssnarbedömning av talflyt utfördes med 16 otränade lyssnare. Försökspersonerna bestod av kvinnor och män mellan 18 och 54 år. Urvalet av försökspersoner utgick endast från praktiska skäl, nämligen att personerna var tillgängliga vid tillfället. Inga övriga kriterier användes för urvalet förutom att de ej skulle ha erfarenhet av bedömningar av tal eller erfarenhet/kunskap av stamning. Hörlurar av typ AKG K 130 användes. Avlyssningen gjordes via stereoanläggning i ett tyst rum med endast försöksledaren och bedömaren närvarande i rummet. Ett svarsformulär användes som fylldes i av försöksledaren. Försöksledaren satt mitt emot bedömaren vid avlyssningen. Avlyssningen förbereddes genom att anteckna lyssnarnummer och nummer för de ljudspår som skulle avlyssnas av den aktuella lyssnaren på svarsformuläret intill svarskolumnerna (bilaga 1). Lyssnarna gavs en kort muntlig instruktion (bilaga 2). Efter att ha lyssnat på ett yttrande ombads bedömaren svara antingen ”talet flyter” eller ”talet flyter inte”. Svaren markerades av försöksledaren med ett kryss i svarsformuläret. När avlyssningen var färdig fylldes uppgifter om bedömaren i på formuläret angående ålder, utbildningsnivå och kön för att eventuellt undersöka olikheter i bedömning. Inga jämförelser gjordes dock avseende detta. En preliminär sammanräkning av resultatet visade att ett fel hade skett då ljudspåren lades på CD:n. Fördelningen mellan antalet presentationer var därför inte helt jämn mellan de 16 yttrandena. Svaren räknades ändå samman för att få en preliminär uppfattning om hur betingelserna påverkat bedömningen. En trend man kunde se var en kraftig ökning av bedömda ickeflyt redan vid F500% jämfört med FO%. Vid FO% bedömdes endast ett av 16 yttranden som ickeflytande och vid F500% bedömdes hela 12 av 16 yttranden som ickeflytande. För att få en mindre abrupt förändring i bedömningen togs F2000% bort och ett nytt förhållande skapades med samma procedur som tidigare men som var 250%. Det nya F250% blev nu det näst kortaste förhållandet, och bytte då plats i ordningen med F500%. Att ta bort förhållandet 2000% bedömdes ej vara något problem då antalet bedömda ickeflyt inte ökade mellan F1000 % och F2000 %. En ny CD skapades enligt tidigare procedur. Designen visas i bilaga (bilaga 3). De fyra betingelserna för intervallet att/grupperna visas akustiskt i bilaga 4). Inga naturliga pauser fanns på de utvalda ställena i det ej manipulerade förhållandet (undantaget yttrande 3). Därför kan vi inte betrakta det första manipulerade förhållandet (F250%) som en förlängd pausduration. Det är snarare det första förhållandet som har pauser överhuvudtaget på de aktuella ställena. Det som har skett i F250% är således att pauser eventuellt har uppstått där det ej tidigare fanns några pauser. 8 Lyssnarbedömning En ny lyssnarbedömning gjordes med 32 lyssnare; 14 män och 18 kvinnor i åldrarna 20 till 32 år som gick på vård/hälsovetenskapligt program (sjuksköterske-, läkar-, arbetsterapeut, tandhygienist samt biomedicinprogrammet) på Umeå universitet. De valdes av praktiska skäl då de vid tillfället fanns tillgängliga på universitetets medicinska bibliotek. Försökspersonerna hade ingen erfarenhet av bedömning av tal, och hade inte läst fonetik. De hade ingen erfarenhet av stamning, med undantag av en person som ändå valdes att tas med i studien då han ej genomgått stamningsterapi. Bedömningen utfördes exakt som beskrivits tidigare, med två undantag. Det första var att CD:n användes i två omgångar då lyssnarantalet var dubbelt så stort (lyssnare nr 17 presenterades spår 1, 18 spår 2, osv.). Det andra var att en bärbar CDspelare användes. Volymen ställdes in vid det första övningsexemplet med Lyssnare nummer 1. Därefter justerades aldrig volymen. Databearbetning De yttranden som bedömdes som ickeflytande noterades på ett excel kalkylblad för var och en av de fyra talarna. Resultatet analyserades statistiskt med ett Kruskall–Wallis test i kombination med ett post hoc Mann-Whitney U test (skillnaderna mellan antalet ickeflytbedömningar värderades separat för varje förhållande via Kruskall-Wallis test). Data för vart och ett av de 16 yttrandena undersöktes sedan grafiskt för att se om det gick att finna någon form av tröskelvärde för pausdurationen. 9 RESULTAT Bedömning av talflyt Den procentuella fördelningen av ickeflyt-bedömningar för respektive förhållande visas i Tabell 1 samt Figur 1. Tabell 1. Andel yttranden bedömda som ickeflytande vid de fyra betingelserna för intervallen. Betingelse för intervall % av yttrandena bedömda ickeflytande ( n = 32 för varje betingelse ) Intervall ökade 0% (ej manipulerade) 12,5% Intervall ökade 250% * 34,4% Intervall ökade 500% * 71,9% Intervall ökade 1000%* 93,8% * Den procentuella ökningen gäller ej samtliga intervall. Två extremvärden hade modifierats. Det procentuella värdet 250%, 500% och 1000% ska därför betraktas endast som en generell beskrivning av de fyra betingelserna. Ett Kruskal–Wallis test visade att graden av förlängning hade en signifikant effekt H(3) = 12,23 p< ,01 på bedömningen. Vidare visade ett post hoc Mann–Whitney U test att det förelåg en signifikant skillnad mellan yttranden med ordinarie intervall och de yttranden vars intervall hade ökats med 500% och 1000 %, samt mellan betingelserna F250% och F1000%. Dock fanns ingen signifikant förändring i bedömningen mellan betingelserna F0% och F250%. Beskrivning av de fyra betingelserna Då frågeställningen gällde ett absolut tröskelvärde, och inte relativ förändring av intervallet, är det intressant att också redovisa hur durationerna påverkade bedömningen. I tabell 2 beskrivs de fyra förhållandena med avseende på dess intervalldurationer. Tabell 2. Längsta intervall, omfång och medelvärde på intervall angivet i millisekunder (ms) hos respektive betingelse. Betingelse för intervall 0% (ej manipulerade) 250% 500% 1000% Längsta intervall (ms) 110 237 479 975 Omfång (range) (ms) 27- 110 65 – 237 98 – 479 184 - 975 Medelvärde (ms) 59 123 229 437 intervall Bedömning av yttrandena För att visa specifikt hur olika durationer påverkade bedömningen, redovisas nedan hur de 16 yttrandena bedömdes var för sig. I figur 2 visas hur yttrandena bedömdes beroende på dess genomsnittliga intervallduration (n=8 för varje yttrande). 10 Andel yttranden bedömda ickeflytande Bedömning beroende av genomsnittlig intervallduration 10 8 6 4 2 0 49 55 63 66 96 104 130 145 153 200 215 277 321 376 408 618 Genomsnitt intervallduration (msec) Figur 2. Bedömning beroende av genomsnittlig intervallduration (n=8). De 16 yttrandena har rangordnats längs kategoriaxeln efter genomsnittlig intervallduration. Som en jämförelse redovisas även bedömningen med avseende på yttrandets längsta intervall. I figur 3 visas hur de 16 yttrandena bedömdes med avseende på längsta intervall (n=8 för varje yttrande). Bedömning beroende av längsta intervallduration 9 Andel yttranden bedömda ickeflytande 8 7 6 5 4 3 2 1 0 53 73 102 110 114 132 169 197 237 237 287 349 450 479 559 975 Längsta intervallduration ( msec) Figur 3. Bedömning av yttrandets längsta intervall. De 16 yttrandena har rangordnats längs kategoriaxeln efter längsta intervall. 11 Bedömning av talarna Vart och ett av yttrandena (yttrande 1 till och med 4) härrör från var och en av fyra talare. För att bekräfta att resultatet ej primärt var en effekt av talarna sammanställdes andelen ickeflytbedömningar specifikt för de fyra talarna. Detta utfördes först för originalinspelningarna (F0%), och sedan sammantaget för alla de 16 yttrandena. I figur 4 respektive 5 visas hur talarna bedömdes i F0% respektive hur de bedömdes totalt. Bedömning av talarna i original andel bedömda ickeflytande 30% 25% 20% 15% Serie1 10% 5% 0% 1 2 3 4 talare Figur 4. Bedömning av talare 1, 2, 3 och 4 i F0% (ej manipulerad). Andel av yttrandena som bedömdes ickeflytande. Antalet ickeflyt-bedömningar som totalt tilldelades talarna visas i figur 5 (n=32). Hur talarna bedömdes totalt Totalt antal yttrandenl bedömda som ickeflytande 25 20 15 Serie1 10 5 0 1 2 3 4 talare Figur 5. Bedömning av talare 1, 2, 3 och 4. Totalt antal ickeflyt-bedömningar som tilldelades talarna (n=32). 12 DISKUSSION Metod Att tvinga lyssnarna att bedöma talet kategoriskt som antingen flyt eller ickeflyt var viktig för att svara på frågeställningen (går det att finna ett tröskelvärde för när man börjar bedöma talet som normalt ickeflytande när det gäller pausduration). Detta eftersom det tidigare har visats att lyssnare ej gör en kategorisk bedömning av talflyt. Talflyt bedöms snarare utmed ett kontinuum från helt flytande till i hög grad ickeflytande (Femrell & Holmqvist, 2000). Då lyssnarbedömningar varierar mycket mellan individuella lyssnare, var det av stor betydelse att använda sig av en grupp lyssnare. Resultatet av manipulationen kan ej bedömas som naturligt tal då det innehåller enbart en typ av ickeflyt. Dessutom innebar det en nästan konsekvent pausering före tonlösa klusiler (av totalt 13 pauser var, 11 före tonande klusiler). Detta skiljer det manipulerade talet från naturligt tal, som i stället innehåller en variation av olika typer av ickeflyt. En brist i manipulationen var att ingen smoothing-procedur1 utfördes. Detta gav i ett fåtal fall ett knappt hörbart bi-ljud i transitionerna. Det kan vara så att nyhetsuppläsares tal är extra känsliga för den här typen av manipulation, och lyssnaren ställer extra höga krav på professionella uppläsare. Dessutom var antagligen de flesta av talarna/rösterna kända av lyssnarna. Ett möjligt scenario är också att någon lyssnare kan ha hört något av det individuella yttrandet vid tidigare tillfälle, och minns hur det lät i original. Detta bör dock ej förekomma vid mer än något enstaka fall, och borde därför inte nämnvärt påverka bedömningen. Att lyssnarna däremot ställer högre krav på professionella talare är dock troligt. Resultat Resultatet tolkas som en effekt av förlängning av vissa intervall. Resultatet visar således att ju större förlängningen av vissa intervaller var, desto fler yttranden bedömdes som ickeflytande. En successiv ökning av andelen ickeflyt-bedömningar kan faktiskt observeras från och med det kortaste, till och med det längsta förhållandet (tabell 1, figur 1). En signifikant ökning av ickeflyt-bedömningar förelåg mellan yttranden med ej manipulerade intervall och yttranden med vissa intervall förlängda till 500% av ordinarie duration. En signifikant ökning av andelen yttranden bedömda som ickeflytande förelåg också mellan yttranden med intervall förlängda till 250% och de vars intervall förlängts till 1000% av sin ordinarie duration (tabell 2). Det är viktigt att poängtera att de procentuella värdena 250%, 500% och 1000% ska betraktas endast som en generell beskrivning av betingelserna då vissa intervall modifierades efter den procentuella förlängningen. Medelvärden på intervall är ej aktuella att diskutera här då omfånget (range) var alltför stort. En stegvis ökning av durationen på intervallen förelåg dock mellan de fyra betingelserna, även om vi räknar med de två modifierade intervallen. _______________________ 1 Gradvis minskning av amplituden i transitionerna mellan sammanfogade segment. 13 Det var alltså nödvändigt att förlänga intervallen till mer än 250% för att få en signifikant ökning av ickeflyt-bedömningar. Mellan betingelsen F0% och F250% fanns ju ingen signifikant skillnad i bedömningen. När intervallen däremot förlängts till 500% ökade andelen ickeflyt-bedömningar däremot signifikant (med hela 60%; 12,5%-71,9%). Som svar på frågeställningen (Går det att finna ett tröskelvärde för när man börjar bedöma talet som normalt ickeflytande när det gäller pausduration?) kan man säga att det var nödvändigt att öka intervallen till mer än 250% av ordinarie duration för att talet skulle bedömas som ickeflytande i fler fall än flytande. Det förefaller också som att vid en viss grad av förlängning (F500%) började talet i betydligt större utsträckning bedömas som ickeflytande än som flytande (i 71,9% av fallen). En av orsakerna till förändringen i bedömningen kan vara att det vid en viss intervallduration sker en ökad upplevelse av pauser och av pausering. Det är också värt att notera att värdet 200 msec fanns inom omfånget för intervallen hos den betingelse som gav den första signifikanta skillnaden i bedömning. Detta värde har angivits som auditiv gräns för pauser (Zellner, 1994). Även efter detta värde fortsatte i och för sig ickeflytbedömningarna att öka men inte i samma grad. Det är viktigt att nämna här att ickeflyt kan ha upplevts redan i ej manipulerat förhållande trots att inga intervall fanns som borde motsvara tvekpauser. Detta nämner jag utifrån att 12,5% av bedömda yttranden i F0% bedömdes som ickeflytande. Här får vi användning av talare 3 som jämförelse för att titta på hur naturliga pauser i F0% påverkade bedömningen. Med tanke på förekomst av naturliga pauser borde talare 3 få fler ickeflyt-bedömningar än de övriga talarna i ej manipulerat förhållande. Så ser det dock inte ut om vi tittar på figur 1. Vi kan här se att talare 1 tilldelades lika många ickeflytbedömningar som talare 3 i originalutförande. Två av talarna fick däremot inga ickeflyt-bedömningar i originalutförandet. När det gällde totalt antal ickeflytbedömningar hos respektive talare finns inte heller någon utmärkande skillnad hos talare 3. Här blir det också aktuellt att diskutera placeringen och mängden av pauser. Eftersom dessa variabler var konstanta från och med F250% kan de ej ensamma ha stått för resultatet. I sådant fall skulle en skillnad endast ha funnits vid en viss duration där man börjat uppfatta pauser. Därefter borde ingen ökning av antal ickeflytbedömningar ha skett. En tolkning av vad som skett här är att när pauser började uppfattas på vissa ställen (F250%) ökade antalet ickeflyt-bedömningar. Placeringen av pauserna (de flesta på ej syntaktiskt motiverat ställe) bör ha varit en bidragande faktor men kan inte ensamt stå för resultatet. I sådant fall skulle ingen fortsatt ökning i bedömning ha skett efter det första manipulerade förhållandet (F250%). Detsamma gäller antalet pauser som ju också hölls konstant i respektive yttrande från och med F250%. Om vi antar att pauser börjar upplevas vid en viss duration, och att man därefter ej tar hänsyn till pausernas längd, borde bedömningen ej öka successivt med ökad pausduration. Den borde i så fall stabiliseras efter ett visst värde. Det enda som skett efter att pauser eventuellt har börjat uppfattas är ju en successiv förlängning av dessa pauser. 14 Det är här mycket viktigt att betona skillnaden mellan ett ökat antal ickeflyt-bedömningar och ökad grad av ickeflyt i ett yttrande. Den aktuella studien visar endast skillnader i andelen yttranden kategoriserade som ickeflytande efter en uppmaning att försöka kategorisera dem så. Den aktuella studien bör ändå kunna användas för att bekräfta tidigare påståenden av Kirshner et al (2002) och Amir & Yairi (2001) om att intervallduration/pausduration är relevant att ta hänsyn till i fråga om talflyt, åtminstone som en bidragande faktor. Slutsatser Trots att talet här var syntetiskt manipulerat förefaller en ökning av pausdurationer kunna användas för att simulera normalt ickeflytande tal. En successivt ökad grad av ickeflytande tal förefaller också gå att simulera genom en stegvis ökning av pausdurationer. Vad gäller ett tröskelvärde för pausdurationen där man börjar bedöma talet som ickeflytande förefaller det som att talet börjar bedömas som ickeflytande i fler fall än som flytande vid en viss betingelse för pausdurationen. På grund av ett begränsat talmaterial och få försökspersoner bör man dock inte dra några allmängiltiga slutsatser om på vilket sätt, eller i vilken omfattning, intervalldurationen påverkar upplevelsen av talflytet. 15 REFERENSER Amir, O. & Yairi, E. (2002). The effect of temporal manipulation on the perception of disfluencies as normal or stuttering. Journal of Communication Disorders 35, 63-82. Bloodstein, O. (1995). A Handbook on stuttering. 5th edition. San Diego: Singular Publishing Group, Inc. Conture, E. (1990) Stuttering 2nd edition. Englewood Cliffs, N.J.: Prentice-Hall. Cordes, A. & Ingham. R. (1995) Judgements of stuttered and nonstuttered intervals by recognized authorities in stuttering research. Journal of Speech and Hearing Research 38: 3341. Dalton, P. & Hardcastle, W.J. (1977) Disorders of fluency. New York: Elsevier. Femrell, L. & Holmqvist, M. (2000). Stammande och normaltalande personers bedömning av talflyt och stamning. Umeå universitet. Mastersuppsats. Gregory, H. (1993) A clinician’s perspective: Comments on identification of stuttering, prevention and early intervention. Journal of Fluency Disorders 18: 389-402. Gregory, H. & Hill. D. (1984) Stuttering therapy for children. Perkins W. (ed.) In Stuttering disorders. N.Y.: Thieme-Stratton Guitar, B. (1998). Stuttering: An Integrated Approach to Its Nature and Treatment. 2nd edition. Baltimore: Williams & Wilkins. Hedge, M.-N. (1978) Fluency and fluency disorders: Their definition, measurement, and modification. Journal of Fluency Disorders 3: 51-71. Johnson, W. (1942) A study of the onset and development of stuttering. Journal of Speech Development 7: 251-257. Jönsson, D., Hagström, P., Hoff, S., & Thorin, D. (ej utgiven rapport i fonetik). Hur låter tystnaden? Korrelation mellan fysiskt existerande pauser och uppfattade pauser i spontant tal. Umeå universitet: Institutionen för fonetik. Kirsner, K., Dunn, J., Hird, K., Parkin, T & Clark, C. (2002). Time for a pause. Proceedings of the 9th Australian International Conference on Speech Science & Technology. Melbourne, December 2-5 2002: Australian Speech Science & Technology Association Inc. Leach, E.A., Wolfolk, W.B., Fucci, D. & Gonzales, M.D. (1997) An investigation of simulated stuttering by normal speakers. Paper presented at the American Speech-Languagehearing Association Convention, Boston. Leahy, M. (1989) Fluency and Fluency Development. University of Dublin: School of Clinical Speech and Language studies. Föreläsning vid Third European Postgraduate Course in Language Pathology. Brussels, September 12-23. 16 Lundberg, A. (1999). Stamning: Grundbok för behandlare. Göteborg: Anders Lundberg och Lianen Konsult. Searl, J.P., Gabel, R. M. & Fulks, J.S. (2002). Speech disfluency in centenarians. Journal of Fluency Disorders 35, 383-392. Strangert, E. (1990). Perceived pauses, silent intervals, and syntactic boudaries. PHONUM 1, 35-38. University of Umeå: Department of phonetics. Strangert, E. (1993). Speaking style and pausing. PHONUM 2, 121-137. University of Umeå: Department of phonetics. Susca, M. & Healey, E. C. (2001a). Listeners perceptions along a fluency-disfluency continuum: a phenomenological analysis. Journal of Fluency Disorders 27, 135-161. Susca, M. & Healey, E. C. (2001b). Perceptions of simulated stuttering and fluency. Journal of Speech, Language and hearing Research 44, 61-72. Zellner, B. (1994). Pauses and the temporal structure of speech; E. Keller (Ed.) Fundamentals of speech synthesis and speech recognition, 41-62. 17 Bilaga 1 Svarsformulär Lyssnare nr _____ Ålder _____ Kön (M / K) ______ Eftergymnasial utbildning Antal år ______ Gymnasial utbildning Antal år ______ Talet flyter Talet flyter inte 1 2 3 4 5 6 18 Bilaga 2 Instruktion Du ska bedöma talflyt. När man pratar kan talet flyta mer eller mindre, och det handlar inte om i fall man kan tala til exempel flytande svenska, det vill säga kan språket flytande. Förstår du ? Du ska nu få lyssna på 4 talare som var och en pratar i ungefär 15 sekunder. Din uppgift är att svara om du upplever att talet flyter eller om du tycker att det inte flyter.Det lite besvärliga är att du måste bestämma dig för ett av alternativen. Du väljer det du tycker stämmer bäst som svar. Vi vet att olika personer bedömer detta mycket olik och därför vill jag ha just din bedömning. Det är viktigt att du förstår att det inte är ett kunskapstest och det finns inga rätt eller fel svar. Det är just din upplevelse jag är intresserad av. Vi börjar med 2 övningsexempel. 19 Bilaga 3 Design L1 L2 L3 L4 3a 3b 3c 3d 4b 4c 4d 4a 2d 2a 2b 2c 1c 1d 1a 1b L5 L6 L7 L8 1c 1d 1a 1b 4a 4b 4d 4c 2d 2c 2b 2a 3b 3a 3c 3d L9 L10 L11 L12 2d 2b 2c 2a 3a 3c 3d 3b 4b 4d 4a 4c 1c 1a 1b 1d L13 L14 L15 L16 2b 2c 2d 2a 1a 1d 1c 1b 3c 3a 3b 3d 4d 4b 4a 4c L17 L18 L19 L20 3a 3b 3c 3d 4b 4c 4d 4a 2d 2a 2b 2c 1c 1d 1a 1b L21 L22 L23 L24 1c 1d 1a 1b 4a 4b 4d 4c 2d 2c 2b 2a 3b 3a 3c 3d L25 L26 L27 L28 2d 2b 2c 2a 3a 3c 3d 3b 4b 4d 4a 4c 1c 1a 1b 1d L29 L30 L31 L32 2b 2c 2d 2a 1a 1d 1c 1b 3c 3a 3b 3d 4d 4b 4a 4c L=Lyssnare( kolumn 1) Yttrande; nummer och förhållande ses i kolumn 2-5 (a=F0%, b=F500%, c=F1000%, d=250%). 20 21 22 23 24
© Copyright 2024