Dansk standard for udskrifter og registrering af talesprog

DANSK STANDARD
1992.
FOR
UDSKRIFTER
OG
REGISTRERING
AF
TALESPROG, 2.
UDGAVE,
Tillæg A til SNAK 5. årg., 1992
Nyhedsbrevet SNAK er udgivet af styringsgruppen for initiativområde Dansk talesprog i dets
variationer under Statens humanistiske Forskningsråd. SNAK (Inklusive tillæg) kan, så længe
oplag haves, fås hos
Kirsten Gregersen
Institut for Sprog og Kommunikation
Odense Universitet
Campusvej 55
5230 Odense M
Tlf: 66 15 86 00, lokal 3409
Fax: 65932483
e-mail: [email protected]
Oplag: 600 eks.
ISSN: 0901-5752
Eftertryk med kildeangivelse tilladt.
December 1992.
Dansk Standard for udskrifter og registrering af talesprog
FORORD TIL 2. UDGAVE
Dette hæfte indeholder konventioner for, hvordan man kan omsætte båndoptaget tale til skrift.
Desuden er der et skema til registrering af persondata, sprog, tekniske data o.l.
Det er formentlig indlysende, at det vil være en fordel for fortolkning af udskrifter, hvis man kan
være sikker på, hvordan udskriften er foretage. I den situation, hvor en forsker eller studerende skal
i gang med en udskrift tilbyder konventionerne DANSK STANDARD sig som en velovervejet og
efterhånden gennemprøvet praksis.
Konventionernes historie er som følger:
I forbindelse med den forberedende konference i april 1985, der førte til etableringen af Statens
humanistiske Forskningsråds initiativ Dansk talesprog i dets variationer (1986-1991) blev der ytret
ønske om en koordinering og uniformering af de mange forskellige udskriftskonventioner, som var
opstået rundt omkring i undervisnings- og forskningssammenhæng. Initiativets styringsgruppe
påtog sig at indkalde til en konference i Middelfart i marts 1986, hvor hovedpunktet på dagsordenen
var diskussion af udskriftskonventioner. Forberedelsen til konferencen bestod i at deltagerne skrev
et minuts naturlig samtale ud efter det system, de plejede at anvende. Der udkrystalliserede sig ikke
på konferencen konsensus om noget system, men det blev overdraget styringsgruppen at komme
med forslag til både et udskriftssystem og et registreringssystem for båndoptagelser. På basis af en
gennemgang af den danske og udenlandske litteratur om emnet udarbejdede Kirsten Gregersen til et
forskerkursus i Karlslunde i august-september 1986 et forslag til udskriftskonventioner, som
samlede bred enighed. Dette forslag er i alt væsentligt identisk med det her gengivne. Forslaget har
derefter været sendt ud til samtlige deltagere i udskriftskonferencen i Middelfart med det formål at
få protester og kommentarer. Der var ingen protester og ej heller kommentarer, hvilket vi har tilladt
os at fortolke sådan, at der er enighed blandt de primært interesserede om, at det er et godt og
praktisk forslag.
Registreringskemaet, som er udarbejdet af Projekt Bysociolingvistik ved Inge Lise Pedersen og
Jane Jensen, har været gennem samme procedure med samme resultat.
For god ordens skyld skal vi til sidst understrege, at konventionerne naturligvis er ment som et
tilbud til alle, der står over for den opgave at skulle overføre talt sprog til skrift. Det vil givetvis
være en fordel, om alle danske forskere og undervisere benytter samme løsning af de problemer,
som altid skal løses (minimalkonventioner), men styringsgruppen finder det i øvrigt naturligt og
helt i sin orden, at enkelte projekter eller undervisere vælger andre løsninger end de her foreslåede
ud fra deres særlige interesser.
2. udgave er et kun ganske let revideret genoptryk af Dansk Standard for Udskrifter og
Registrering af Talesprog, tillæg til SNAK 2. årg. nr. 1, 1987. Den eneste notationsændring er, at
afslutningen på selvafbrydelser markeres med ”-”, de øvrige ændringer er af sproglig art.
Nærværende udgave udesendes som et led i afslutningen af initiativområdet Dansk talesprog i dets
variationer.
Styringsgruppen for SHF´s initiativ
Dansk talesprog i dets variationer
2
Dansk Standard for udskrifter og registrering af talesprog
RETNINGSLINJER FOR UDSKRIFTER AF DANSK TALESPROG
Indledning
Dette er en oversigt over hvorledes en talt dansk tekst kan overføres til en retskrivningsnær
notation, en såkaldt udskrift.
Formålet med at lave fælles retningslinier for udskrifter er først og fremmest at give udskrifter fra
forskellige forskere en vis grad af ensartethed således at de bliver nemmere for andre at læse. Selv
om der næppe er forskere der kan nøjes med en udskrift, så vil eftersporing af interessant
båndsekvenser lettes væsentligt, hvis der er en udskrift af båndet. Desuden vil det, hvis der engang
bliver oprettet en databank med dansk talesprog, lette søgningen af ord o.l. at udskrifterne følger
den samme praksis. Det er dog ikke meningen at retningslinjerne skal være en spændetrøje, men det
vil være af stor praktisk betydning om så mange som muligt følger notationskonventionerne,
således at tegnet ”X” har nogenlunde samme betydning i alle udskrifter af dansk. I det mindste vil
det være ønskeligt om nedenstående konventioner bliver betragtet som en norm hvorfra afvigelser
ekspliciteres.
Udskrifter kan som bekendt foretages med forskellig grad af fonetisk nøjagtighed: skalaen går fra
folketingsreferater i den ene ende til fine fonetiske transskriptioner i den anden.
Det er klart at formålet med udskriften betinger hvilken type udskrift man laver, for det kan fx
være tidsspilde at lave en fin fonetisk transskription hvis formålet er at undersøge ordstilling. I det
følgende vil der blive opstille minimale udskriftskonventioner, samt forslag til notationspraksis for
lydlige træk der ikke er indeholdt i minimalkonventionerne. Fælles for notationerne er at de
omfatter tegn som findes på de fleste PC´ere og Mac´er.
3
Dansk Standard for udskrifter og registrering af talesprog
Minimale udskriftskonventioner
Her er opstillet mindstekrav for hvad en udskrift af dansk talesprog bør indeholde og konventioner
for notation. Disse konventioner kaldes DANSK STANDARD 1.
1. Teksten udskrives i normal ortografi (dvs. efter gældende Retskrivningsordbog), dog benyttes
store begyndelsesbogstaver kun ved proprier. Forkortelser (som ”o.l.”), tal (som ”17”) og tegn
(som ”%”) skrives ud (som ”og lignende”, ”sytten” og ”procent”).
2. Af tegnsætningstegn bruges kun punktum. Det bruges til at betegne ytringsafslutninger.
Ytringsafslutninger er vanskelige at definere, idet kriterierne dels er visse lydlige parametre som
tonegang og længde og dels også er af indholdsmæssig art. Man kunne kalde ytringer for
funktionelle helheder der er baseret på en quasiobjektiv fonetisk virkelighed.
3. Ordrækkefølgen på udskriften skal være den samme som på båndet.
4. Uforståelige sekvenser og ord markeres ”(uf)” (for ”uforståelig”).
5. Sekvenser der er vanskelige at forstå, men hvor man ved et vist element af usikkerhed mener at
kunne høre det sagte, skrives inden for en parentes med et ”?” umiddelbart uden for hver side af
parentesen (fx ”?(taxakørsel)?”).
6. Når der er flere deltagere i samtalen udskrives de på hver sin linie (som i et partitur) således at
samtidig tale skrives over hinanden (kun begyndelsen markeres tilnærmelsesvis som simultan)
og talerskift uden overlapning skrives efter hinanden og talerskift uden overlapning skrives efter
hinanden på hver sin linie.
Et eksempel med to deltagere er:
ikke-overlappende skift
X: hvis man er femogtyve deltagere
Y:
ja
men det er meget rimeligt
samtidig tale
4
Dansk Standard for udskrifter og registrering af talesprog
Konventioner for ”finere” udskrifter
Ovenstående minimale konventioner vil i mange tilfælde vise sig at være utilstrækkelige.
Et fundamentalt problem er hvorledes ”normal ortografi” (se 1. ovenfor) skal tolkes. Én mulighed
er at følge de normale skriftsprogsregler for ordformer og endelser, således at infinitivsmærket ”at”
og konjunktionen ”og” noteres forskelligt selvom de udtales ens, og efter samme princip indsætte
endelsen ”-t” i ord hvor den er uhørlig (fx ”det er nemlig rigtigt ). En anden løsning er at have
specielle notationer for en begrænset mængde småord og ellers følge retskrivningsreglerne (dvs. fx
at indsætte et uhørligt ”-t”).
I det følgende er der opstillet en liste over notation af fonetiske træk og specialnotationer af
småord. Tanke er at man ud fra listen kan vælge de træk man har brug for. Udskrifter efter disse
konventioner kaldes DANSK STANDARD 2, men da der er mange træk bedes man på
registreringsskemaet anføre hvilke specialnotationer der er benyttet.
Pauser er intervaller uden fonation
”P” benyttes for pauser af en hvilken som helst varighed – ved pauser af længere varighed (fx
over ét sekund) kan man skrive varigheden i sekunder efter P (fx ”P3”).
Tøven er intervaller med ikke-segmentaliseret fonation uden rigtigt indhold.
”T” anvendes for alle slags tøven, ønskes en specifikation kan man skrive ”Tøh”, ”Tmm” osv.
Selvafbrydelser.
Herved forstås ord der ikke er fuldstændige (fx ”eftermiddagskaffe” afsnuppet efter [k]) – man
skriver så meget af ordet der blev sagt med en bindestreg efter for at markere uafsluttetheden (fx
”eftermiddagsk-” )
NB! Dette er den eneste notationsændring i forhold til 1. udgave.
Selvrettelser er hos visse talere meget hyppige, de kan markeres med ”S(……)S”, hvor parentesen
indeholder både det forkerte og rettelsen (fx ”..S(eftermiddagsk- T eftermiddagste)S..”
Tryk (forskellig tonal manifestation afhængig af dialekt).
” ´ ”: hovedtryk, anbringes før den trykstærke stavelse.
”STOre BOGstaver”: emfase, den emfatiske stavelse skrives med versaler.
”,” bitryk, anbringes før stavelsen med bitryk – vil nok blive anvendt sjældnere end hovedtryk og
emfase, og må kun bruges når hovedtryk også noteres (NB dette er det eneste kommategnet må
bruges til).
Intonation (forskellig tonal manifestation afhængig af dialekt).
”//”
afsluttende intonation, noteres finalt i tonegruppen.
”/”
videreførende intonation, noteres finalt i tonegruppen.
”[…..]” comment intonation (hovedtryk reduceres tonalt), noteres ved tonegruppens begyndelse
og afslutning (fx ”han er/[som de siger] et skvadderhoved//”, som i standardortografi
ville være ”Han er, som de siger, et skvadderhoved.”)
”#”
ekkospørgsmålsintonation, noteres finalt i tonegruppen (et eksempel er ”han kommer i
morgen#), som i standardortografi ville være ”Han kommer i morgen?”.
Vokal- og konsonantforlængelser markeres med
”:”
efter vokalen eller konsonanten (fx ”sto:re” og ”mass:e”).
5
Dansk Standard for udskrifter og registrering af talesprog
Småord der kan have en notation forskellig fra Retskrivningsordbogens: udtalen betinger i så fald
skrivemåden
og
at
af
ad
for fonetisk [å] noteres ”å” og for [åw] ”oG”
for fonetisk [a] noteres ”a”, for [å] ”å” og for [ad/t] ”aT”
for fonetisk [a(?)] noteres ”a” og for [a(?)f/v] ”aF”
for fonetisk [a(?)] noteres ”a” og for [að] ”aD”.
Når man ser på andre forskeres noteringskonventioner finder man ofte et meget større antal end
det her skitserede. De områder de dækker er: tempo, styrke, stemmekvalitet og en række
ekstralingvistiske størrelser som host og latter. Det mest praktiske er at notere disse faktorer i krøllet
parentes (fx ”(latter)” og ”(allegro)
Ud over de egentlige udskriftskonventioner er der erfaringsmæssigt brug for at fastlægge et
format for regibemærkninger, dvs. sådanne oplysninger om deltagernes mimik, bevægelser i
rummet, gestus, udnyttelse af ting og lignende som skønnes at hjælpe læseren til (bedre) at forstå
udskriften. Regibemærkninger kan fx skrives på en særskilt line i partituret, eller på anden måde
markeres entydigt.
I forbindelse med initativområdet er der udarbejdet et edb-program (til DOS) som er specielt
egent til udskrift efter Dansk Standard. Programmet, der hedder KUATEKST og som fylder 124
KB, fås gratis mod indsendelse af en diskette til:
Institut for dansk dialektforskning
Njalsgade 80
2300 København S
Til Mac´er er det bedste partiturudskrivningsprogram syncWriter. Det fås hos:
med-i-bit EDB-Beratungsgesellschaft mbH
Hohenfelder Strasse 20
D-2000 Hamburg 76
Deutschland
for 200 DM (1992-pris)
6