Hur kan vi använda korpusmaterial och teckenspråkslexikon i

Exempel på texttranskription i Excel
3b
...TIDNING SOM HETA A-L-L-E-R-S (a:R-dur) VÄNTA HAFT FÖRST FRÅGA POSS-c MAMMA
FUNGERA HUR PEK-c VARIT PEK-c LITEN FRÅGA FUNGERA BRA MED FÖRÄLDRAR DÖVA
MAMMA DÖV PEK-c VARIT FÖRR PEK-c SE BRA PEK-c SKÖTA TVÅ BARN SJÄLV INTE PEK-c
KLARA-SIG BRA VÄXA.-UPP BLI SÄMRE ÖGONEN BARN KÄNNA MAMMA SE SÄMRE BARN
FÖRSTÅ BYTA ÖVA TECKENSPRÅK TAKTILT UPPFATTA BÄTTRE BÄTTRE KÄNNA PEK-DOM
Hur kan vi använda korpusmaterial
och teckenspråkslexikon
i språkutbildningen?
NÖJD PÅ MAMMA FRÅGA-INTERVJUA OLIK KUNNA KLARA-SIG ALLT PEK-f FÅ LÄSA TIDNING
EFTER N-Y-Å-R-E-T
3a N-Y-Å-R
3b
NUMMER ETT ELLER TVÅ VETA INTE PEK-f FÅ SE SEN *
3a BRUKA BRUKA PEK-adr-k SKRIVA I P-T P-T-dur (1.3)
3b
I VAD
3a P-T
3b JA T-P JA
Johanna Mesch
Thomas Björkstrand
3a PEK-c MINNAS PEK-c SKRIVA SKICKA-c-f TILL DIG
3b
HA-INTE FÅTT-f-c PEK-c VÄNTA PÅ FÅ BREV VÄNTA-LÄNGE INTE KONSTIG FÅ INTE
NÅGONSTANS INTE *
3a HAFT PEK-adr SKRIVA SKICKA-c-fh SKICKA-c-fv-dur(.)
Rikskonferens för lärare i teckenspråk
Vänersborg 3 november 2010
3b
JA
3a FUNGERA BRA-dur(.)
3b BRA MEN IBLAND HAFT SKICKA-f VÄNTA I-N-G-R-I-D HA-INTE LÄST BREV PÅ FRÅN MIG PÅ
EN MÅNAD
Teckenspråksmaterial ~ 1500 tim?
Teckenspråk(en)
• Flyktigt, svårt att fånga
• Har inte skriftform
• Teckenspråkstexter kan lagras i form av video
2010-11-03
Johanna Mesch
Teckenspråksmaterial ~ 1500 tim?
• Konstruerade meningar i lexikon
• Konstruerade meningar i lexikon
• Forskares egna material
• Undervisningsmaterial
• Material från SDR, SIT, SVT osv
• Webbsidor (översättningar av myndigheters information)
• YouTube
2010-11-03
Johanna Mesch
Teckenspråk och teckenspråkiga – Kunskaps- och
forskningsöversikt 2006:29
”För svenska språket, i såväl skriven som talad form, finns
• Forskares egna material
numera allmänt tillgängliga databaser med stora
• Undervisningsmaterial
textmängder. Sådana korpora utgör i dag oumbärliga
• Material från SDR, SIT, SVT osv
•
Men inte annoterade, inte
Webbsidor (översättningar av myndigheters information)
heller sökbara
• YouTube
verktyg för många olika typer av studier av svenska språket.
Något motsvarande ”arkiv” med löpande text på
teckenspråk finns inte och det pågår ingen dokumentation
av olika typer av teckenspråksanvändning. //
Ett brett upplagt korpusarbete behövs för såväl
lexikonarbetet, som för fördjupad forskning om
teckenspråkets struktur, men också för barnspråksforskning
och forskning om tolkning mellan teckenspråk och svenska.”
2010-11-03
Johanna Mesch
2010-11-03
Johanna Mesch
1
Teckenspråk och teckenspråkiga – Kunskaps- och
forskningsöversikt 2006:29
”För svenska språket, i såväl skriven som talad form, finns
numera allmänt tillgängliga databaser med stora
textmängder. Sådana korpora utgör i dag oumbärliga
verktyg för många olika typer av studier av svenska språket.
Något motsvarande ”arkiv” med löpande text på
Något motsvarande ”arkiv”
av olika typer
av teckenspråksanvändning.
//
med
löpande text på
Ett brett upplagt
korpusarbete behövs
för såväl
teckenspråk
finns
inte
teckenspråk finns inte och det pågår ingen dokumentation
lexikonarbetet, som för fördjupad forskning om
teckenspråkets struktur, men också för barnspråksforskning
Bidrag från Riksbankens
jubileumsfond 2009-2011
• Att påbörja och skapa förutsättningar för ett
långsiktigt arbete med en svensk
teckenspråkskorpus
– för att på sikt kunna utföra korpusbaserade studier
av teckenförrådet och av teckenspråkets
grammatiska struktur
och forskning om tolkning mellan teckenspråk och svenska.”
2010-11-03
Johanna Mesch
Vad är en teckenspråkskorpus?
2010-11-03
Johanna Mesch
Fabelberättelser från 2004 är
transkriberade och tillgängliga
• Datorläsbar text
• Naturligt förekommande språk (representativt)
• ELAN-program (annotera, söka, visa, sortera, räkna)
• Hitta information om region, åldergrupp, skolgång osv
• Annoteringar, t.ex. glosor och svensk översättning
2010-11-03
Johanna Mesch
2010-11-03
Johanna Mesch
2010-11-03
Johanna Mesch
2010-11-03
Johanna Mesch
2
Att skapa en teckenspråkskorpus
Nyttan av teckenspråkskorpusen?
– Planering, bygga upp
videostudio
– Inspelningar med informanter,
ca 2 timmar
– Redigering
– Annoteringsarbete
– Granskning
– Metadata
– Uppläggning av materialet
• Utveckling av Svenskt teckenspråkslexikon
• Framtida studier i teckenspråksgrammatik,
sociolingvistik, språkundervisning, historisk
lingvistik, kulturstudier, tolkning
• Undervisning tack vare tillgänglighet av
databasen
2010-11-03
Johanna Mesch
2010-11-03
Johanna Mesch
Informanters hemort
Deltagande i korpusprojektet
• just nu 34 av 40 kvinnor och män i åldrarna 2082 från tre regioner: Norrland, Svealand och
Götaland
Norrland 3
Svealand 22
• T.ex. Piteå, Sundsvall, Leksand, Stockholm,
Örebro, Vänersborg, Trollhättan, Kalmar,
Göteborg och Malmö
Götaland 9
Kvinnor 19
Män 15
Bildkälla: Lapplänning
2010-11-03
Johanna Mesch
2010-11-03
Vilken skola?
Johanna Mesch
Ålder?
Dövskola i Härnösand 6
Dövskola i Örebro 4
Dövskola i Stockholm 4
Dövskola i Vänersborg 7
20-29 30-39
Totalt
9
5
40-49
5
50-59
3
60-69 70-
8
4
Hörselklass/kommunal klass 4
Integrerad 3
Dövskola i Lund 5
Hörande 1
2010-11-03
Johanna Mesch
2010-11-03
Johanna Mesch
3
Upplägg - 2 timmar
• Presentation
Annoteringsarbete
• Samtalsämnen (t.ex. släkt, arbetsplats, föreningsliv,
fritidsaktiviteter, evenemang)
• Tidskrävande!!
• Berättelser (den viktigaste händelsen i livet eller en
favoritfilm)
• Elicitering – återberätta till partner
•
•
•
•
2010-11-03
• Aktuellt för korpusprojektet:
– Glosor
– Svensk översättning
Bildbok: Groda - var är du?
Bildbok: Snögubben
Bildserie
Avsnitt från någon komedifilm (Mr Bean, Plankan)
Johanna Mesch
2010-11-03
Johanna Mesch
Mediafönster i ELAN
Två mediafönster
2010-11-03
2010-11-03
Johanna Mesch
2010-11-03
Johanna Mesch
Johanna Mesch
Fyra mediafönster
2010-11-03
Johanna Mesch
4
Korpus
2010-11-03
Johanna Mesch
2010-11-03
<>>
Lexikon
Johanna Mesch
Teckenspråkslexikon
Lexikondatabasen
• Används det i språkutbildningen i praktiken?
• Under 2010 har lexikonverksamheten på
Institutionen för lingvistik utvecklat
lexikondatabasen kontinuerligt och antalet
dokumenterade tecken är nu uppe i 12 461.
2010-11-03
2010-11-03
Johanna Mesch
Databas
År
Antal
tecken
Antal
meningar
Svenskt teckenspråkslexikon 2010
29 okt 2010
6006
(+ 1025
varianter)
1867
uppdateras
kontinuerligt
Sjukvård
2010 (juli)
911
-
Siffertecken
2008 (sept)
179
(581
videosekvenser)
Sex och samlevnad
2007 (nov)
391
-
Kyrkliga tecken
2006 (dec)
568
-
Tecken för svenska landskap och
orter
2006 (maj)
515
-
Tecken för begrepp inom
Språkvetenskap
2005 (jan)
414
-
Tecken inom området bridge
2005
370
-
Tecken för matematiska begrepp
2004
469
-
Digital version av Svenskt
teckenspråkslexikon
2001
3132
-
Johanna Mesch
Vi tar en närmare titt på
korpusprojektet och
lexikondatabasen
www.ling.su.se/tsp
2010-11-03
Johanna Mesch
5