Kodningspraxis för Zacharias Topelius Skrifter Thomas Gartz – Anna Movall – Elisa Veit – redaktionen för ZTS 2008–2013 1 INLEDNING .......................................................................................................................................................... 4 1.1 OM ZTS KODNINGSMANUAL....................................................................................................................................... 4 1.2 AUTOMATISKT OCH MANUELLT .................................................................................................................................... 4 1.3 FILSTRUKTURER ........................................................................................................................................................ 6 2 KODNING AV ALLMÄNNA TEXTUELLA FÖRETEELSER ......................................................................................... 10 2.1 PAGINERING, RUBRIKER, STYCKEN OCH FOTNOTER ......................................................................................................... 10 Paginering och sidbrytning ................................................................................................................................. 10 Titlar och rubriker ............................................................................................................................................... 11 Nytt avsnitt ......................................................................................................................................................... 12 Textstycken ......................................................................................................................................................... 12 Fotnoter och slutnoter ........................................................................................................................................ 14 2.2 LISTOR, TABELLER OCH KALKYLER ............................................................................................................................... 15 Listor ................................................................................................................................................................... 15 Tabeller ............................................................................................................................................................... 15 Kalkyler ............................................................................................................................................................... 17 2.3 GRAFISKA MARKERINGAR ......................................................................................................................................... 18 Grafiskt markerade personer, platser och verk samt främmande språk ............................................................ 20 Universalattributet rend ..................................................................................................................................... 20 2.4 SPECIELLA TECKEN................................................................................................................................................... 21 Förbjudna tecken ................................................................................................................................................ 21 Specialtecken ...................................................................................................................................................... 22 Hårt blanksteg och smalt hårt blanksteg ........................................................................................................... 23 Bråktal ................................................................................................................................................................ 24 3 MANUSKRIPTBESKRIVANDE KODNING .............................................................................................................. 26 3.1 ALLMÄNNA TEXTUELLA FÖRETEELSER .......................................................................................................................... 26 Paginering, rubriker, stycken och fotnoter ......................................................................................................... 26 Listor, tabeller och kalkyler ................................................................................................................................. 26 Grafiska markeringar .......................................................................................................................................... 26 Speciella tecken .................................................................................................................................................. 27 3.2 DATERING OCH TILLKOMSTORT .................................................................................................................................. 27 3.3 OLÄSLIGT, SVÅRLÄST OCH SAKNAT .............................................................................................................................. 29 Oläsligt................................................................................................................................................................ 29 Svårläst ............................................................................................................................................................... 30 Saknade bokstäver, tecken eller ord ................................................................................................................... 31 Tomrum i texten ................................................................................................................................................. 32 3.4 MANUSKRIPTFÖRKORTNINGAR OCH SKRIBENTENS KOMMENTARER ................................................................................... 32 Utskrivning av manuskriptförkortningar ............................................................................................................ 32 Skribentens kommentarer .................................................................................................................................. 32 3.5 HÄNDER OCH PENNOR ............................................................................................................................................. 32 I TEI Header ........................................................................................................................................................ 32 I den löpande texten ........................................................................................................................................... 34 I tillägg, strykningar, ändringar och fotnoter ..................................................................................................... 35 I understrykningar .............................................................................................................................................. 37 3.6 ÄNDRINGAR .......................................................................................................................................................... 37 Strykningar ......................................................................................................................................................... 37 Ersättningar ........................................................................................................................................................ 38 Tillägg ................................................................................................................................................................. 39 Omfattande tillägg och strykningar ................................................................................................................... 42 Ändrad ordningsföljd och flyttad text ................................................................................................................. 44 Återtaget ............................................................................................................................................................ 46 Sofortkorrekturer ................................................................................................................................................ 46 4 SEMANTISK KODNING ....................................................................................................................................... 48 4.1 PERSONNAMN ....................................................................................................................................................... 48 4.2 GEOGRAFISKA NAMN............................................................................................................................................... 51 4.3 NAMN PÅ INSTITUTIONER ......................................................................................................................................... 56 4.4 VERKTITLAR ........................................................................................................................................................... 56 4.5 FRÄMMANDE SPRÅK ................................................................................................................................................ 58 4.6 DUBBEL KODNING ................................................................................................................................................... 60 5 UTGIVARENS ÄNDRINGAR ................................................................................................................................. 62 5.1 MINDRE NORMALISERINGAR ..................................................................................................................................... 62 5.2 KOMPLETTERINGAR ................................................................................................................................................. 63 5.3 RÄTTELSER I ORIGINALET .......................................................................................................................................... 64 5.4 ÖVRIGA UTGIVARINGREPP ........................................................................................................................................ 64 5.5 AVGRÄNSNING AV KODNING, SAMMANFALL MED ANNAN KODNING .................................................................................. 66 Avgränsning av kodning vid utgivarändringar ................................................................................................... 66 Utgivarändringar och övrig kodning................................................................................................................... 66 6 VARIANTER........................................................................................................................................................ 68 6.1 KATEGORISERING OCH KODNING ................................................................................................................................ 68 Substantiella varianter ....................................................................................................................................... 69 Ortografiska/typografiska varianter .................................................................................................................. 69 Interpunktionsvarianter ...................................................................................................................................... 69 Positiva varianter ................................................................................................................................................ 70 Flera variantkategorier inom samma variant..................................................................................................... 70 Skillnader som inte utgör varianter .................................................................................................................... 70 Avgränsningen av varianter ............................................................................................................................... 71 Varians inom ett stycke eller en strof ................................................................................................................. 72 Varianter-i-varianter........................................................................................................................................... 77 Sammanfall med annan kodning ........................................................................................................................ 78 Mycket omfattande strukturell avvikelse (fallet Hertiginnan af Finland) ........................................................... 79 7 KOMMENTARER ................................................................................................................................................ 81 7.1 TIDIGARE KODNINGSPRAXIS ...................................................................................................................................... 81 7.2 UPPGIFTER OM PERSONER, ORTER OCH VERKTITLAR ....................................................................................................... 82 8 GENRESPECIFIKT ................................................................................................................................................ 83 8.1 PROSA .................................................................................................................................................................. 83 8.2 LYRIK ................................................................................................................................................................... 83 Allmänt ............................................................................................................................................................... 84 Kodning av diktmanuskript ................................................................................................................................. 86 Kodning av ofullständigt ..................................................................................................................................... 89 Kodning av etablerad text .................................................................................................................................. 89 Exempel på kodad dikt........................................................................................................................................ 89 8.3 BREV .................................................................................................................................................................... 90 2 Inledande del ...................................................................................................................................................... 90 Löpande text ....................................................................................................................................................... 92 Avslutande del .................................................................................................................................................... 95 Tidigare och senare brevdel ................................................................................................................................ 97 Tillägg i marginalerna eller där den löpande texten vanligen finns ................................................................... 98 Exempel på kodat brev ....................................................................................................................................... 99 Telegram ........................................................................................................................................................... 100 Exempel på kodat telegram .............................................................................................................................. 100 8.4 DRAMATIK .......................................................................................................................................................... 101 8.5 DAGBÖCKER ........................................................................................................................................................ 106 8.6 FÖRELÄSNINGAR................................................................................................................................................... 107 9 FÖRTECKNINGAR ..............................................................................................................................................110 9.1 ELEMENT, ATTRIBUT OCH ATTRIBUTVÄRDEN ............................................................................................................... 110 9.2 SPECIALTECKEN (ENTITETER) ................................................................................................................................... 132 Förbjudna tecken .............................................................................................................................................. 132 Specialtecken som införs som tecken ............................................................................................................... 132 Specialtecken som anges med numerisk entitetsreferens ................................................................................ 134 9.3 TEI-MODULER ..................................................................................................................................................... 137 9.4 ELEMENT I TEI HEADER ......................................................................................................................................... 137 3 1 Inledning 1.1 Om ZTS kodningsmanual Uppdaterad 23.9.2013 Utgångspunkten för den textkodning som används inom ZACHARIAS TOPELIUS SKRIFTER är det s.k. Text Encoding Initiative, förkortat TEI. Dess senaste version, benämnd P5, kan studeras på nätet under adressen www.tei-c.org/Guidelines/P5. TEI utgör den yttre ramen för utgåvans kodningspraxis: vi bestämmer själva vad vi kodar och vad vi inte kodar, och t.ex. i vilka kategorier vi indelar varianter och kommentarer. Det är ytterst viktigt att alla konsekvent följer samma kodningspraxis, annars uppstår problem vid visning, maskinell sökning och framställning av böcker. All ny kodning som tas i bruk bör därför införas i denna kodningsmanual. I detta dokument är alla taggar fetade och i blå färg, attributen är orange och attributvärdena bruna. Texten i exemplen återges i grönt. Färgerna och fetstilen gör instruktionerna mer lättlästa och kodandet enklare, och motsvarar de färger som används i XML-editorn Oxygen. XML skiljer på versaler (”stora bokstäver”) och gemener (”små bokstäver”), så i detta hänseende bör man vara noga med att följa skrivsättet i instruktionerna. Som regel används gemener i kodningen, men versaler förekommer t.ex. i hexadecimala tal och i elementnamn, attribut och attributvärden som består av två sammanskrivna ord: <placeName>, spanTo, noBorder. Observera också att taggarna måste öppnas och stängas i en given ordningsföljd: den först öppnade taggen stängs sist och den senast öppnade taggen stängs först: Ex.1: <p><hi rend="underline">[understruken text]</hi></p> Den första versionen av ZTS kodningsmanual skapades 2008. Manualen är avsedd att fungera både som dokumentation av vår textkodningspraxis och som ett hjälpmedel i det dagliga arbetet. Den uppdateras och utvidgas kontinuerligt av redaktionen för ZTS. I denna version ingår inte några avsnitt som innehåller instruktioner för användning av programvara. Instruktioner för intern länkning, som delvis görs i HTML, har också utelämnats men de använda elementen tas upp i förteckningen 9.1. 1.2 Automatiskt och manuellt Uppdaterad 24.9.2013 För tryckta grundtexter inleds det praktiska arbetet med att texten skannas. Därmed erhålls digitala faksimil av textsidorna. Dessa faksimil utgör bilder i datatekniskt hänseende, och de omvandlas till text genom s.k. OCR-behandling, där OCR står för Optical Character Recognition. Detta arbetsmoment resulterar i en råtext, som alltid innehåller en del teckentolkningsfel. Råtexten måste alltså alltid granskas, d.v.s. kollationeras mot originalet. Skanning och OCRbehandling utförs inte inom redaktionen, utan av en utomstående specialist. 4 I samband med OCR-behandlingen förses texten automatiskt med en grundläggande TEIkodning. Den automatiska kodningen omfattar allt som krävs för att texten ska kunna gestaltas på samma sätt som i originalet, vilket innebär kodning av rubriker, styckeindelning, paginering, (fot)noter och grafiska markeringar som t.ex. kursiveringar. Med hjälp av ett TEI-filter kan textfilerna ändå kollationeras i en vanlig ordbehandlare utan att kodningen syns, och dessutom med stavningskontroll för 1800-talssvenska. TEI-filtret fungerar i två riktningar: det konverterar först de automatiskt kodade filerna till OpenOffice.org:s filformat odt, och när texten är kollationerad konverterar det den tillbaka till XML/TEI.1 I samband med kollationeringen i ordbehandlaren korrigeras främst teckentolkningsfel, men om t.ex. en styckeindelning har fallit bort kan den införas i form av en s.k. mall. Styckeindelningen eller mallen i ordbehandlaren ”översätts” sedan till kodning av TEI-filtret. Mallarna utgör alltså ordbehandlarens motsvarighet till kodning, vilket innebär att om t.ex. ”55” i TEI-filen är kodat som ett sidnummer, så syns det i ordbehandlaren mot en rödfärgad bakgrund. Det förekommer att det saknas kod för något sidnummer i råtexten, och i sådana fall kan man införa den i ordbehandlaren i form av en mall: antingen en character style eller en paragraph style, beroende på om sidnumret finns inne i ett textstycke eller mellan två stycken. Det syns i ordbehandlaren om det finns direkta fel i den automatiska kodningen. Det kan gälla blanksteg före och efter <pb/>-element, kodning av styckeindelning eller styckeindrag, eller att betydelsebärande ornament inte är återgivna i råtexten. Skilda instruktioner har utarbetats för kollationeringsmomentet (”Kollationering med OpenOffice.org”, Thomas Gartz 6.3.2009, 18 s., pdf-fil). Efter kollationeringen kvarstår förhoppningsvis inga teckentolkningsfel i texten. Originalets sättnings- och tryckfel korrigeras däremot först i kodningen. De förtecknas emellertid i samband med kollationeringen, i likhet med alla ”suspekta” textställen, t.ex. ord som verkar saknas i originalet. En del ovanliga specialtecken och bråktal måste också införas i samband med den manuella kodningen. Därtill kan kodningen som genererats av TEI-filtret i många fall vara onödigt fragmentarisk till följd av att t.ex. kursiveringar av hela meningar automatiskt kodas ord för ord i stället för som en helhet. Även om textfilerna formellt sett är TEI-kodade är det i praktiken snarast frågan om en kodning på HTML-nivå: textfilerna har enbart försetts med en kodning som registrerar hur texten har gestaltats i originalet. Kännetecknade för XML- och TEI-kodning är att man inte enbart kodar t.ex. att ett ord är kursiverat, utan om möjligt också varför det har kursiverats: främmande språk, namn etc. Sådan semantisk kodning måste införas manuellt. Den manuella kodningen behövs också för allt som utgivarna tillför texterna, och för att registrera alla ingrepp som utgivarna gör i texten. Tryckfel kan korrigeras också utan kodning, men TEI-kodningen gör det möjligt att registrera var utgivarna har gjort ingrepp i texten, och 1 Observera att TEI-filtret endast fungerar med OpenOffice.org 2, inte med den nyare versionen OpenOffice.org 3. 5 hur textstället ifråga ser ut i originalet. I den mån texter normaliseras registreras också den ursprungliga textbilden.2 Förutom att grafiska markeringar kodas på ett mer avancerat sätt i TEI än i HTML kodar man i TEI vanligen också en del textinslag som inte har framhävts i originalet. Det kan gälla t.ex. olika slag av namn eller inslag på främmande språk. Kodningen av omarkerade textinslag utgör en en grundkodning, som gör det möjligt att införa länkar. Den kan också utnyttjas för att framhäva olika textinslag med hjälp av bakgrundsfärg, för redaktionella ändamål (t.ex. genererande av listor med inslag på grekiska) och av sökmotorer som utnyttjar XML-kodning. TEI:s mer avancerade kodning av grafiskt markerade textinslag tjänar samma syften som kodningen av omarkerade inslag, men innebär därtill att man vid visning kan välja att t.ex. ersätta spärrning med kursivering endast i vissa fall. Om grundtexten är ett manuskript måste hela texten skrivas in manuellt, alltså transkriberas. En startmall underlättar arbetet såtillvida att mallen innehåller den kodning som finns i början av alla texter av en viss typ, t.ex. brev eller diktmanuskript, och ett genrespecifikt schema känner till exakt vilka element, attribut och värden som är möjliga. id:n som möjliggör länkning av person- och ortnamn samt verktitlar behöver inte införas helt manuellt, utan detta görs halvautomatiskt med programmet TEI Id Selector. Programmet underlättar införandet av id:n radikalt. När man öppnar en XML/TEI-fil i programmet visas en lång förteckning över t.ex. de namn på personer som förekommer i texten. I en annan kolumn visas det sammanhang (ett par textrader) där namnet förekommer, och i en tredje kolumn visas de personposter som redan är införda i databasen. Ifall den person som ett namn refererar till redan ingår i persondatabasen krävs det bara ett par klick för att namnförekomsten ska förses med ett för personen unikt id. I de fall då det visar sig att personen ifråga ännu inte har införts i databasen lägger man till en post (denna funktion är alltså integrerad i TEI Id Selector). Posten förses automatiskt med ett unikt id – kodaren behöver alltså aldrig själv hålla reda på vilka id:n som redan har tagits i bruk. 1.3 Filstrukturer Uppdaterad 20.9.2013 Indelning i filer Grundtexten kodas i en huvudfil tillsammans med utgivarens ändringar, vilket gör den till den etablerade texten. Kommentarerna har för Ljungblommor och Finland framställdt i teckningar också ingått i huvudfilen, men i och med Kommentarverktygets ibruktagande 2011 skrivs kommentarer inte längre in i huvudfilen. Standardkommentarer om personer, orter och verktitlar har redan tidigare införts i en databas, så att det i huvudfilen därmed endast ingår ett id som hänvisar till kommentaren. 2 Detta med undantag för små konsekvensändringar (som enbart markeras med <reg>-taggar). 6 Varianter kodas i en skild fil som innehåller grundtexten med kodning av allmänna textuella företeelser, men inte utgivarens ändringar. De övriga textversionerna förses likaså enbart med kodning för allmänna textuella företeelser. För texter som har externa varianter bör man alltså alltid spara en skild fil som endast innehåller grundtexten, som man sedan kan arbeta vidare med när varianterna kodas. TEI Header I motsats till TEI-kodningen i övrigt är informationen i TEI Header inte knuten till något visst textställe, utan den beskriver filen på ett övergripande plan. TEI Header kan jämföras med titelsidan i ett tryckt verk. Den kan innehålla information om själva texten, dess ev. tryckta förlaga, kodningen, revideringar m.m. En TEI Header införs i början av varje XML/TEI-fil, och kodas i ett <teiHeader>-element samt i underordnade element för information av olika slag. TEI Header bör i likhet med själva den kodade texten vara underordnat rotelementet <TEI>, som alltså öppnas alldeles i början av ett XML/TEI-dokument och stängs till sist. TEI Header kan ha följande beståndsdelar: 1) en filbeskrivning, som kodas i elementet <fileDesc> 2) en kodningsbeskrivning, som införs i <encodingDesc> och också kan innehålla information om förhållandet mellan den digitala texten och dess tryckta förlaga (t.ex. om ev. normaliseringar) 3) en textprofil, som införs i elementet <profileDesc> och kan innehålla information om textens ämnesområde, vem eller vilka som skrivit den o.s.v. 4) en förteckning över revideringar, som kodas i <revisionDesc> Av dessa fyra huvudkategorier utgör endast <fileDesc> ett vanligen obligatoriskt inslag i TEI Header. I filer som innehåller variantkodning måste emellertid också <encodingDesc> ingå i TEI Header, och <profileDesc> behövs om det finns flera händer i ett manuskript. Informationen i de olika huvudkategorierna struktureras därtill med hjälp av följande elementtyper: a) grupperingselement (ex.: <editionStmt>, <titleStmt>), som innesluter ett antal element med en viss slags information b) deklarationer (ex.: <tagsDecl>, <refsDecl>), i vilka redogörs för vilken kodningspraxis man följt i olika hänseenden c) beskrivningar (ex.: <settingDesc>, <projectDesc>), som innehåller beskrivningar som antingen kan vara fritt formulerade eller anges i diverse underordnade element Den obligatoriska huvudbeståndsdelen <fileDesc> bör innehålla en bibliografisk beskrivning av den elektroniska texten. <fileDesc> kan innehålla sju underelement, av vilka tre är obligatoriska: <titleStmt>, <publicationStmt> samt <sourceDesc>. En ”minimi-TEI-Header” ser alltså ut på följande sätt: 7 <teiHeader> <fileDesc> <titleStmt>[...]</titleStmt> <publicationStmt>[...]</publicationStmt> <sourceDesc>[...]</sourceDesc> </fileDesc> </teiHeader> Observera att elementen som är underordnade <fileDesc> bör införas i en viss ordningsföljd. Ifråga om de tre obligatoriska elementen är den rätta ordningsföljden alltså 1) <titleStmt>, 2) <publicationStmt> och 3) <sourceDesc>. I <titleStmt> införs ett <title>-element i vilket anges brevets eller manuskriptets signum. I ett <respStmt> – som också är underordnat <titleStmt> – uppges i elementen <resp> och <name> vem som är ansvarig redaktör för texten ifråga. I <publicationStmt> införs endast en <publisher>-tagg med innehållet Zacharias Topelius Skrifter. I <sourceDesc> uppges (i <p>taggar) Arkivsignum: se databas. Om det finns flera händer anges de i <handNotes>, som alltså är underordnat <profileDesc>. De enskilda händerna införs i <handNote>-taggar. OBS: En separat förteckning över alla element, attribut och -värden som kan ingå i Headern finns i slutet av manualen, se kapitel 9.4. Strukturelement <text><body> All etablerad text bör omslutas av elementet <body>, som i sin tur bör finns inuti <text>. De öppnas alltså i början av den etablerade texten, genast efter </teiHeader>, och stängs sist i filen, dock före rotelementet </TEI>, i den omvända ordningsföljden </body> </text>. <div> Texten i en XML/TEI-fil − d.v.s. innehållet i <body> − kan vid behov indelas i textsektioner (i kodningstekniskt hänseende) som består av t.ex. enskilda kapitel eller dikter. Detta sker med <div>-element, som kan vara antingen numrerade eller onumrerade. De numrerade elementen <div1> ... <div7> kan användas om man anser att det finns ett behov av en hierarkisk indelning av texten i större och mindre avsnitt, så att ett kapitel t.ex. alltid avgränsas med <div4>. I vår kodningspraxis har vi ändå åtminstone tillsvidare gått in för att använda enbart onumrerade <div>-element. Man får inte använda både numrerade och onumrerade <div>element i en och samma XML/TEI-fil. I <div>-elementet kan attributet type användas för att ange vilken slags textsektion det är fråga om, t.ex. <div type="chapter">. Vi utnyttjar också <div> för att ange att ett diktmanuskript är oavslutat, och för att − i en del specialfall − indela brev i en tidigare och en senare del. I bägge fallen används attributet part vid sidan av type, t.ex. som i <div type="poem" part="y">. I lyrikkodningen (filerna med etablerad text) 8 avgränsas kommentardelen med hjälp av elementet ifråga. Därtill kan attributet xml:lang användas i <div>, ifall t.ex. ett brev i sin helhet är skrivet på ett annat språk än svenska. <milestone/> Vid sidan av <div>-elementet har vi också tagit i bruk ett <milestone/>-element för att koda textindelningar. I motsats till <text>, <body> och <div> innesluter <milestone/> inte någon text, utan är ett tomt element. I vår kodning används det i kombination med unit="part" för att registrera indelningar i avsnitt, som t.ex. markerats med blankrad i originalen. 9 2 Kodning av allmänna textuella företeelser 2.1 Paginering, rubriker, stycken och fotnoter Uppdaterad 11.9.2012 Paginering och sidbrytning Pagineringstaggen <pb/> placeras i sidbrytningen och sidnumret avser efterföljande sida (pb står för page break). Utgångspunkten är att sidnumret är utskrivet, d.v.s. man behöver aldrig explicit ange type="printed" (tryckta texter) eller type="written" (manuskript). Endast själva sidnumret (arabiskt eller romerskt) införs i pagineringskodningen. Eventuella föregående ”s.” eller efterföljande punkter utelämnas. Felaktiga sidnummer korrigeras stillatigande. Ifall ett sidnummer i ett manuskript har ändrats införs enbart det slutliga numret, själva ändringen kodas alltså inte. Om sidnumret finns inne i ett textstycke: blanksteg efter (men inte före) pagineringstaggen! Om sidnumret finns inne i ett ord: inga blanksteg, bindestreck avlägsnas. a) originalets paginering, tryckt text <p>Här slutar sidan 7<pb type="orig" n="8"/> och här börjar sidan 8.</p> <p>Här sker sid<pb type="orig unprinted" n="15"/>brytningen mitt i ett ord.</p> Ifall sidnumret inte är utskrivet men sidan ändå har beaktats i den fortsatta pagineringen anges värdet unprinted i attributet type,3 och det outskrivna sidnumret införs i n. <pb type="orig"/> Om sidan inte beaktats vid pagineringen införs inget n-attribut. b) originalets paginering, manuskript Paginering som införts av författaren: <p>Här slutar s. 53.</p><pb type="author" n="54"/><p>Här börjar s. 54.</p> <lg><l>versrad</l><pb type="author unwritten" n="55"/><l>versrad</l></lg> Ifall ett enskilt sidnummer inte är utskrivet men sidan ändå har beaktats i den fortsatta pagineringen, eller om författarens paginering kompletteras av utgivaren, anges värdet unwritten i attributet type, och det oskrivna sidnumret införs i n. Om sidan ifråga inte beaktats vid pagineringen införs inget n-attribut. Paginering införd senare av annan person: <pb type="other" n="22"/> 3 Enligt TEI-riktlinjerna (P5) borde man egentligen använda ett ed-attribut i <pb/>, men vi använder type eftersom attributvärdena syftar på såväl utgåva som enskild sidnumrering. 10 <pb type="other unwritten" n="81"/> Ifall ett enskilt sidnummer inte är utskrivet men sidan ändå har beaktats i den fortsatta pagineringen, eller om manuskriptets paginering kompletteras av utgivaren, anges värdet unwritten i attributet type, och det oskrivna sidnumret införs i n. Om sidan ifråga inte beaktats vid pagineringen införs inget n-attribut. OBS: senare in- och sammanbundna manuskript kan ha dubbel paginering: en ursprunglig av Topelius som löper per häfte, och en senare tillkommen av annan hand som löper per arkivenhet. I ett sådant fall införs bägge pagineringarna på följande sätt: <pb type="author" n="3"/><pb type="other" n="53"/> Ifall ingendera pagineringen har införts av författaren: <pb type="other" n="3"/><pb type="other2" n="53"/> Den första pagineringsserien anges alltså som other, inte som other1. c) Paginering i ZTS: Efter att texten har ombrutits för den tryckta versionen införs vår utgåvas paginering och sidbrytning i kodningen: <pb type="ZTS" n="8"/> (utskrivet sidnummer) <pb type="ZTS unprinted" n="15"/> (outskrivet sidnummer) <pb type="ZTS"/> (sidbrytning; sidan obeaktad vid paginering) Titlar och rubriker Titlar och rubriker kodas med elementet <head>. Ifall en rubrik är fördelad på flera rader och detta inte skett enbart av utrymmesskäl används det tomma radbrytningselementet <lb/> inne i <head>. Observera att <lb/> i så fall inte ska föregås eller efterföljas av blanksteg. Verktitlar och avdelningsrubriker: Verktitlar kodas med <head> (<title>-elementet markerar omnämnda verk, inte rubriker). I <head> anges type="title". Avdelningsrubriker i lyriksamlingar, tidigare och senare delar i romaner och andra liknande sektionsrubriker kodas som type="section". Ex. 1: <head type="title">Hertiginnan af Finland</head> Ex. 2: <head type="section">Förra afdelningen. Kriget.</head> För eventuella rubriknivåer mellan <head type="section"> och <head> kan <head type="section2">, <head type="section3"> o.s.v. användas. Kapitelrubriker: Ex. 1: <head>1. En middag under den gamla goda tiden.</head> Motton, citat etc. i anslutning till rubrik eller titel: 11 Ex. 1: <head type="motto"><foreign xml:lang="lat">Mensis priore lætior, quamquam valde ægrotans.</foreign></head> Rubriker på lägre nivå: För rubriker på lägre nivå än den som kodas med enbart <head> används <head type="sub">, <head type="sub2">, <head type="sub3"> o.s.v. beroende på hur många rubriknivåer det finns. <head type="sub"> kan också beteckna en underrubrik till <head type="title">: Ex. 1: <head type="title"><persName>Vernas</persName> rosor.</head><head type="sub">Novell.</head> Verk-i-verk: Titlar för ”verk-i-verk” – t.ex. ”Röfvarebandets hjeltevisa.” i Läsning för barn – kodas med <head type="incorp"> (står för incorporated work). Senare införs ev. också <div>-kodning med vilken själva verket-i-verket avgränsas. Rubriker i brev: Ifall det i ett brev istället för en öppningshälsning finns en rubrik av något slag används <head type="letter">. Brevrubrikerna ska i visningen vara mindre till storleken än vanliga rubriker i andra genrer och specificeras därför med attribut och attributvärde. Grafiska markeringar: Ifall en rubrik eller titel i sin helhet är grafiskt markerad (t.ex. kursiverad) kan attributet rend införas i direkt i <head>. Om rubriken endast delvis är grafiskt markerad används <hi> inne i <head>: Ex. 1: <head rend="italics">1. En middag under den gamla goda tiden.</head> Ex. 2: <head>1. <hi rend="italics">En middag under [...] tiden.</hi></head> Ifall t.ex. en avdelningsrubrik är fetad, och man vill registrera det i kodningen, anges både type och rend i <head>: Ex. 3: <head type="section" rend="bold">Förra afdelningen. Kriget.</head> Nytt avsnitt Ifall början på ett nytt avsnitt i originalet har markerats med en blankrad kodas detta enbart med <milestone unit="part"/>. Ingen blankrad ska alltså införas i kodningen. Ifall indelningen i avsnitt i originalet framhävs med en skiljelinje eller ett avlångt ornament anges detta med attributet type, som tilldelas värdet bar: <milestone type="bar"/> Motsvarande streck allra sist i kapitel kan betraktas som dekorationer och återges inte. Textstycken 12 Textstycken kodas med <p>-taggar (paragraph). Originalets radbrytningar kodas endast i de undantagsfall då de uppfattas som betydelsebärande, och då med <lb/>. Textstycke med indrag: <p>Några ögonblick derefter lågo de gamle vännerne Severin Björck, benämnd Mösset, och Vincent Ek, benämnd Vågbrytaren, i hvarandras armar.</p> Textstycke utan indrag: (t.ex. i början av ett kapitel) <p rend="noIndent">Ordentlighet är en mycket berömlig dygd i alla förhållanden, men jag fruktar, att dess hemvist sällan är att söka på en författares skrifbord.</p> Helt indraget textstycke/blockcitat: (samtliga rader indragna) <p rend="parIndent">[textstycke]</p> Grafiskt markerade stycken: Ifall ett textstycke är grafiskt markerat i sin helhet (med t.ex. kursivering) får attributet rend enligt vår kodningspraxis inte användas direkt i <p>. Istället införs rend i <hi>: <p><hi rend="italics">[kursiverat textstycke]</hi></p>. Centrerat inslag: <p rend="center">[textstycke]</p> Centrering anges med attributet rend och värdet center. <p rend="center"> innebär att samtliga rader i stycket centreras: flera centrerade rader som utgör en enda mening eller annars kan uppfattas höra till samma stycke kan alltså införas i ett enda <p>-element i vilket radbrytningar (som inte enbart beror på utrymmesbrist) kodas med det tomma elementet <lb/>. Centrerad underskrift, flera rader: <p rend="center"><persName>Lars Anton Levonius</persName>,<lb/>Regementspastor.<lb/>(Sigill.)</p> Observera att det inte ska vara några blanksteg kring <lb/>-taggarna. (I brevkodningen standardiseras avslutningar och underskrifternas placering.) Högerställt inslag: <p rend="right">[textstycke]</p> Blankrader: Blankrader som inte markerar början på ett nytt avsnitt kan vid behov införas som ett tomt <lb/>-element. Man ska undvika att återge blankrader i form av tomma <p/>-element eftersom de inte utgör textstycken. Observera att blankrader inte ska införas i kodningen ifall de finns i 13 anslutning till rubriker eller runt diktstrofer: i sådana fall kan standardiserade mellanrum åstadkommas i stilmallarna. Fotnoter och slutnoter Not som tillhör originalet: <note id="ftn1" n="1" place="foot" anchored="true">Vid denna tid fortfor man ännu ofta att med Finland mena endast landets sydvestra del, det sedan så kallade Egentliga Finland.</note> Ett id bör förekomma endast en gång i hela XML-filen, därför används för originalets (fot)noter id:n med prefixet ftn och löpande numrering som börjar med 1. Om noten i originalet är belägen längst ner på sidan anges värdet foot i attributet place. För noter i manuskript används attributvärdena foot, leftMargin, rightMargin, topMargin och other, beroende på var noten skrivits in. Om noten i stället är placerad i slutet av hela texten är attributvärdet end. Med värdet true i attributet anchored anges att noten är förankrad i det aktuella textstället med exempelvis asterisk eller nummer. För noter som inte har knutits till ett visst textställe används anchored="false". <note>-elementet har också använts för kodning av utgivarkommentarer (innan det nuvarande kommentarverktyget togs i bruk), men det förvalda värdet är att noten tillhör originalet. Man behöver alltså aldrig explicit ange type="author", type="original" eller motsvarande. Däremot anges i utgivarkommentarer alltid type="editor". Fotnot med asterisk: I OpenOffice.org har vi infört fotnoter med asterisk på följande sätt: [...] brännt på bålet min moder och min mormoder och min moders mormoder?*)45 Den tillagda numreringen behövs bl.a. för att TEI-filtret automatiskt ska kunna lägga in rätt id i koden, men den synliga numreringen bör avlägsnas från den slutliga koden efter att odt-filen konverterats tillbaka till XML/TEI. Före ett band ska tryckas måste vi sedan införa flera asterisker på de ställen där det blir flera fotnoter på samma sida. I den integrerade visningen med scrollbara dokument i ZTe är det här inget problem: då visas fotnoterna när man pekar på en symbol i texten. Ex. 1: <note id="ftn45" n="*)" place="foot" anchored="true"> Ex. 2: <note id="ftn46" n="**)" place="foot" anchored="true"> id-numret behöver inte sammanfalla med (det eventuella) numret i n som är avsett för visning. Musikaliska noter och matematiska formler Musikaliska noter och mer komplicerade matematiska formler kodas inte utan införs i form av bilder. 14 2.2 Listor, tabeller och kalkyler Uppdaterad 22.2.2012 Listor Listor kodas i ett <list>-element med underordnade <item>-taggar. Ex. 1: <list> <item>1) Statsrådet m.m. Grefve L. Manderström, Stockholm.</item> <item>2) Friherrinnan v. Beskov, Sthm.</item> <item>3) Doktor Herm. Sätherberg, Sthm.</item> <item>4) Professor Aug. Malmström, Sthm.</item> <item>5) Doktor C. A. Wetterbergh, Linköping.</item> <item>6) Prosten G. H. Mellin, Helsingborg, Norra Wram.</item> <item>7) Direktör J. A. Josephson, Uppsala.</item> </list> Ifall hela listan är indragen i originalet anges det i starttaggen med <list rend="indent">. Om listan är försedd med en rubrik anges den i ett <head>-element, som införs genast efter starttaggen <list>: <list> <head>[listrubrik]</head> <item>[...]</item> </list> Ifall listan överskrider en sidgräns kan ett <pb/>-element införas inne i listan, men endast efter att ett <item>-element stängts och före det följande öppnats. Tabeller Tabeller kodas i elementet <table>, och i starttaggen anges antalet rader och kolumner. Efter starttaggen införs en eventuell tabellrubrik i <head>. Tabellens fält kodas i <cell>-element som grupperas radvis med <row>. Tomma fält anges med <cell/>. Rubrikerna för enskilda rader eller kolumner anges med attributet role och värdet label. Att en rad innehåller kolumnrubriker kan anges med <row role="label">. Radrubriker (i den vänstra kolumnen) måste definieras i enskilda fält. Ex. 1: <table rows="3" cols="3"> <head>Topelius-tabell</head> <row role="label"> <cell/> <cell>Kolumnrubrik 1</cell> <cell>Kolumnrubrik 2</cell> 15 </row> <row> <cell role="label">Radrubrik 1</cell> <cell>1</cell> <cell>2</cell> </row> <row> <cell role="label">Radrubrik 2</cell> <cell>3</cell> <cell>4</cell> </row> </table> Radrubrik 1 Radrubrik 2 Topelius-tabell Kolumnrubrik 1 1 3 Kolumnrubrik 2 2 4 Tabellexempel från Topelius korrespondens: Honorariet utgörande för ark 1–14 Rubel 150 – samt för de öfriga 3 ¼ ark à 12 Rubel 39 – Summa Rubel 189 – Kodas på följande sätt: <table rows="3" cols="2"> <row> <cell>Honorariet utgörande för ark 1–14</cell> <cell>Rubel 150 –</cell> </row> <row> <cell>samt för de öfriga 3 ¼ ark à 12 Rubel</cell> <cell>39 –</cell> </row> <row> <cell>Summa Rubel</cell> <cell>189 –</cell> </row> </table> Ifall tabellen i originalet inte har några linjer runt fälten införs attributet rend med värdet noBorder i elementet <table>: 16 Ex. 1: <table rend="noBorder" rows="3" cols="2"> Det förvalda värdet för rend (som alltså inte behöver införas) är att fälten är avgränsade med linjer. Kalkyler Kalkyler av olika slag kodas som tabeller: F.mk. 3,540;–〃– 27,44 ―――――――――― Sum. 3,567.44 Sådana här kalkyler kodas med rend="noBorder" i <table>, men därtill måste det långa strecket införas i en cell som överskrider kolumngränserna och alltså är lika bred som hela raden. Ifall tabellen – som i det här fallet – är tre kolumner bred måste man i <cell> ange cols="3". Själva strecket åstadkoms genom att man i samma <cell> inför rend="botBorder" (det är alltså fråga om en tom cell). Exempeltabellen kodas i tre kolumner och fyra rader på följande sätt: <table rows="4" cols="3" rend="noBorder"> <row> <cell/> <cell>F.mk.</cell> <cell>3,540;-</cell> </row> <row> <cell/> <cell>–〃–</cell> <cell>27,44</cell> </row> <row> <cell cols="3" rend="botBorder"/> </row> <row> <cell>Sum.</cell> <cell/> <cell>3,567.44</cell> </row> </table> Ifall tabellen överskrider en sidgräns kan ett <pb/>-element införas inne i tabellen, men endast efter att ett <row>-element stängts och före det följande öppnats. 17 Eftersom det kan förekomma små kalkyler inne i textstycken har vi tillåtit att <table> används innanför <p>-taggar (det är tillåtet också enligt TEI-riktlinjerna). Men visningen av sådana tabeller kan vara problematisk, så inför en redaktionell kommentar <!--table innanför p--> efter tabellkodningen. Klamrar i tabeller En klammerparentes, alltså tecknet }, som utsträcker sig över två eller flera rader byggs upp med hjälp av de bracket pieces som ingår i Unicode-kategorin Miscellaneous Technical. Ifall det bara är två rader som sammankopplas används en s.k. vänstermustasch, 23B0, och en s.k. högermustasch, 23B1. De bör införas som entitetsreferenser, d.v.s. ⎰ för den ena halvan och ⎱ för den andra halvan. Den inbördes ordningsföljden beror på om spetsen är svängd åt höger eller åt vänster, alltså { eller }. Det finns också klamrar som sammankopplar innehållet på tre eller flera rader, och entitetsreferenserna varierar också där beroende på åt vilket håll klammern är svängd. Bäst ser man vilka delar man behöver genom att gå till www.unicode.org/charts/PDF/U2300.pdf: för den tredelade klammerparentesen är det antingen 23A7, 23A8 och 23A9 eller 23AB, 23AC och 23AD. Eftersom allt tabellinnehåll visas vänsterställt måste klammerdelarna placeras i en egen kolumn ifall de föregås av text eller siffror, för annars hamnar inte de olika delarna exakt ovanför varandra så att de verkligen bildar en korrekt klammerparentes. Utseendet kan för närvarande inte kontrolleras i Author-vyn, eftersom dessa tecken saknas i vanliga typsnitt såsom Times New Roman eller Arial. 2.3 Grafiska markeringar Uppdaterad 14.11.2011 Grafiska markeringar i originalet kodas med elementet <hi>. Tidigare använde vi både elementen <hi> och <emph> och gjorde skillnad på om markeringen berodde på emfas eller inte, men detta har frångåtts. Inne i <hi> används universalattributet rend för att registrera originalets markering. I stilmallar kan man senare ange t.ex. att kodningens spärrade stil ska visas som kursiv. Grafiskt markerade namn på personer, platser och verk samt inslag på främmande språk kodas i allmänhet inte med <hi> utan direkt med rend, se nedan. Kursivering av ett helt textstycke: <p><hi rend="italics">[textstycke]</hi></p> Kursivering av enskilda ord: <hi rend="italics">[text]</hi> Understrykning: <hi rend="underline">[text]</hi> 18 Dubbel understrykning: <hi rend="underline2">[text]</hi> Understreckning (flera korta streck): <hi rend="dashUnderline">[text]</hi> Fetstil: <hi rend="bold">[text]</hi> Fetstil & kursivering: <hi rend="bold italics">[text]</hi> Spärrad stil: <hi rend="expanded">[text]</hi> Spärrat & kursiverat: <hi rend="expanded italics">[text]</hi> Spärrad fetstil: <hi rend="bold expanded">[text]</hi> Antikva (i en frakturtext): <hi rend="romanType">[text]</hi> Spärrad antikva (i en frakturtext): <hi rend="romanType expanded">[text]</hi> Text bestående enbart av versaler eller kapitäler: <hi rend="uppercase">[text]</hi> Inringat: <hi rend="encircled">[text]</hi> Större handstil: <hi rend="encreasedSize">[text]</hi> Upphöjd stil: Originalets 25te April kodas: 25<hi rend="raised">te</hi> April 19 Nedsänkt stil: <hi rend="sub">[text]</hi> T.ex. ett kommatecken i nämnaren i ett bråktal, eller eventuellt hela nämnaren då den inte anges med entitetsreferenser. Inverterade markeringar: [...] </hi> Detta <hi rend="italics"> [...] Ifall texten i övrigt är t.ex. kursiverad, och ett enskilt ord (enskilda ord) markeras genom rak stil, ”icke-kursivering”, stängs <hi>-elementet före textstället ifråga och ett nytt <hi>-element öppnas efter stället. Grafiskt markerade personer, platser och verk samt främmande språk Samtliga grafiskt markerade namn på personer, platser och verk förses med namnkodning, som för skannade grundtexter ersätter automatiskt genererad <hi>-kodning. Grafiskt markerade uttryck på främmande språk kodas enligt samma princip. OBS: Namn på personer, platser och verk samt uttryck på främmande språk kodas även om de inte är grafiskt markerade i originalet. Se avsnitt 4 Semantisk kodning. Ex. 1: <persName rend="expanded">Lewenhaupt</persName> Namn som är grafiskt markerat med spärrning i originalet. Ex. 2: [...]</hi> <title>Hamlets</title> <hi rend="italics">[...] Inverterad markering av verktiteln i originalet (t.ex. kursiverat förord i vilket titeln har utmärkts med rak stil). Ex. 3: <title rend="italics">Läsning för barn</title> I–IV I exemplet har endast Läsning för barn kursiverats i originalet. Ex. 4: <placeName><hi rend="expanded">Borgå</hi> län</placeName> Här är endast Borgå spärrat i originalet, men namnkodningen har avgränsats till Borgå län. Ex. 5: <foreign xml:lang="fre" rend="romanType">Parbleu!</foreign> Det franska uttrycket Parbleu! är satt med antikva i en text som annars är satt i fraktur. I utgåvan visas detta med kursiv stil. Utropstecknet kan tas med i kodningen för främmande språk eftersom det är grafiskt markerat på samma sätt och kan anses höra ihop med uttrycket. Ex. 6: ”Jag tackar för den äran, ehuru <persName rend="romanType">Jean Jacques</persName>, som aldrig varit i lappmarken, [...]” Efterföljande skiljetecken tas aldrig med i namnkodningen. Om även skiljetecknet är grafiskt markerat och man inte önskar normalisera detta stillatigande måste skiljetecknet förses med egen <hi>-kodning. Universalattributet rend 20 rend är ett s.k. universalattribut, vilket innebär att det inom ramen för TEI får användas i alla element där det kan tänkas behövas. Men eftersom användningen av rend ändå måste beaktas när man gör upp stilmallar är det motiverat att begränsa användningen av attributet i fråga till endast vissa element. Det här berör främst grafiska markeringar som kan anges med samma attributvärden i olika element (rend används ju också för att registrera annat än dessa markeringar, t.ex. styckeindrag). Attributet rend kan införas direkt i ett element om den grafiska markeringen står i samband med det som definieras i elementet, t.ex. om det är fråga om en rubrik (<head>), ett namn (t.ex. <placeName>) eller ett ord eller uttryck på främmande språk (<foreign>). Det är ändamålsenligare att koda understrukna tillägg som <add><hi rend=""> än <add rend="">, för annars skulle man i stilmallarna vara tvungen att beakta att rend också kunde förekomma i <addSpan/>, <subst>, <del>, <print>, <item>, <cell> o.s.v. OBS 1: rend kan ifråga om grafiska markeringar införas direkt i <date>, <dateline>, <foreign>, <head>, <hi>, <persName>, <placeName>, <title> och <trailer>, men inte i andra element OBS 2: Ifall ett stycke är kursiverat i sin helhet (t.ex. i ett förord), och enskilda ord dessutom är spärrade kodas detta <p><hi rend="italics">Ord ord ord ord <hi rend="expanded italics">ord ord</hi> ord ord ord.</hi></p>. XML är visserligen hierarkiskt uppbyggt, men i vår kodning betyder rend="expanded" att den markerade texten endast är spärrad, alltså upphävs det rend-värde som har angetts på en högre nivå, i praktiken i <hi> innanför <p>. 2.4 Speciella tecken Uppdaterad 22.2.2012 Förbjudna tecken Tecken som har en särskild betydelse inom XML kan inte införas som sådana ifall de ingår i själva texten, eftersom de alltid uppfattas som en del av en kod. De anges istället med s.k. entitetsreferenser: & införs som & (ampersand) < införs som < (less than) > införs som > (greater than) ' införs som ' (apostrophe) " införs som " (quotation mark) Observera ändå att vi – i texten – inte använder raka citattecken, alltså ' och ", utan typografiska dito: ’ och ”, vilka kan införas som sådana. I kodningen måste man däremot alltid använda raka citattecken för attributvärden. I praktiken finns alltså endast tre förbjudna tecken som måste införas med entitetsreferenser. Entitetsreferenser består av ett entitetsnamn (eller tecknets Unicode-nummer) som föregås av 21 ett &-tecken och efterföljs av ett semikolon. I Oxygen lägger man till de förbjudna tecknen genom att dubbelklicka på dem i menyn Entities (en flik i menyn Elements) eller genom att skriva in dem för hand. Ex. 1: Texten läst & skrifvit anges i XML som läst & skrivit. Entitetsreferensen innehåller ett entitetsnamn. Ex. 2: > Entitetsreferens med ett hexadecimalt Unicode-nummer som bör föregås av #x. Brädgårdstecknet anger att det är fråga om ett nummer, och bokstaven x anger att numret är hexadecimalt. OBS: För de förbjudna tecknen använder vi entitetsnamnen (som i ex. 1) och inte Unicodenumren (som i ex. 2). Specialtecken Många specialtecken som vi har användning för kan införas som sådana i XML-filerna, dock inte alla tecken som ingår i Unicode. I avsnitt 9.2 finns en förteckning över tecken som kan införas som sådana. Observera att också kyrilliska och grekiska bokstäver kan införas som sådana, även om de inte ingår i förteckningen. Ev. arabiska bokstäver torde vi däremot vara tvungna att införa i form av entitetsreferenser. När man inför specialtecken i XML-editorn bör man vara noga med att införa rätt tecken, och inte något annat tecken som ser ungefär likadant ut. Även ifråga om tecken som måste anges med numerisk entitetsreferens är det till fördel om alla alltid använder samma tecken för samma ändamål, därför finns i 9.2 också en förteckning över sådana tecken. Ifall ett tecken kan införas som sådant bör man också helst göra det, och inte använda entitetsreferens. Detta för att XML-filerna ska bli så lättlästa som möjligt, med tanke på det fortsatta redaktionella arbetet och kanske också med tanke på användare som vill studera den kodade filen. I uppsättningen Unicode ingår ett ytterst stort antal tecken, över 100 000. I XML-editorn ser man det hexadecimala Unicode-numret på det tecken som man står i beråd att införa, och det är skäl att kontrollera att det faktiskt är fråga om t.ex. ett vanligt tankstreck och inte något annat streck som ser liknande ut. Det gör man genom att jämföra med Unicode-numret för det tecken man är ute efter i förteckningen över specialtecken. För att införa ett specialtecken i Oxygen väljer man Edit/Insert from Character Map.... Om man skriver in Unicode-numret på det tecken man är ute efter i rutan Character code och väljer hexadecimal kommer rätt tecken upp med en gång. Sedan väljer man att antingen införa tecknet som sådant eller som hexadecimal entitetsreferens. Insert placerar tecknet där kursorn är och Copy håller tecknet i minnet tills man klistrar in det. Observera att om det hexadecimala Unicode-numret börjar med två nollor är de inte nödvändigtvis utskrivna i XML-editorn. 22 Som tankstreck använder vi en dash (−) med Unicode-nummer 2013, i Unicode-kategorin General punctuation. Minustecknet, som ser annorlunda ut än tank- och bindestreck, har Unicode-nr 2212. Det typografiska citattecken vi använder har namnet rdquo och nummer 201D. Det enkla typografiska citattecknet, apostrofen, betecknas rsquo och har nummer 2019. Även de båda citattecknen ingår i Unicode-kategorin General punctuation. Som upprepningstecken används en ditto med nummer 3003 (i Cjk symbols and punctuation), som vid behov kan kombineras med tankstreck före och efter. Dittotecknet syns tyvärr inte i alla teckensnitt och saknas t.ex. i Arial och Times New Roman. OBS 1: För specialtecken använder vi inte namnet i referensen utan det hexadecimala Unicodenumret (ex. œ). OBS 2: Specialtecken kan också införas med hjälp av Windows teckenuppsättning, som öppnas via Start-menyn och antingen Kör... eller Sök, där man skriver in charmap. Hårt blanksteg och smalt hårt blanksteg Bl.a. för tusental som skrivs med blanksteg och tal som efterföljs av procenttecken måste man förbjuda radbrytning. Det sker genom att man ersätter det vanliga blanksteget med entitetsreferensen för antingen vanligt hårt blanksteg eller smalt hårt blanksteg. Vanligt hårt blanksteg (no-break space) ingår i Unicodes kategori Latin-1 Supplement och har entitetsreferensen  . Det används t.ex. i förkortningar och mellan initialer i originaltexten, samt före procenttecken: 5 % bör alltså införas som 5 %. Det är också möjligt att införa hårt blanksteg som sådant i XML-editorn, men med tanke på senare granskningar av kodningen är det bättre att det tydligt framgår att hårt blanksteg har införts. Oxygen visar emellanåt hårt blanksteg som en haksymbol och smalt hårt blanksteg som en fyrkant, så att man inte längra kan hitta ställena genom att söka på t.ex. 00A0, men informationen finns fortfarande kvar i filen och visas korrekt vid omvandling till annat format. Ex. 1: – satt up till kl. ½ 12 – Ex. 2: – <persName>C. K.</persName> sprang sedan till policen – Ex. 3: Märkdagarna på finska runstafven beteckna dels högtider, dels sånings-, skörde-, fiskedagar o. s. v. Enligt praxis för Topelius tid skrivs originaltextens förkortningar med mellanslag: o. s. v. och inte som i dag o.s.v. eller osv. För att en radbrytning inte ska kunna ske mitt i förkortningen används hårda blanksteg i stället för vanliga. Det kan vara lättare att först skriva alla förkortningar med vanliga mellanslag och sedan med hjälp av sök och ersätt byta ut t.ex. alla o. s. v. till o. s. v. Smalt hårt blanksteg (narrow no-break space) finns i Unicode-kategorin General Punctuation och har entitetsreferensen  . Det används för tusental som skrivs med blanksteg i originaltexten, i normaliserade sifferuppgifter samt mellan initialer i redaktionella texter, alltså inledningar och kommentarer. Smalt hårt blanksteg används inte om grundtexten är en handskrift. 23 Bråktal De vanligaste bråktalen kan införas som sådana, d.v.s. som ett enda tecken. Detta gäller följande bråktal: ½, ¼, ¾, ⅓, ⅔, ⅛, ⅜, ⅝ och ⅞. Därtill finns tecken för femtedelar, en sjättedel samt fem sjättedelar, men dessa syns emellertid varken i XML-editorn eller ordbehandlaren och bör därför införas med entitetsreferens. Ex. 1: en femtedel införs som ⅕ Se 9.2 Specialtecken som måste anges med numerisk entitetsreferens. Jämna åttondelar, alla sjättedelar förutom de ovannämnda och andra ovanliga bråktal måste återges som en kombination av flera tecken eller entitetsreferenser (inga blanksteg!). Det finns ett speciellt bråkstreck för ändamålet, nämligen fraction slash med entitetsreferensen ⁄. Det föregås av en eller flera siffror i upphöjt läge (superscript) och efterföljs av en eller flera siffror i nedsänkt läge (subscript). Siffrorna finns i Unicodes kategori Superscript and subscript. De syns inte i XML-editorn och bör därför införas i form av entitetsreferenser. Detta med undantag för tvåan och trean i upphöjt läge som ingår i kategorin Latin-1 och därmed kan införas som sådana. Bråkstrecket, som lutar litet mer än det vanliga snedstrecket, finns i General Punctuation. Det kan införas som sådant, men om man vill vara konsekvent kan man införa hela bråktalet i form av entitetsreferenser. Då ser man också tydligt att rätt snedstreck har använts. Ifall man inför snedstrecket som sådant bör man vara uppmärksam på att det inte blir något blanksteg före eller efter tecknet ifråga. Ex. 1: 2/7 införs som a) ²⁄₇ b) ²⁄₇ eller c) ²⁄₇ Ex. 2: 6/8 införs som a) ⁶⁄₈ eller b) ⁶⁄₈ OBS 1: Det finns också ett skilt tecken med täljaren 1 och bråkstrecket, nämligen fraction numerator one med entitetsreferensen ⅟. Det finns i Unicodes kategori Number Forms och bör införas i form av en entitetsreferens eftersom det inte syns i XML-editorn. Ex. 1: För att koda 1/9 behövs alltså endast två entitetsreferenser: ⅟₉ OBS 2: När ett kommatecken ingår i täljaren och/eller nämnaren (tal större än 999) används ett vanligt kommatecken som innesluts i <hi rend="raised"> eller <hi rend="sub">. Alternativt kan man använda vanliga siffror och inkludera täljaren och nämnaren i sin helhet i <hi rend="raised"> respektive <hi rend="sub">. 24 25 3 Manuskriptbeskrivande kodning 3.1 Allmänna textuella företeelser Uppdaterad 24.1.2012 Paginering, rubriker, stycken och fotnoter Se Kodning av allmänna textuella företeelser, avsnitt 2.1. Listor, tabeller och kalkyler Se Kodning av allmänna textuella företeelser, avsnitt 2.2. Grafiska markeringar Se även Kodning av allmänna textuella företeelser, avsnitt 2.3. Enkel understrykning: <hi rend="underline">[text]</hi> Dubbel understrykning: <hi rend="underline2">[text]</hi> Understreckning: <hi rend="dashUnderline">[text]</hi> Används när texten har markerats med flera korta streck. Inringad text: <hi rend="encircled">[text]</hi> Större handstil: <hi rend="encreasedSize">[text]</hi> Text bestående enbart av versaler eller kapitäler: <hi rend="uppercase">[text]</hi> OBS: Understrykningar och understreckningar införs i kodningen utgående från vad man kan sluta sig till att har varit skribentens avsikt: som regel kodas alltså ett ord i sin helhet som understruket, även om strecket är litet kortare än ordet. Om understrykningen ser ut att gälla även ett efterföljande skiljetecken kodas tecknet som understruket endast om det verkligen kan anses höra till den markerade texten. Ifall en mening är understruken i sin helhet inkluderas alltså också det avslutande skiljetecknet, och samma gäller för anteckningar som består av ett enda understruket ord samt punkt, utropstecken eller frågetecken. Ex. 1: Ett ord och ett komma är understrukna, men kommat anses inte höra till markeringen, även om det kan se så ut. Meningen kodas: Ett ord och ett komma är <hi rend="underline">understrukna</hi>, men kommat anses inte höra till markeringen, även om det kan se så ut. 26 Ex. 2: <hi rend="underline">Finska folkets historia är i väsendet ingenting annat än dess utveckling till nationalmedvetande.</hi> I en mening som är understruken i sin helhet kodas också slutpunkten som understruken. Ex. 3: <p rend="noIndent"><date when="1833-05-29">29. <hi rend="underline2">Onsdag.</hi></date> steg up kl. 9. [...]</p> Understruken anteckning bestående av ett enda ord samt punkt. Ex. 4: <item>3) <hi rend="underline">Permska grenen</hi>: <hi rend="underline">Permier</hi>, <hi rend="underline">Syrjäner</hi>, <hi rend="underline">Wotjaker</hi>, samt</item> Kolonet hör inte på ett avgörande sätt ihop med uttrycket Permska grenen, och kommatecknen hör inte till folkslagen. Ex. 5: <p><hi rend="underline">Repet.</hi> <date when="1871-09-29">29/9 71.</date> Vattuminskn. Städer. Sjökort. [...]</p> Punkten kodas som understruken trots att den inte är en slutpunkt, eftersom den markerar en förkortning och därför hör ihop med det understrukna ordet. Speciella tecken Se Kodning av allmänna textuella företeelser, avsnitt 2.4. 3.2 Datering och tillkomstort Uppdaterad 25.4.2012 Manuskriptdateringen med eventuell tillkomstort införs i ett <dateline>-element, förutsatt att det är fråga om en fristående datering, t.ex. på en egen rad sist i ett diktmanuskript eller som en fristående datering av ett förord till ett verk. Själva tidsangivelsen införs i ett <date>element, som är underordnat <dateline>. För datumangivelser som på ett eller annat sätt har integrerats i själva texten, som en del av en rubrik på en föreläsning eller i början av en repetitions- eller dagboksanteckning, används enbart <date>. Sådana datum räknas inte heller som egentliga manuskriptdateringar. Övriga datum inne i löpande text kodas inte alls. Ex. 1: <dateline><date when="--06-18">18 Juni</date>– <lb/><placeName>Janakkala<placeName></dateline> Observera att elementet <lb/> bör användas ifall det förekommer radbyten i den text som markeras med <dateline> eller <date>, förutsatt att radbytena inte beror enbart på utrymmesbrist. Ifall veckodag anges inkluderas denna inte i <date> utan enbart i <dateline>: Ex. 2: <dateline>Fredagen <date when="--04-15">den 15 April.</date></dateline> <dateline> bör användas även om manuskriptdateringen i sin helhet kan inkluderas i <date>. En ev. avslutande punkt kan inkluderas i <date> ifall det inte finns någon övrig text efter själva datumet. 27 Standardformat: Standardformat bör alltid användas för det manuskriptdateringsdatum som införs i <date> (gäller dock inte brev). Övriga datum som omnämns i texterna kodas inte. Standardformat införs i attributen when, from och to på följande sätt: Ex. 1: <date when="1855-07-05">5 juli 1855.</date> Ex. 2: <date when="1871-09">September 1871.</date> Ex. 3: <date when="--09">September</date> Ex. 4: <date when="--05-01">Den första maj.</date> Om årtalet inte framgår av dateringen kan det ändå införas i standardformatet om man med stor säkerhet kan sluta sig till vilket år texten har skrivits. Ex. 5: <date when="1881">1881.</date> Ex. 6: <date when="1840-04-08">Skärtorsdag 1840.</date> Exakt datum hittas t.ex. på www.timeanddate.com/calendar/. Standardformat för tidsperiod: Ex. 1: <date from="1860-05" to="1860-08">Maj – Augusti 1860</date> När man anger standardformat för en tidsperiod ersätts alltså attributet when av attributen from och to. Även ifråga om dateringar som är skrivna 15, 16 April används kodning för tidsperiod. Dubbelt standardformat: För dateringar som 1835, 1840 kan kodningen för tidsperiod inte användas. I stället används två <date>-element innanför samma <dateline>: Ex. 1: <dateline><date when="1835">1835</date>, <date when="1840">1840</date></dateline> Understruken datering: Ex. 1: <dateline><date rend="underline" when="1855-07-05">5 juli 1855.</date></dateline> Ex. 2: <dateline>Torsdagen den <date rend="underline" when="1855-07-05">5 juli 1855.</date></dateline> Ex. 3: <dateline>Torsdagen <date rend="underline" when="1855-07-05">den 5 juli 1855.</date></dateline> Ex. 4: <dateline rend="underline">Torsdagen <date when="1855-07-05">den 5 juli 1855</date> – <placeName>Helsingfors</placeName>.</dateline> Attributet rend kan alltså införas direkt i såväl <date> som <dateline>. Eventuella andra grafiska markeringar som förekommer i dateringarna kodas på motsvarande sätt, med de attributvärden för rend som omnämns i avsnittet om grafiska markeringar. den kan (som i ex. 28 2) lämnas utanför <date> ifall det är ändamålsenligt med tanke på registreringen av en grafisk markering. 3.3 Oläsligt, svårläst och saknat Uppdaterad 1.4.2011 Oläsligt Text som är så oläslig att man inte vågar sig på en kvalificerad gissning kodas i det tomma elementet <gap/> och orsaken anges med attributet reason: <gap/> reason="binding" <gap/> reason="damage" <gap/> reason="endline" <gap/> <gap/> reason="erased" reason="faded" <gap/> <gap/> <gap/> <gap/> reason="glue" reason="ink" reason="overstrike" reason="overwritten" <gap/> <gap/> <gap/> <gap/> reason="seal" reason="smudge" reason="stamp" reason="writing" oläsligt p.g.a. (stram) inbindning eller beskärning i samband med inbindning oläsligt p.g.a. skador (pappret sönderrivet, vattenskada etc.) oläsligt för att skribenten kommit till slutet av raden oläsligt p.g.a. utsuddning oläsligt p.g.a. att bläcket är svagt och avmattat, på väg att ta slut oläsligt p.g.a. överlimning eller tejp oläsligt p.g.a. bläckplump oläsligt p.g.a. strykning oläsligt p.g.a. att något skrivits ovanpå ifrågavarande ställe oläsligt p.g.a. sigill oläsligt p.g.a. avsvärtning, utflutet bläck oläsligt p.g.a. frimärke oläslig handstil Oläslig handstil Ex. 1: <gap reason="writing" extent="1" unit="words"/> Det oläsligas omfång bör alltid uppges: i exemplet ovan är det alltså fråga om ett ord. Attributet unit kan också ha värdet letters (om det är fråga om enskilda bokstäver eller tecken) eller lines (ifall hela rader är oläsliga). Beroende på vilket värde unit har tilldelats anges i attributet extent antalet bokstäver, ord eller rader. Attributvärdena anges i pluralformerna words och letters även om det är fråga om endast ett ord eller en bokstav. 29 OBS 1: <gap>-kodning används endast om man inte kan sluta sig till vilket ord det är fråga om. Om enstaka bokstäver saknas − t.ex. till följd av inbindning eller skada − men man entydigt kan sluta sig till vad det står, har stått eller borde ha stått skrivet, införs istället <supplied>-kodning för de ifrågavarande bokstäverna. OBS 2: Även om <gap>- och <unclear>-kodningen tas i bruk endast om man inte kan sluta sig till vilket ord det är fråga om så bör den införas så exakt som möjligt: när det till följd av skada är omöjligt att sluta sig till vilket ord det är fråga om införs <gap>-kodningen endast för den del av ordet som är oläslig. Text som är oläslig till följd av strykning Ex. 1: <gap reason="overstrike" extent="2" unit="words"/> Här har två ord strukits, och som en följd av detta går de inte att tyda. OBS: När text är oläslig till följd av strykning räcker det med reason="overstrike": <gap>elementet behöver alltså inte inneslutas i <del>. Oläsligheten är inte är en följd av strykningen Om ett eller flera ord har strukits, men texten av allt att döma skulle ha varit oläslig också utan överstrykningen: Ex. 2: <del><gap reason="writing" extent="1" unit="words"/></del> Ett oläsligt skrivet ord har strukits, antingen till följd av att det blivit oläsligt eller av någon annan orsak. Svårläst Om textstället är så svårläst att det inte kan uttydas med säkerhet, men man ändå vågar sig på en kvalificerad gissning, används elementet <unclear>. Inne i det anges orsak till svårläsligheten samt vem som svarar för uttydningen. Ex. 1: <unclear reason="smudge" resp="MaD">glans</unclear> reason kan ha samma värden som för helt oläslig text (se ovan). resp anges med initialer, gärna med tre bokstäver så att det entydigt framgår vilken medarbetare som avses. Ifall en kollationist finner utskrivarens tolkning sannolik kan han eller hon lägga till sina initialer i resp, så att det står t.ex. resp="MaD LaM". Kodningen bör införas så exakt som möjligt: om man är osäker på om ordet faktiskt är glans men med säkerhet anser sig kunna uttyda de tre sista bokstäverna så kodas detta: Ex. 2: <unclear reason="smudge" resp="MaD">gl</unclear>ans Text som är svårläst till följd av strykning I de fall då allt som strukits är svårläst till följd av strykning kan <del>-taggarna slopas: Ex. 1: Hadrian IV och hans <unclear reason="overstrike" resp="EK">fyra</unclear> <add>tre</add> biskopar: [...] 30 Orsaken till att textstället är svårläst är en annan än strykningen, t.ex. handstilen: Ex. 2: <del><unclear reason="writing" resp="AT">Ty</unclear></del> Den första meningen försvaras af de ryske häfdatecknarne. Endast en del av det strukna är svårläst: Ex. 3: <del><unclear reason="overstrike" resp="NoN">på</unclear>föra</del> Saknade bokstäver, tecken eller ord Ifall text saknas − t.ex. till följd av inbindning eller skada − men man ändå entydigt kan sluta sig till vad det står/ har stått/ borde stå skrivet införs inte <gap> eller <unclear> utan i stället elementet <supplied>. Det används på samma sätt som <unclear>: samma värden kan anges i attributet reason, och i resp anges vem som står bakom kompletteringen. Observera ändå att <supplied> utan attributet reason står för en komplettering i form av en utgivarändring: texten som markeras har då saknats från första början. Ex. 1: <placeName>Helsing<supplied reason="damage" resp="NN">fo</supplied>rs</placeName> Man kan sluta sig till att det har stått Helsingfors, men fo saknas till följd av skada: Ex. 2: [...] omgifvet af så <supplied reason="overstrike" resp="NN">djupa</supplied> vallgrafvar [...] Ifall Topelius har strukit ord eller bokstäver utan att skriva in något annat istället, och texten blir orimlig utan det strukna, kan orden eller bokstäverna införas i den etablerade texten innanför ett <supplied>-element, i vilket attributet reason ges värdet overstrike. Inget <del> behöver alltså användas. Ex. 3: [...] en gästgifvargård uti <placeName>Tavastehus lä<supplied reason="damage" resp="PiA">n</supplied></placeName><supplied reason="damage" resp="PiA">.</supplied> Wi foro derifrån [...] När <supplied> och semantisk kodning sammanfaller så att överlappande kodning uppstår kan det bli nödvändigt att dela upp <supplied> i två, även om den saknade texten annars skulle ha ingått i ett och samma <supplied>-element. I exemplet ovan ser originalet ut som följer: [...] uti Tavastehus lä[skada i papperet, ca två tecken stor] Wi foro [...]. Eftersom <placeName> och <persName> aldrig innefattar efterföljande skiljetecken (förutom punkter som hör till förkortade namn) kan sluttaggen </placeName> i det här fallet inte placeras efter </supplied>, utan <supplied>-kodningen måste i stället delas upp i ett kompletterat n och en kompletterad punkt. OBS: Om det i ett omfattande manuskript förekommer otaliga fall där en del av ett ord inte syns till följd av inbindning, behöver man inte använda <supplied>-kodning. I stället beskrivs följderna av inbindningen på ett generellt plan. Men i de fall då man till följd av inbindningen är osäker på uttydningen av ett ord − eller inte alls kan tyda det − bör ordet kodas med <gap reason="binding"/> eller <unclear reason="binding">. 31 Tomrum i texten Omotiverade tomrum i texten markeras med det tomma elementet <space/>. Det kan t.ex. vara fråga om att Topelius reserverat plats för ett adjektiv som han sedan aldrig infört. Omfånget anges i attributen extent och unit. Det sistnämnda attributet kan ha värdet letters, words eller lines. Ex. 1: <space extent="4" unit="letters"/> Ett cirka fyra tecken/bokstäver långt tomrum. 3.4 Manuskriptförkortningar och skribentens kommentarer Uppdaterad 29.3.2011 Utskrivning av manuskriptförkortningar Förkortningar som inte är allmänt vedertagna utan använts för att underlätta skrivandet kan vid behov införas i ett <choice>-element tillsammans med betydelsen: Ex. 1: <choice><abbr>vskap</abbr><expan resp="NN">vetenskap</expan></choice> I Föreläsningar har vi löst upp sådana manuskriptförkortningar som antas kunna skapa problem för läsaren. Då ord förkortats på ett sådant sätt att det är ganska uppenbart vad som avses har ingen upplösning gjorts. Konsonanter med förlängningsstreck ovanför skrivs ut som dubbla konsonanter, utan att detta kodas. Eventuellt kan en redaktionell kommentar införas: <!--mm skrivet som m med streck ovanför-->. Skribentens kommentarer Ifall Topelius (eller en brevskribent) har skrivit en kommentar av ett eller annat slag (alltså inte ett tillägg till den löpande texten) ovanför raden kodas det med <note>, och i attributet place införs värdet aboveLine. <note>-elementet införs i början av det textställe som man uppfattar att kommentaren åsyftar: Ex. 1: Hafva Dina ögon någonsin sett en <note place="aboveLine">[ZTs kommentar]</note> histrion [...] Det kan t.ex. vara fråga om en läsanvisning för en enskild textrad. Raden som kommentaren åsyftar avgränsas i så fall inte i den egentliga kodningen, men <note>-taggen införs i början av raden, och radslutet kan markeras med en redaktionell kommentar. 3.5 Händer och pennor Uppdaterad 29.3.2011 I TEI Header 32 Händerna och pennorna som förekommer i ett manuskript anges i <profileDesc>-elementet i <teiHeader>. I <profileDesc> införs ett <handNotes>-element som i sin tur innesluter ett eller flera <handNote>-element. I de sistnämnda elementen anges som medium-värden vilka slags pennor som använts, och som id-värde skribentens initialer. Därtill införs skribentens utskrivna namn som textinnehåll i elementen ifråga. Ifall endast Topelius (eller ett brevs avsändare) har skrivit i manuskriptet behöver emellertid inget id anges, utan enbart medium. <profileDesc> <handNotes> <handNote medium="blue-ink"/> </handNotes> </profileDesc> Ibland finns inte originalmanuskripten bevarade, utan texten måste transkriberas utgående från kopior och avskrifter av originalet. Om det manuskript som återges är en kopia (liknande en fotokopia) av originalet används attributet copy. Är manuskriptet en maskinskriven avskrift av originalet anges detta med typescript. Båda värden kan kombineras med andra mediumvärden ifall man vet vilken penna originalet skrivits med: <handNote medium="copy blackink"/> betecknar alltså en kopia av ett ms som ursprungligen skrivits med svart bläck.4 Om det finns två (eller flera) skribenter i manuskriptet bör id:n anges och skribenternas namn skrivas ut. Detta oberoende av om den andra handen förekommer i den löpande texten, eller endast i tillägg eller strykningar.5 I det första <handNote>-elementet anges den huvudsakliga skribenten, och i det senare den andra handen: <profileDesc> <handNotes> <handNote id="ZT" medium="blue-ink">Zacharias Topelius</handNote> <handNote id="ET" medium="black-ink">Emilie Topelius</handNote> </handNotes> </profileDesc> Ifall en eller flera skribenter har använt olikartade pennor i manuskriptet anges i <handNote> två (eller flera) värden för attributet medium. Ifall endast Topelius har skrivit i manuskriptet kan det se ut på följande sätt i <teiHeader>: <profileDesc> <handNotes> <handNote medium="blue-ink pencil"/> </handNotes> </profileDesc> 4 5 För brev finns informationen inom <p>-taggar i <sourceDesc>. Händer och pennor som enbart förekommer i paginering noteras inte. 33 Den penna som huvudsakligen har använts i den löpande texten anges först, därefter eventuella pennor som förekommer i mindre utsträckning i den löpande texten, och till sist pennor som förekommer enbart i tillägg och/eller strykningar. I den löpande texten När det förekommer flera pennor eller händer i den löpande texten räcker det självfallet inte att man redovisar det i <teiHeader>. Man måste också ange vilka textavsnitt som är skrivna av vem, och med vad. Detta sker med hjälp av det tomma elementet <handShift/> och attributet medium: Ex. 1: på fredag. <handShift medium="pencil"/>Nästa vecka [...] I exemplet ovan har Topelius alltså bytt till blyertspenna. OBS: <handShift/> måste införas också strax före texten börjar så att det framgår vilken penna som används först: Ex. 1: <p><handShift medium="blue-ink"/>Här börjar texten och Topelius skriver med blått bläck. <handShift medium="pencil"/>Här har Topelius använt blyertspenna. <handShift medium="blue-ink"/>Här har han återgått till att skriva med bläck. Attributet medium kan ha följande värden: pencil blue-pencil black-ink blue-ink brown-ink red-ink violet-ink blyerts blå färgpenna svart bläck blått bläck brunt bläck rött bläck violett bläck OBS: I sådana fall där texten är skriven med två klart urskiljbara nyanser av samma bläckfärg kombineras det andra bläckets attributvärde med värdet Other till t.ex. black-inkOther. Flera värden kan vid behov tas i bruk, men de bör i så fall införas i denna manual. Ifall det finns flera händer i ett manuskript införs detta på följande sätt i <teiHeader>: <profileDesc><handNotes> <handNote id="ZT" medium="blue-ink">Zacharias Topelius</handNote> <handNote id="ET" medium="blue-ink">Emilie Topelius</handNote> </handNotes></profileDesc> Manuskriptets ”händer” anges på det här sättet om det t.ex. är fråga om ett brev som Zacharias och Emilie skrivit tillsammans. Om skribentens identitet är känd används initialer. Handens id måste vara unikt, så om någon har samma initialer som Topelius ersätter man den första bokstaven i för- eller efternamnet med den andra. Ifall skribentens identitet inte kan fastställas med säkerhet används som id-värden h1, h2 o.s.v. En hand som enbart infört 34 paginering i manuskriptet noteras inte. Strax före textens början anger man vem som skrivit först. Det sker med det tomma elementet <handShift/> och attributet new: <p><handShift new="#ZT"/>Här börjar texten.[...]</p> Observera brädgårdstecknet som används vid hänvisning till ett id. Ifall det inte enbart finns flera händer i manuskriptet utan Topelius dessutom använt flera olika pennor måste man införa värden för såväl hand som penna: <handShift new="#ZT" medium="blue-ink"/> Byte av hand i den löpande texten anges i princip på samma sätt som byte av penna, men med attributet new: <p><handShift new="#ZT" medium="blue-ink"/>Här börjar texten och Topelius håller i bläckpennan. <handShift new="#ET"/>Här har Emilie skrivit några rader. <handShift new="#ZT" medium="pencil"/>Här har Topelius fortsatt att skriva och övergått till att använda blyertspenna.</p> I exemplet ovan finns det alltså (minst) två skribenter – ZT och ET – och den förstnämnda använder (åtminstone) blått bläck och blyerts, medan den senare endast bara använder en slags penna (vilken det är framgår av <handNote> i <teiHeader>). OBS: Vid byte av penna räcker det med att man anger medium i <handShift/>, men vid byte av skribent anges alltid såväl new som medium, förutsatt att skribenten som anges i new använder flera slags pennor i manuskriptet ifråga. I tillägg, strykningar, ändringar och fotnoter Det ovannämnda berör alltså byte av hand eller penna i den löpande texten. När tillägg, strykningar, övriga ändringar och fotnoter skrivits/införts av annan hand eller med annan penna används inte <handShift/> utan enbart attributen hand respektive medium. Attributen kan användas i elementen <add>, <addSpan/>, <del>, <delSpan/>, <note>, <restore>, <subst> och <switchPos>. Om ett tillägg är skrivet av en annan hand än den som skrivit den närmast föregående texten kodas detta på följande sätt: Ex. 1: <add hand="#ET" place="rightMargin">Ett tillägg som skrivits av Emilie Topelius i högermarginalen</add> Ifall Topelius skrivit ett tillägg med annan penna anges det så här: Ex. 1: <add medium="pencil">tillägg skrivet över raden med blyerts</add> Vid strykningar kan hand användas i <del> om man vet vem som stått för strykningen, och det inte är samma person som skrivit det närmast föregående: Ex. 1: <del hand="#NN">struket av NN</del> Man kan också ange att strykningen har gjorts med blyerts: Ex. 1: <del medium="pencil">struket med blyerts</del> 35 Observera att hand och medium också får användas i <gap/> och <unclear> − i kombination med reason="overstrike" − i de fall då det strukna i sin helhet är oläsligt eller svårläst till följd av strykningen. Om ett textavsnitt skrivet av annan hand har strukits i sin helhet så kodas detta: <handShift new="#ET"/><del>text som skrivits av annan hand och strukits</del><handShift new="#ZT"/> [...] I exemplet har alltså ett textavsnitt som skrivits av Emilie Topelius strukits. Det strukna textavsnittet föregås och efterföljs av text som skrivits av Topelius. Kodningen i exemplet innebär att det inte tas ställning till vem som står för själva strykningen. Ifall man kan se att det är Emilie som har strukit ett textavsnitt som hon själv har skrivit bör man också ange hand i <del>: <handShift new="#ET"/><del hand="#ET">text som skrivits och strukits av Emilie</del><handShift new="#ZT"/> [...] Ifall man kan se att det är Topelius som strukit textavsnittet ifråga utformas kodningen på följande sätt: <handShift new="#ET"/><del hand="#ZT">text som skrivits av Emilie och strukits av Topelius</del><handShift new="#ZT"/> [...] Om det finns tillägg i tillägg räcker det att man anger hand och/eller penna i det överordnade elementet, d.v.s. det första tillägget. Detta förutsatt att tillägget-i-tillägget införts av samma hand och med samma slags penna som tillägget: Ex. 1: <add hand="#ZT" medium="pencil">en liten <add>gammal</add> stuga</add> Men ifall tillägget-i-tillägget är skrivet av annan hand eller med annan penna än det första tillägget måste detta anges: Ex. 2: <add hand="#ZT" medium="pencil">en liten <add hand="#ET">gammal</add> stuga</add> I exemplet anges enbart hand för det som Emilie skrivit: ifall hon har använt flera slags pennor i manuskriptet måste också medium anges. Ex. 3: <add hand="#ZT" medium="pencil">en liten <add medium="blueink">gammal</add> stuga</add> Topelius har först skrivit ett tillägg med blyerts, och sedan infört ett tillägg till tillägget med blått bläck. OBS 1: Eftersom <restore> (se 3.6) inbegriper såväl strykning som återtagning kan vi inte införa kodning av händer och pennor för bägge momenten. I kodningen införs vid behov pennan som använts för (eller handen som stått för) återtagandet. 36 OBS 2: Ifall <subst> (se 3.6) har underordnade element (d.v.s. då den ursprungliga texten har gått att uttyda) införs attributen hand och medium i <add>. I annat fall införs de direkt i <subst>. I understrykningar Även understrykningar som införts med en annan slags penna eller av en annan hand (i de fall man kan sluta sig till det) kodas med attributen hand och medium. Det innebär att dessa attribut också kan användas i <date>, <dateline>, <foreign>, <head> och <hi> samt i <persName>, <placeName> och <title>. I samtliga element utgör hand och medium alltså preciseringar av rend-attributets innebörd. 3.6 Ändringar Uppdaterad 15.3.2012 Strykningar Struket: Ex. 1: Sverges <del>suveräna</del> folk Eftersom det strukna består av ett fristående ord införs blanksteg både före och efter <del>taggarna. De dubbla blankstegen reduceras sedan automatiskt till ett enda. Ex. 2: <persName>Heldtska</persName> <del>familje</del>grafven Här har endast början av ett sammansatt ord strukits, och därför får det inte finnas något blanksteg mellan sluttaggen och den senare delen av ordet. Ex. 3: <p><del>Detta folk med deras</del>Om det bekräftar sig, hvad man har all anledning förmoda, att [...]</p> Om det strukna finns först på en versrad – eller först i ett textstycke – ska man inte använda blanksteg efter </del>, eftersom det då blir ett överflödigt blanksteg i början av raden/stycket vid visning av enbart den etablerade texten. Detta gäller också strykningar som kodas med unclear reason="overstrike" eller gap reason="overstrike". Ifall Topelius först strukit något, sedan skrivit något ersättande direkt efter och till sist strukit även det, kodas det hela som två skilda strykningar: Ex. 4: Det var <del>ej</del> <del>icke</del> kanske [...] Om däremot flera ord efter varandra överstrukits med ett streck per ord, men det ändå står klart att det är fråga om text som strukits på en gång, införs allt det strukna i ett och samma <del>-element. OBS: Ifall det strukna inte går att tyda: se avsnittet om kodning av oläslig text. Struket och ersatt: Ex. 1: de röda <del>blommorna</del> <add>rosorna</add> hade [...] 37 När ett fristående ord har strukits införs blanksteg mellan sluttaggen </del> och starttaggen <add>. Ex. 2: <p><del>Blommorna</del><add>Rosorna</add> hade [...]</p> Om det strukna finns först på en versrad – eller först i ett textstycke – införs inget blanksteg mellan sluttaggen </del> och starttaggen <add>, eftersom det då blir ett överflödigt blanksteg i början av raden/stycket vid visning av enbart den etablerade texten. Ex. 3: men <del>blom</del> <add>ros</add>orna hade [...] Ex. 4: blomm<del>orna</del><add>an</add> hade [...] I ex. 3 har början av ett fristående ord strukits och ersatts, och vid visning av enbart den slutliga texten reduceras blankstegen till ett enda. I ex. 4 har slutet av ett ord strukits och ersatts, och därmed får det inte finnas något blanksteg mellan sluttaggen </del> och starttaggen <add>. OBS: Ifall det strukna inte går att tyda: se avsnittet om kodning av oläslig text. Ersättningar Ersättning på raden: Ex. 1: <subst>Gif</subst> <subst> används när ett (eller flera) ord skrivits direkt ovanpå – inte ovanför – ett annat ord (andra ord), eller när en bokstav (enstaka bokstäver) skrivits på en annan bokstav (andra bokstäver). Om texten som ersatts är oläslig används enbart taggen <subst>, vilket avviker från TEI Guidelines för att underlätta kodningsarbetet. I exemplet ovan har alltså Gif ersatt något oläsligt. Om man kan se vad som blivit ersatt specificerar man det genom att använda taggarna <del> och <add> inne i <subst>-taggen: Ex. 2: <subst><del>k</del><add>K</add></subst> Här har k ersatts av K. Ex. 3: <subst><del>den</del><add>henne</add><subst> I det här exemplet har ett helt ord ersatts av ett annat, som skrivits ovanpå det första: observera att det inte ska finnas något blanksteg mellan orden. Text som är svårläst och har skrivits ovanpå annan text: Ex. 4: <l>Som svor att a<subst><unclear reason="writing" resp="NN">ld</unclear></subst>rig mig svika;</l> Avgränsning: Huvudregeln är att allt som har skrivits ovanpå inkluderas i <add>. Ifall t.ex. ts har skrivits på ns i slutet av ett ord kan man ändå inkludera enbart bokstaven t, åtminstone om s:et bara har förstärkts litet. I de fall då t.ex. ll har ändrats till tt är det ju inte fråga om att tt helt konkret har skrivits ovanpå, utan Topelius har dragit ett streck, men vi måste ändå koda det som om tt skrivits på ll. <subst>-kodningen kan definieras som att x ändrats till y genom påskrivning/överskrivning. 38 Ett ord har först skrivits på ett annat (läsligt) ord, och sedan strukits: Ex. 1: <del><subst><del>de</del><add>i</add></subst></del> i har först skrivits på de och sedan strukits. Först anges den senaste ändringen, alltså att allt har strukits (med <del>), sedan anges (med <subst>) att det är fråga om en ersättning, därefter återges det ersatta (mellan <del> och </del>) och vad det ersatts av (mellan <add> och </add>). Sedan stängs taggarna <subst> och <del> i rätt ordningsföljd, så att den först öppnade stängs sist. Det är ingen skillnad om det som blivit ersatt eller det som skrivits istället uppges först. Exempelfallet kan alltså också kodas <del><subst><add>i</add><del>de</del></subst></del>. Flera ersättningar ovanpå varandra: Ex. 1: mi<subst><del>g</del><del><add>tt</add></del><add>n</add></subst> Här har mig först ändrats till mitt och sedan till min. TEI rekommenderar inte att ha flera <subst> innanför varandra, istället har man flera <del> efter varandra; det tillagda men sedan strukna kodas med <add> innanför <del>. Tillägg Infogat eller skrivet över raden: Ex. 1: denna <add>lilla</add> stuga Att ett tillägg är skrivet över raden utgör det förvalda värdet för <add> och behöver alltså inte anges explicit. Infogat eller skrivet över raden med annan penna: Ex. 1: <add medium="pencil">signad</add> Attributet medium kan alltid användas i <add>, även i kombination med place. Infogat eller skrivet under raden: Ex. 1: <add place="sublinear">lundarnas</add> Tillägg på raden: Ex. 1: <add place="inline">[tillägg]</add> Tillägg kan kodas med place="inline" även om de är skrivna helt eller delvis i marginalen, förutsatt att de är skrivna på raden, i bemärkelsen införda på samma sidhöjd som närmast föregående rad (och det därmed inte har funnits något behov av att förankra tillägget). Dessa tillägg utgör alltså en naturlig förlängning av raden. Struket tillägg: 39 Ex. 1: denna <add><del>lilla</del></add> stuga Ifall det strukna tillägget inte är skrivet över raden används place i <add>. OBS: <del> placeras innanför <add>! Tillägg-i-tillägg, strykning-i-strykning etc. Ett <add>-element kan vara inneslutet i ett annat <add>-element, och ett <del>-element i ett annat <del>-element. Ett <add>-element kan också vara underordnat ett <del>-element och vice versa. Ordningsföljden behöver i praktiken aldrig anges explicit, eftersom det står klart att t.ex. tillägget-i-tillägget måste ha införts efter det större tillägget, och att strykningen-itillägget har gjorts efter att tillägget skrivits in. Ex. 1: och <add>den <add>vackra</add> röda</add> stugan I exemplet lyder alltså det första tillägget den röda, och tillägget-i-tillägget är vackra. Tillägg-itillägg och strykningar-i-strykningar måste synas vid visning. OBS: Se även avsnittet om sofortkorrekturer. Alternativ skrivet över raden, utan att något strukits: Båda alternativen placeras innanför <seg type="alt">, och det alternativ som skrivits ovanför raden står dessutom innanför <add reason="choice">. Ex. 1: d<seg type="alt">rifvors<add reason="choice">römmars</add></seg> I exemplet har römmars skrivits över raden ovanför rifvors, som alltså inte strukits. Ex. 2: De sv. krönikorna tyckas, <seg type="alt">i <add reason="choice">efter</add></seg> deras naiva sätt att se saken, [...] Topelius har skrivit efter ovanför raden, utan att stryka i. Tillägg på, över eller under raden som inte passar in i texten: När något har tillagts på, över eller under en rad men ändå inte verkar höra hemma på just det stället i texten används type="noAnchor". Utgivaren kanske dessutom hellre vill placera tillägget någon annanstans än exakt där det har skrivits in, och det är också tillåtet i det här fallet. Ex. 1: <p>[...] Då föll jag på det rådet att skjuta en skatstek; <del>men</del> jag laddade bössan, men skatorna de voro för sluga. <persName>Ovidius</persName> måste då trösta mig. <persName>A. Dyhr</persName> var här. <add place="inline" type="noAnchor">(jag red)</add></p> Topelius har uppenbarligen gjort ett tillägg till sin dagboksanteckning i efterhand. Den enda lediga platsen för ett tillägg var i början på anteckningens sista rad. Raden är följaktligen skriven som (jag red) måste då trösta mig. A. Dyhr var här. Tolkningen är ändå att meningen först lydde Ovidius måste då trösta mig. och att (jag red) helt enkelt är ett senare tillägg som inte fick plats någon annanstans och inte har något med Ovidiusmeningen att göra. Utgivaren 40 har därför placerat tillägget sist på raden där det passar in bättre, och markerat att placeringen inte är entydig med type="noAnchor". Eftersom tillägget ändå är skrivet på raden måste place="inline" användas. Principerna för tilläggets placering är de samma som för oförankrade tillägg i marginalen, se nedan. Förankrade tillägg i marginalen: Infogade eller på annat sätt förankrade tillägg i marginalen anges med attributet place, som tilldelas värdet leftMargin, rightMargin, topMargin eller botMargin. Ifall tillägget är skrivet på sidan innan eller sidan efter används previousPage och nextPage, som kan kombineras med värdena ovan. Ofta finns en symbol i den löpande texten och en likadan symbol vid tillägget i marginalen, men symbolerna återges inte utan tillägget placeras på symbolens plats i den löpande texten. Ex. 1: [...] <add place="leftMargin">Gif mig</add> [...] Om attributet place inte används tolkas det som att texten infogats/skrivits över raden! Ex. 2: [...] <add place="nextPage rightMargin">[ett långt tillägg som Topelius inte fick plats med i marginalen på den sida där tillägget enligt symbolen ska placeras]</add> [...] OBS: Att ett tillägg har inskrivits vertikalt eller diagonalt registreras inte i kodningen. Det kan däremot anges i manuskriptbeskrivningen. Oförankrade tillägg i marginalen: a) om ett tillägg som skrivits i marginalen inte är förankrat (t.ex. med en symbol) men ändå tydligt anknyter till ett visst ställe i texten kan det införas där, förutsatt att man i <add>elementet anger type="noAnchor". place ges ett marginalvärde och <add> införs innanför <p>. b) Ifall ett oförankrat tillägg inte entydigt kan lokaliseras till ett visst textställe kan det införas mellan två textstycken, på ungefär samma sidhöjd där tillägget börjar.6 Även i det fallet bör man ange type="noAnchor", men detta måste ske i ett <addSpan/>-element, eftersom tillägget måste införas inom <p>-taggar. Se avsnittet om omfattande tillägg nedan. Ex. 1: </lg> <addSpan spanTo="#add1" place="leftMargin" type="noAnchor"/><p>2</p><anchor id="add1"/> <lg> En tvåa har skrivits in i vänstermarginalen i ett diktmanuskript, och man vet inte vad den står för. Den införs mellan två strofer på det ställe i dikten som finns på ungefär samma sidhöjd. 6 Ifall det inte finns någon styckeindelning i närheten kan tillägget kodas med <add>-taggar och införas mellan två meningar på ungefär samma sidhöjd. Vid behov kan man också införa en redaktionell kommentar om att tillägget egentligen inte passar in där det placerats. 41 Attributet place bör alltså användas också vid kodning av oförankrade tillägg, och tilldelas värdet leftMargin, rightMargin, topMargin eller botMargin. OBS: Att ett tillägg har inskrivits vertikalt eller diagonalt registreras inte i kodningen. Det kan däremot anges i manuskriptbeskrivningen. Tillägg där den löpande texten vanligen är placerad: När ett tillägg har placerats där den löpande texten vanligen finns, alltså inte i marginalen men inte heller på, över eller under en rad, används place="other", som också kan kombineras med nextPage eller previousPage. Topelius kan t.ex. ha avslutat en föreläsning mitt på sidan och lämnat resten av sidan tom, men senare gjort ett tillägg till sin text, och placerat det där det fanns gott om plats, d.v.s. där den löpande texten skulle ha funnits. Beroende på om tillägget är litet eller omfattande, förankrat eller oförankrat, används antingen <add> eller <addSpan/>. Ex. 1: [...] Desse Tschuder voro påtagligen inga andra än de nu i <placeName>Rd</placeName> bosatta finska folkens förfäder, <add place="other">De vid <placeName>Dwina</placeName> boende voro påtagligen Bjarmer,</add> och deras namn har öfvergått på Esterne, som ännu i dag kallas af Ryssen <hi rend="underline">Tschuchni</hi>.</p> Tillägget är placerat efter stycket, på den tomma plats som finns genom att följande stycke börjar först på nästa sida. Tillägget är för högt uppe på sidan för att kallas tillägg i nedre marginalen. Skrivet i marginalen p.g.a. utrymmesbrist: Observera att <add>- och <addSpan/>-kodningen endast får användas för egentliga tillägg: om slutet av den löpande texten har skrivits i marginalen p.g.a. utrymmesbrist kodas detta inte (däremot kan man i en ms-beskrivning ange att slutet av t.ex. ett brev är skrivet t.ex. i högermarginalen). Omfattande tillägg och strykningar Omfattande tillägg: Man kan inte använda <add> om ett tillägg innehåller textindelande element såsom <l>, <lg>, <p>, <head> eller <closer>. <add> får innesluta <date>, men inte <dateline>. OBS: De tomma rad- och sidbrytningstaggarna <lb/> och <pb/> betraktas inte som textindelande element i det här sammanhanget. Omfattande tillägg måste i stället anges med elementet <addSpan/>, som måste innehålla attributet spanTo. Attributet måste i sin tur innehålla id:t på taggen <anchor/>, som visar var tillägget slutar. <addSpan/> och <anchor/> är tomma element och ska alltså stängas med snedstreck direkt i starttaggen. Notera att attributen place, medium och type ska användas också i <addSpan/> om man kan ange dem. 42 Ex. 1: <addSpan spanTo="#add1" place="leftMargin"/><head>[Tillagd rubrik]</head><anchor id="add1"/> Ex. 2: <addSpan spanTo="#add2"/><l>Fins i wida Suomilandet</l><anchor id="add2"/> Ex. 3: <addSpan spanTo="#add10" place="leftMargin" type="noAnchor"/><p>Jmfr Svenskar, Norrmän, Danskar.</p><anchor id="add10"/> I ex. 3 har text lagts till i marginalen utan någon förankring, och man vet inte vart den hör. Texten bildar alltså ett eget stycke som återges innanför <p>. Hela <addSpan/>-tillägget med tillhörande <anchor/> placeras mellan två stycken på den sida där maginaltillägget finns. Som id-värden används add1, add2, add3 o.s.v., men om man i samband med en senare genomgång blir tvungen att införa ett till <addSpan>-element kan man använda samma nummer som i föregående id av motsvarande slag och lägga till ett b, alltså t.ex. add2b. Varje id-värde ska förekomma endast en gång i XML-filen. Observera att <add> över huvud taget inte får innehålla textindelande element. Även om tillägget består endast av exakt en versrad kan man alltså inte införa <add>-taggar utanför <l>taggarna, utan man bör använda <addSpan/> respektive <anchor/> utanför <l>-taggarna. Detsamma gäller för tillagda strofers <lg>-taggar, och för tillagda textstyckens <p>-taggar. Att införa <add>-taggar innanför <l>-taggarna skulle vara problematiskt med tanke på visningen. Men <add>-taggar kan självfallet användas när det finns mindre tillägg inne i det omfattande tilägget. Omfattande tillägg som strukits: Den strukna texten kodas med en <delSpan/>-tagg och tillhörande <anchor/>-element. Utanför dessa införs ett <addSpan/> med tillhörande <anchor/>. Se även avsnittet om lyrikkodning för instruktioner om enstaka strukna versrader. Ex. 1: <addSpan spanTo="#add5" place="botMargin"/><delSpan spanTo="#del3"/><p>[struket omfattande tillägg]</p><anchor id="del3"/><anchor id="add5"/> Omfattande strykningar: Man kan inte använda <del> om en strykning innehåller textindelande element såsom <l>, <lg>, <p>, <head> eller <closer>. <del> får innesluta <date>, men inte <dateline>. OBS: De tomma rad- och sidbrytningstaggarna <lb/> och <pb/> betraktas inte som textindelande element i det här sammanhanget. Omfattande strykningar måste istället anges med elementet <delSpan/>, som måste innehålla attributet spanTo. Attributet måste innehålla id:t på taggen <anchor/>, som visar var strykningen slutar. <delSpan/> och <anchor/> är tomma element och ska stängas med snedstreck direkt i starttaggen. Notera att attributen medium och type ska användas också i <delSpan/> om man kan ange dem. 43 Ex. 1: <delSpan spanTo="#del1"/><p>[Struken text]</p><anchor id="del1"/> Ex. 2: <delSpan spanTo="#del2"/><l>Fins i wida Suomilandet</l><anchor id="del2"/> Som id-värden används del1, del2, del3 o.s.v., men om man i samband med en senare genomgång blir tvungen att införa ett till <delSpan/>-element kan man använda samma nummer som i föregående id av motsvarande slag och lägga till ett b, alltså t.ex. del2b. Varje id-värde ska förekomma endast en gång i XML-filen. Observera att <del> över huvud taget inte får innehålla textindelande element. Även om strykningen består endast av exakt en versrad kan man alltså inte införa <del>-taggar utanför <l>-taggarna, utan man bör använda <delSpan/> respektive <anchor/> utanför <l>-taggarna. Detsamma gäller för strukna strofers <lg>-taggar, och för strukna textstyckens <p>-taggar. Att införa <del>-taggar innanför bl.a. <l>-taggarna skulle vara problematiskt med tanke på visningen. Men <del> kan självfallet användas när det finns mindre strykningar inne i den omfattande strykningen. Omfattande strykning av oläsligt: Ifall en hel strof eller versrad eller ett helt textstycke har strukits på ett sådant sätt att texten i sin helhet blivit oläslig används <delSpan/> utanför <l>, <lg> eller <p>-taggarna. Ex. 1: <delSpan spanTo="#del2"/> <l><gap reason="overstrike" extent="3" unit="words"/></l> <anchor id="del2"/> I mindre strykningar utelämnas <del> ifall det strukna i sin helhet är oläsligt till följd av strykningen och därför kodas med <gap reason="overstrike">. Omfattande strykning i omfattande strykning: Ifall först en versrad och senare hela strofen har strukits används <delSpan rend="strikethrough"/> för den mindre strykningen. <delSpan/> innanför <delSpan/> får inte förekomma annars än i lyriken, eftersom <delSpan/> i andra genrer vanligen omfattar <p>, och man inte kan ha ett stycke innanför ett annat stycke. Ändrad ordningsföljd och flyttad text Ändrad ordningsföljd: Anges med en <switchPos>-tagg som omsluter två eller flera <item>-taggar, av vilka den första innehåller det som skrivits först och den sista det som skrivits sist. Ifall den ändrade ordningsföljden berör hela versrader, strofer eller stycken behöver emellertid <item>-taggarna inte användas, utan de ersätts då av <l>, <lg> eller <p>. Numreringen (= den slutliga ordningsföljden) bör alltid anges i attributet n, också om den ändrade ordningsföljden endast berör två <item>, <l>, <lg> eller <p> som byter plats sinsemellan. Observera att det bör finnas ett blanksteg mellan <item>-elementen, förutsatt att det är fråga om skilda teckenföljder som bytt plats sinsemellan. I något undantagsfall kanske 44 den ändrade ordningsföljden kan beröra ordleden i ett sammansatt ord, och i så fall ska inget blanksteg införas mellan <item>-elementen. Ex. 1: <switchPos><item n="2">Ett bord,</item> <item n="1">en gran</item></switchPos> Ex. 2: <switchPos> <l n="2">Denna rad är numrerad med en tvåa.</l> <l n="3">Denna rad är numrerad med en trea.</l> <l n="1">Denna rad är numrerad med en etta.</l> </switchPos> När det finns text mellan de ord som ska byta plats sinsemellan innesluts den mellanliggande texten av <item type="between" n="1b">: Ex. 1: <switchPos><item n="2">violer</item> <item type="between" n="1b">och</item> <item n="1">förgät mig ej</item></switchPos> Kodningen i exemplet innebär alltså att violer och förgät mig ej genom numrering har ändrats till förgät mig ej och violer. Även i de fall då ordningsföljden har ändrats på annat sätt än genom numrering (pilar, linjer etc.) används n för att ange slutlig ordningsföljd. Men därtill anges i <switchPos> type="unnumbered", vilket möjliggör att numrering som inte finns i manuskriptet visas. type används i <switchPos> också för att registrera att det är fråga om en sofortkorrektur: ifall ordningsföljden har ändrats omedelbart och utan numrering kodas detta med <switchPos type="immediate unnumbered">. Ex. 1: en <switchPos type="unnumbered"><item n="2">röd</item> <item n="1">gammal</item></switchPos> stuga En röd gammal stuga har ändrats till en gammal röd stuga med annat sätt än numrering, t.ex. pilar. Flyttad text: Ifall t.ex. en mening har flyttats från ett stycke till ett annat kan <switchPos>-kodning inte användas, eftersom det skulle resultera i överlappande kodning. I stället måste texten som flyttats införas två gånger. Först införs den på det ställe i manuskriptet där den verkligen står, och kodas med <del type="move">. Sedan införs texten på dess slutliga ställe, dit den flyttats, och kodas där med <add place="other" type="move">. Eftersom <add> i vår kodning har ”ovanför raden” som förvalt värde måste place="other" användas. Om det är fråga om ett helt textstycke som flyttats och integrerats i ett annat stycke används <delSpan type="move"/> och <anchor/> i stället för <del>. När ett helt textstycke flyttats och placerats på ett nytt ställe, och alltså bibehåller sin karaktär som ett självständigt stycke, används det vanliga <switchPos>, ofta med type="unnumbered", och <p n="">. Ex. 1: <switchPos type="unnumbered"> 45 <p n="2">[Stycke som fått en symbol ovanför sig, indikerande att det sista stycket ska placeras före detta stycke.]</p> <p n="3">[Detta stycke skrevs som andra stycket, men blir genom flyttningen av det sista stycket omgjort till stycke nr 3.]</p> <p n="1">[Detta stycke skrevs som tredje stycket, men symboler indikerar att det ska flyttas och komma före det första stycket, alltså bli det nya stycke nr 1.]</p> </switchPos> Återtaget Återtaget ord: Ex. 1: <restore>öfver</restore> Först struket och sedan återtaget, vanligen genom understreckning. Själva understreckningen kodas inte, eftersom den enbart påvisar återtagningen. Eftersom <restore> inbegriper såväl strykning som återtagning kan vi inte införa kodning av händer och pennor för bägge momenten. I kodningen införs vid behov pennan som använts för (eller handen som stått för) återtagandet. Även eventuell sofortkodning avser återtagandet. Återtagen versrad, återtaget stycke och liknande: <restore> får inte innehålla textindelande strukturelement som <l>, <lg>, <p>, <head>, <closer>, <dateline> o.s.v.7 Därför måste <restore>-elementet införas närmast själva texten: Ex. 1: <l><restore>Så långt man mindes han var sig lik,</restore></l> Sofortkorrekturer Om det av sammanhanget entydigt framgår att det måste vara fråga om en ändring som införts omedelbart efter nedskrivandet (s.k. sofortkorrektur, immediate correction) bör det anges i kodningen. Med ”omedelbart” avses att ändringen inte har införts i samband med en senare genomgång av manuskriptet, utan antingen genast efter att ordet/orden har skrivits, eller åtminstone innan textstycket eller strofen skrivits färdigt. OBS: Kodning för sofortkorrekturer införs i texter av konstnärlig natur, men inte i t.ex. brev, dagböcker och föreläsningar. Sofortkorrekturer kodas i övrigt på samma sätt som andra ändringar, men i den första starttaggen införs attributet type som förses med värdet immediate. Kodning för sofortkorrekturer får införas i elementen <add>, <addSpan/>, <del>, <delSpan/>, <restore>, <subst> och <switchPos>, samt i <gap> och <unclear> i kombination med reason="overstrike". Ex. 1: <add type="immediate">signad</add> 7 <restore> får emellertid innehålla de tomma rad- och sidbrytningselementen <lb/> och <pb/>. 46 Ex. 2: <subst type="immediate"><del>k</del><add>K</add></subst> Ex. 3: <del type="immediate">på</del> <add type="immediate">bort</add> I ex. 3 är det i praktiken fråga om en enda ändring: ett ord har strukits och ett ersättande ord har skrivits över raden. Eftersom vi ändå kodar det som två ändringar måste man ange att det är fråga om en sofortkorrektur såväl i <del> som i <add>. Ändring i sofortkorrekturer: Ifall det finns en strykning eller ett tillägg inne i en sofortkorrektur är det förvalda värdet att de kan vara införda senare, om det inte skilt anges i kodningen att också de är omedelbart införda. Ifall man kan sluta sig till att också strykningen-i-tillägget eller tillägget-i-tillägget har införts omedelbart bör även det därför kodas med type="immediate". Ex. 1: [...] han gick omkring <add type="immediate">i sin <add>röda</add> stuga </add> och [...] I det fiktiva exempelfallet har man alltså kunnat sluta sig till att i sin stuga har tillagts omedelbart, medan röda kan ha införts först vid en senare genomgång. OBS: En ändring bör kodas som sofortkorrektur också om det omedelbara tillägget senare har strukits (eller ingår i t.ex. en versrad som helt har strukits), eller om en omedelbart införd strykning senare har återtagits. 47 4 Semantisk kodning Samtliga namn på personer, platser och verk förses med kodning. Dessutom kodas förekomster av främmande språk. Ett namn kodas alltså även om samma namn förekommit t.ex. på föregående rad. 4.1 Personnamn Uppdaterad 23.9.2013 Vi kodar namn på såväl historiska, fiktiva, mytologiska som bibliska personer. I brev och dagböcker kodas också personreferenser, t.ex. min förläggare eller mamma (se Brev 8.3). Olika benämningar på Gud och Jesus kodas inte, såvida inte Jesus är t.ex. en av personerna i en biblisk saga. Namn på djur, fartyg och liknande kodas inte. Strängt taget kodar vi inte personnamn utan namn på personer. Ett namn som förekommer i texten kodas om det kan kopplas direkt till en person; levande, död, fiktiv eller mytologisk. Det här innebär att ifall ett fartyg har uppkallats efter en person kodas namnet alltså inte med <persName>. Det innebär också att t.ex. ett omnämnande av Christina-dagen inte kodas, förutsatt att det bara är fråga om en tidsangivelse. Ifall däremot någon med en dotter vid namn Christina uppger att familjen ska fira dagen ifråga är det en indirekt personreferens som bör kodas. Ex. 1: <persName>Gustaf III</persName> Ex. 2: <persName>Gustaf III:s</persName> Ifråga om genitivformer införs ändelsen i såväl <persName> som andra namnelement. Efterföljande skiljetecken inkluderas däremot inte i namnkodningen, förutom när de hör till själva namnet (i allmänhet bara punkter i förkortade namn). Ex. 3: <persName>B. J.</persName> fann dock nödigt att intränga i hjertat af deras land. B. J. står för Birger Jarl, och punkten kodas här eftersom den hör till förkortningen, d.v.s. namnet. Ex. 4: <persName rend="expanded">Carl von Linné</persName> Här är namnet Carl von Linné utmärkt med spärrad stil i grundtexten. Ex. 5: <persName>Runebergska</persName> boksamlingen Ifall avledningar som Runebergska ska kodas eller inte avgörs av sammanhanget: namnkodning införs om det är Runebergs egen boksamling som avses, men inte om det är fråga om en boksamling som av någon anledning uppkallats efter honom. Hela avledningen kan tas med innanför taggarna. Titlar inkluderas som regel i namnkodningen endast om personen omnämns med titel och enbart för- eller efternamn. Till titlar räknas både allmänt använda titlar och vissa bestämningar som visar på en familjär relation: 48 Ex. 1: <persName>lektor Andersson</persName> Ex. 2: magister <persName>Anders Andersson</persName> Ex. 3: <persName>fröken Johansson</persName> Ex. 4: fru <persName>Johanna Johansson</persName> Ex. 5: <persName>mamsell Beata</persName> Ex. 6: <persName>furstinnan Gregorzewska</persName> Ex. 7: <persName>öfverste von Hagen</persName> Ex. 8: <persName>Pettersson</persName>, expedit i kolonialvaruaffären Ex. 9: <persName>Lilla Sophie</persName> Bestämningar som lilla, vackra, unga och liknande tas annars inte med i namnkodningen, men i det här fallet är Lilla Sophie den stående benämningen på Topelius kusin, för att skilja henne från Topelius syster med samma namn. Ex. 10: gamla <persName>Rebecka</persName> Ex. 11: <persName>broder Blank</persName> Ex. 12: <persName>Tante Backman</persName> Broder Blank och tante Backman är stående benämningar på dessa personer och kan i brev och dagböcker namnkodas i sin helhet. Ex. 13: faster <persName>Grete Charlotte</persName> Inom övriga genrer är det inte nödvändigt att koda familjära bestämningar, men allmänt använda titlar bör kodas. Ifråga om kungligheter kan man lämpligen exkludera konung eller motsvarande i de fall då själva namnet signalerar att det är fråga om en kunglighet: Ex.1: <persName>konung Christophers</persName> Ex.2: konung <persName>Johan III:s</persName> När en titel inkluderas i namnkodningen ska <foreign>-kodning användas om titeln är på ett främmande språk. Personnamn xml:lang-kodas sällan, närmast t.ex. om en kung omnämns som Louis XIV i stället för det etablerade svenska namnet Ludvig XIV. Ex. 1: <persName><foreign xml:lang="fre">Monseigneur</foreign> François</persName> Ex. 2: <persName xml:lang="fre" rend="italics">Louis XIV</persName> Familjer, släkter och ätter kodas också med <persName>: Ex. 1: <persName>ätten Horn</persName> Ex. 2: <persName>familjen Anders Andersson</persName> 49 Ifall flera varandra närstående personer omnämns med en gemensam benämning utan att de direkt utgör en familj – t.ex. systrarna Lithén, Armfeltska arfvingarne eller Gezeliernas – kodas de med <persName> så att regelrätta släktbeteckningar står innanför elementet. I en efterföljande punktkommentar nämns de olika personerna vid namn, de <persName>-kodas även i kommentaren och länknings-id:n införs. Ex. 1: <persName>systrarna Lithén</persName> Ex. 2: <persName>Armfeltska</persName> arfvingarne Som regel bör man undvika att inkludera annat än namn, titlar och släktord i namnkodningen: Ex. 1: <persName>Anders Andersson</persName> och hela hans familj Ex. 2: <persName>kamereraren Tengström</persName> sedan adlad med Adlercreutz Adlercreutz kan också namnkodas, i synnerhet om personen är mera känd under det namnet. Ex. 3: kapellan i <placeName>Kalajoki</placeName> <persName>E. R. Alcenius</persName> Flera personnamn får inte införas i samma <persName>-element. Om det står biskoparne Mennander och Tengström utelämnas därför titeln från kodningen: Ex. 1: biskoparne <persName>Mennander</persName> och <persName>Tengström</persName> Binamn som smek- och öknamn kodas när de är namnlika. Eventuella citattecken som signalerar att ett personnamn är av informell natur inkluderas i namnkodningen. Ex. 1: <persName>Lasse</persName> Ex. 2: <persName>”Lillan”</persName> Ex. 3: <persName>Lars Löf</persName> kallades för <persName>Löfven</persName> Benämningar av typen gullet, ryssdrottningen, den vansinniga, Vargen, Kurvilan herra eller mors lilla hjälpreda kodas inte, även om de kan uppfattas som smek- och öknamn. Härskartitlar såsom Kungen, Hans Majestät, storfursten (af Finland), tsaren, kejsarinnan, påfven och presidenten kodas när de syftar på ett visst statsöverhuvud. När härskartiteln syftar på t.ex. konungen som institution eller används rent generellt kodas den inte. Hövligt tilltal som ersätter ett pronomen kodas inte heller. Om det i en text, t.ex. en föreläsning, förekommer ett större antal härskartitlar, räcker det om varje titel kodas en gång per sida. I brev och dagböcker kan kodning av härskartitlar skötas med <rs>-kodning. Ex. 1: ”<persName>Kungen</persName> kommer!” Och <persName>Gustaf III</persName> kom verkligen. Ex. 2: <persName>Czaren</persName> undertecknade fredsfördraget. Ex. 3: ”Ers Majestät, se sig före!” 50 Ex. 4: ”<persName>Hans Majestät</persName> har inspekterat vakterna och vill tala med kommissarien.” Ex. 5: Den monark, som bestiger <placeName>Rysslands</placeName> thron, är i samma ögonblick Storfurste af <placeName>Finland</placeName>. Andra titlar än härskartitlar, t.ex. hertigen, grefvinnan, öfversten och häradshöfdingen namnkodas inte när de förekommer utan för- och efternamn, även om de syftar på en viss person. ”Fullständiga titlar”, t.ex. hertigen af Södermanland och prinsen af Nassau, som blivit etablerade för benämnandet av en viss person och nästan kommit att ersätta personens egentliga namn, jämställs med härskartitlar och kodas när det egentliga namnet inte nämns någonstans i närheten. Om de förekommer ofta räcker det om titeln kodas en gång per sida. Ex. 1: Modren hade alltid haft stort välde öfver den fromsinte häradshöfdingen. Ex. 2: <persName>Häradshöfding Peron</persName> Ex. 3: ”Det är hon sjelf, det är hertiginnan af Finland!” Eva Merthen benämns visserligen hertiginnan af Finland, men ännu oftare nämns hon med sitt egentliga namn, så det är onödigt att namnkoda förekomsterna av titeln. Ex. 4: ”Hvad är det som kornetten har att andraga?” sade generallöjtnanten. Ex. 5: <persName>Prinsen af Nassau</persName> hade bättre lycka; [...] Ex. 6: ”Min far ber Hans Kongliga Höghet <persName>Hertigen af Orleans</persName> vara välkommen till denna ringa koja”, ljöd åter samma klangfulla röst. Hertigen af Orleans nämns i texten två gånger vid sitt egentliga namn Louis Philippe d’Orleans, men kallas annars bara för Hertigen af Orleans. Därför är det motiverat att namnkoda den fullständiga titeln. Kortformen hertigen kodas däremot inte. Platsnamnet i titeln behöver inte kodas: se avsnittet om geografiska namn. 4.2 Geografiska namn Uppdaterad 19.10.2011 Geografiska namn införs i elementet <placeName>: Ex. 1: På <placeName>Helsingfors’</placeName> gator [...] Efterföljande skiljetecken tas med i namnkodningen bara om de hör till namnet, såsom genitivapostrofen i exemplet ovan, eller t.ex. en punkt i ett förkortat namn. Vid kodandet bör man utgå från vad som finns i ett traditionellt register. Sådant man inte upplever som platser som sätts i ett register ska kanske inte heller kodas. Platser ska dessutom ha ett namn, vare sig det är officiellt eller inte. Jorden, verlden och månen kodas inte. 51 Orter och platser som kodas bör vara geografiskt avgränsade, även om man inte nödvändigtvis behöver veta exakt var gränsen går. För många historiska områden vet man inte alltid var gränsen gått, eller så har gränserna varit mycket varierande under olika tidevarv. I dessa fall ska man ändå utgå från samma principer som med nutida platser. T.ex. Tatariet, ett medeltida namn på området mongolerna erövrade i Ryssland och mellersta Asien, kan ses som ett geografiskt begränsat område, trots att några exakta gränser inte funnits. Fiktiva platser har naturligtvis inga riktiga gränser, men kan ändå uppfattas som på något sätt geografiskt begränsade: Edens lustgård, Pohjola. Versaler och gemener ger inte samma vägledning som i dag: Topelius använder t.ex. ofta gement n i norden. I sammansatta ord med ortnamn som första led kodas endast själva ortnamnet: Ex. 1: <placeName>Jääskis</placeName>-bonden Ex. 2: <placeName>Åbo</placeName>freden eller Åbofreden, beroende på sammanhanget. Ex. 3: i <placeName>Ladoga</placeName>trakten Sammansättningar bedöms från fall till fall. Eftersom t.ex. Jääskis-bonden lever och verkar på orten ifråga kan det vara motiverat att namnkoda förleden. Beträffande t.ex. Wiborgskringlan och Wienerflygeln är kopplingen till platsen oftast irrelevant och det hela kan uppfattas som ett namn på vilket som helst bakverk eller instrument (och bör alltså inte kodas). Sammansatta geografiska namn som Åbo slott kodas som en helhet, ingen skild namnkodning införs alltså för Åbo. Geografiska namn i förkortad form kodas också, t.ex. <placeName>F.</placeName> (Finland) och <placeName>F. viken</placeName>. Adjektiv och andra avledningar som bildats utgående från geografiska namn kodas inte. Ex: Helsingforsiansk, tavastländsk, aboensare, Ålänning, finlandismer Omskrivningar som den stolta kejsarestaden namnkodas inte. Geografiska namn kodas bara då de verkligen syftar på sig själva och en riktig anknytning till platsen finns, vilket får avgöras från fall till fall. Starkt etablerade och allmänt använda benämningar som till viss del ersatt det verkliga namnet kodas dock som geografiska namn, på samma sätt som härskartitlar kodas som personnamn. Ex. 1: <placeName>Stockholm</placeName> kallas ibland Nordens Venedig. Omskrivningen Nordens Venedig är ingen geografisk beteckning och kodas därför inte. De två geografiska namn som ingår i omskrivningen syftar inte tillbaka på sig själva och ska alltså inte heller kodas: det talas ju inte om det verkliga Venedig utan om Stockholm. Ex. 2: <title>Helsingfors Tidningar</title> Helsingfors Tidningar utkom visserligen i Helsingfors, men platsen som ingår i titeln är oftast av underordnad betydelse när man talar om tidningen. Ex. 3: Mödrarna i <placeName>det heliga landet</placeName> förde sina barn till Jesus. Det heliga landet kan anses vara en så väletablerad benämning att den kan kodas som ett geografiskt namn. 52 Ex. 4: <persName>Hertigen af Orleans</persName>, dåförtiden fransk emigrant och vorden skollärare i <placeName>Reichenau</placeName>, [...] Geografiska namn som ingår i personers namn och titlar behöver i regel inte kodas. Geografiska namn som ingår i namn på militärenheter kodas inte heller. I det fallet är anknytningen till platsen oftast inte är så stark eftersom regementet i krig i allmänhet befinner sig någon annanstans än på sin hemort, och dessutom är det svårt att avgöra om namnet ska knytas till staden, länet eller landskapet. Ex. 1: ”Infanteriet var det och icke kavalleriet!” invände lika hetsigt en Åbo läns ryttare. Ex. 2: Tavastehus bataljon höll ut ett ögonblick längre, men [...] Ex. 3: Ryttmästaren vid Nylands dragoner <persName>Göran Roos</persName> [...] Namn på flera olika platser får inte inkluderas i ett och samma <placeName>-element även om det står Bottniska och Finska vikarna eller Uleåborgs, Wasa och Kuopio län. Detta bl.a. för att det ska vara möjligt att införa länknings-id:n, som självfallet införs i enlighet med den markerade textens betydelse i sammanhanget, dvs. Wasa länkas till Wasa län, inte till staden. Ex. 1: <placeName>Bottniska</placeName> och <placeName>Finska vikarna</placeName> Ex. 2: <placeName>Uleåborgs</placeName>, <placeName>Wasa</placeName> och <placeName>Kuopio län</placeName> Ex. 3: <placeName>Letala</placeName> och <placeName>Wirmo</placeName> gamla kyrkor Ex. 4: <placeName>Helsingfors</placeName>, <placeName>Finland</placeName> Flera ortnamn som följer på varandra kodas skilt för sig, även om de betydelsemässigt hänger samman. Endast avgränsade geografiska namn och platser införs i namnkodningstaggarna. Vattensystemerna i Väst-Tavastland är t.ex. ett alltför vagt område för att kunna kodas i sin helhet, endast Väst-Tavastland ses som en plats. Av Imatras östra strand kodas alltså endast Imatra, medan hela Saima kanals mynning däremot kan kodas, eftersom det är fråga om en preciserad och etablerad plats. Ex. 1: <placeName rend="underline">Maanselkäs</placeName> högsta punkt Den högsta punkten har antagligen ett eget namn och ses därför här bara som en omskrivning. Ex. 2: <placeName>Nilens delta</placeName> Platsen är geografiskt avgränsad och benämns just så här, namnet är etablerat i denna form. Väderstreck i anslutning till geografiska namn ska inte inkluderas i kodningen, såvida inte de är en del av det officiella namnet eller en del i ett sammansatt geografiskt namn: Ex. 1: norra <placeName>Finland</placeName> Ex. 2: <placeName>Väst-Asien</placeName> 53 Ex. 3: <placeName>Sydsverige</placeName> Ex. 4: <placeName>södra esplanaden</placeName> Ex. 5: vestra <placeName>Brunnsparken</placeName> Andra likartade bestämningar följer samma princip: Ex. 1: <placeName>Nedre Sääksmäki härad</placeName> Nedre hör till den officiella benämningen och är alltså en del av namnet. Ex. 2: medlersta delen af öfre <placeName>Karelen</placeName> Ex. 3: i <placeName>Europas</placeName> midt Ex. 4: från <placeName>främre Tölö</placeName> via bortre <placeName>Sibbo</placeName> till <placeName>Lilla Abborfors</placeName> Norden eller norden kodas, förutsatt att man uppfattar att det är ett någorlunda tydligt avgränsat geografiskt område som avses och inte bara motsatsen till ”södern”. Det har visat sig att det ofta är svårt att bedöma om norden och finska norden utgör ett geografiskt namn, och kodaren måste avgöra från fall till fall hur namnet ska tolkas. Om finska norden avser antingen Lappland eller ”Finland som en del av Norden” ska det kodas i sin helhet. Om finska norden däremot avser norra Finland ska det inte kodas alls, eftersom norra Finland inte är ett avgränsat område. Att då bara koda delen norden i finska norden är också missvisande, eftersom Norden är ett annat område än det som avses. Ex. 1: Qvenerne följde Lapparne och invandrade i den <placeName>finska norden</placeName>. Troligen avses Lappland. Ex. 2: För öfrigt funnos troligen inga tempel i hela den finska norden. Det är mycket svårt att avgöra vilket område som avses. Ifall platsen är lika med norra Finland är det logiskt att inte använda <placeName>. I gatuadresser kan både gatunamnet och numret inkluderas i namnkodningen: Ex. 1: <placeName>Ålandsgatan 17</placeName> Sammanhanget är i vissa fall avgörande för vad <placeName>-kodningen omfattar. T.ex. kodas hela Borgå stift eller Åbo erkestift med <placeName> när det är det geografiska området som avses snarare än själva den administrativa enheten. Socken, stad, kapell, pastorat och by tas enligt sammanhanget med eller inte med i <placeName>-kodningen. Län, domsaga, lagsaga och härad tas alltid med i kodningen i sin helhet. Ex. 1: <placeName>Limingo by</placeName> Ex. 2: <placeName>Uleåborgs län</placeName> Ex. 3: <placeName>Vehmo domsaga</placeName> Ex. 4: <placeName>Helsingfors</placeName> stad 54 Preciseringen stad tillför inte kodningen något eftersom Helsingfors alltid är en stad. Här får man dock vara uppmärksam, eftersom t.ex. Nådendals stad är en annan ort än Nådendal. Ex. 5: <placeName>Anjala</placeName> gästgifveri Anonymt gästgiveri i Anjala, orten får anses vara den viktigare delen i namnet. Om gästgifveriet har en mer framträdande roll i texten kan namnet kodas i sin helhet. Ex. 6: <placeName>Elimä skog</placeName> Ex. 7: <placeName>Nattsjö gård</placeName> Stället benämns ofta bara Nattsjö, men om hela namnet förekommer tas det med i kodningen. Ex. 8: <placeName>Kronoby hospital</placeName> Plats med officiellt namn där det kan bli missvisande att bara koda Kronoby. Namn på affärsverksamheter och liknande jämställs med geografiska namn och kodas när det är platsen som åsyftas. Byggnader (men inte enskilda rum), hemman, egendomar, parker, gator och torg anses också som geografiska namn. Liksom gällande de informella benämningarna måste platsen ha ett namn och en viss grad av bekanthet för att kodas. Ex. 1: Sedan hem och efter en stund till <placeName>thejungfrun</placeName> hvarest det var mycket folk. Ex. 2: Tivolitheatern ger <title xml:lang="fre">La reine de la crinoline</title>, mimik i 2 förhängen. I exempel 2 åsyftas verksamheten snarare än platsen. Ex. 3: Jag promenerade till <placeName>Tivolitheatern</placeName>. Ex. 4: Jag tog ett lokomobil och sökte min fristad i <placeName>Turjas hotel</placeName> om fyra våningar, beläget vid hörnet af en åt öster löpande gata strax i söder om bangården. Ex. 5: Emellertid uppstod ett rykte bland de promenerande, att det var ecklärering i <placeName>Sinebruchoffska trädgården</placeName> borta vid <placeName>Sandviken</placeName>, [...] Ex. 6: Vester om viken ser man <placeName>Thölö sockerbruk</placeName>. Ex. 7: I samma nejd stå <placeName>ryska hospitalet</placeName> och <placeName>ryska kyrkan</placeName>. Ex. 8: Droschkan framilade uppför den lilla backen vid <placeName>universitetsapotheket</placeName> och <placeName>Etholénska boden</placeName>. Informella benämningar som domkyrkan, hofrätten eller ån kodas som regel, förutsatt att de syftar på en känd, namngiven plats med officiella drag. Det kan jämföras med att vi kodar smeknamn på personer: precis som Per-Erik Eriksson i sin närmaste krets kallas Pelle så benämns Åbo domkyrka endast domkyrkan av aboensarna. Ex. 1: Talrika vandrare befolkade promenaden närmast <placeName>salutorget</placeName> i <placeName>Helsingfors</placeName>. 55 Ex. 2: Vandraren passerade torget och kyrkan på vägen till sockerbagareståndet vid parken. Benämningar på anonyma platser. Om Topelius tidigare i texten beskrivit vandrarens upplevelser på Stortorget i Helsingfors och det är klart att torget syftar tillbaka på detta kan torget kodas. Geografiska namn förses med xml:lang-kodning om de har svenska namn men ett namn på främmande språk ändå används. Även grafiskt markerade namn kodas. Ex. 1: <placeName xml:lang="fin">Hämeenlinna</placeName> Ex. 2: Ett bref adresseradt till <foreign xml:lang="fre">Monsieur le Lieutenant</foreign> <persName>Lorenz Lehmann</persName>, <placeName xml:lang="fre">place du senat</placeName>. Löjtnanten bor vid Senatstorget i Helsingfors. Ex. 3: på <placeName>Downing Street</placeName> Detta är att betrakta som det svenska namnet, eftersom inget annat etablerat svenskt namn finns för platsen. Därmed behövs ingen xml:lang-kodning. Ex. 4: <persName>Wns</persName> ridt till <placeName>Tuonela</placeName> Inget svenskt namn finns. Ex. 5: <placeName rend="italics">Olympen</placeName> Kursiverat platsnamn. 4.3 Namn på institutioner Uppdaterad 1.4.2011 Namn på institutioner har tidigare kodats med <orgName>, men ny kodning införs inte längre. 4.4 Verktitlar Uppdaterad 2.9.2011 Samtliga verktitlar som omnämns i texten kodas, inte enbart Topelius verk. Förutom titlar på litterära verk (fiktiva eller icke-fiktiva, samt tidskrifter och tidningar) namnkodas också andra slags verk såsom tavlor, teaterpjäser, skulpturer, sånger o.s.v., förutsatt att de nämns vid namn. Ex. 1: Jag har tillåtit mig att i sammanhang med novellen “<title>Hertiginnan af Finland</title>” gifva en kort och populär framställning af nämnda olyckliga krig. Informella benämningar på verk, såsom Erslevs geografi eller Ljungblommorna förses också med titelkodning. Nummer på band inkluderas i kodningen. Också fältskärns första och andra cykel kan i sin helhet inkluderas i titelkodningen. Av andra delen av min Läsebok kodas 56 emellertid endast Läsebok eftersom hänvisningen i sin helhet − med det possessiva pronomenet − inte kan betraktas som ett namn (att det är Boken om vårt land som avses framgår av kommentarerna). Ex. 1: <title>Läsning för barn I−IV</title> Ex. 2: Källor: <persName>N. Idman</persName>: <title rend="underline">Finska och Grekiska</title>, <placeName>Åbo</placeName> 1774. Grafiskt markerad titel. Ex. 3: <title>Ynglingasagan</title> förtäljer oss, att [...] Ex. 4: Böcker voro så dyra, att en samling af några få band uppskattades lika med en ganska nätt förmögenhet. <add place="leftMargin" type="noAnchor"><title xml:lang="lat">Chron.</title> 281.</add> Chron. är Topelius informella benämning på Chronicon episcoporum Finlandensium, d.v.s. Finska biskopskrönikan. Ex. 5: [...] utgifvandet af <persName>Schröters</persName> <title xml:lang="ger">finnische Runen</title> i tysk öfversättning. Titel på främmande språk. Ex. 6: 1820 begynte <persName>R. v. Becker</persName> i <title>Turun Wiikko Sanomat</title> sammanställa mytherna om <persName>Wn</persName>. Ex. 7: <title>Kalevala</title> är dock Karelskt arfvegods, [...] Ex. 8: Hvarföre har icke denna historia fallit i händerna på författaren till <title>Kenilworth</title> och <title>Wawerley</title>? Ex. 9: Kristallpaviljongen ger: Föredrag på kantele (för 30:de gången: <title>Aallotar</title>) samt <title>Farväl till Finland</title> af <persName>Pacius</persName>. Titlarna i exemplen 6–8 är de etablerade titlarna även på svenska, och därför behövs. ingen xml:lang-kodning. I ex. 8 är den ena titeln samtidigt ett ortnamn och den andra ett personnamn, men varken ort- eller personnamn i titlar behöver i allmänhet kodas. Personnamn i titlar kodas bara om namnet är själva upphovsmannens namn och ingår i en informell benämning på ett verk. Ex. 10: <title><persName>Juslenii</persName> finska lexicon</title> Ex. 11: <title>Witgensteins marsch</title> Ex. 12: <title><persName>Mendelssohns</persName> bröllopsmarsch</title> Witgensteins marsch är uppkallad efter den ryske fältherren Wittgenstein, men han är inte själv upphovsman til verket. Mendelssohn har däremot komponerat sin marsch själv, på samma sätt som Juslenius skrivit sitt lexikon. När ett författarnamn används som titel i en källhänvisning kodas personnamnet både som namn och verktitel, och ev. nummer på band tas med i <title>-kodningen. Ex. 13: <add place="leftMargin" type="noAnchor">(<title><persName>Karamsin</persName> II</title>: s. 176)</add> 57 Ex. 14: Vi talade om <persName>Almqvists</persName> roman. Ex. 15: Min kommande novell skall snart vara färdig. Almqvists roman och min kommande novell är inga informella namn på verk, även om man vet vilka verk som åsyftas, och kodas därför inte med <title>. Vilket verk som avsågs anges i stället i en punktkommentar. Jfr kodningen av smeknamn på personer och informella geografiska namn: omskrivningar kodas inte, bara sådant som kan ses som klara officiella eller inofficiella namn, vare sig det gäller personer, platser eller verktitlar. Citattecken lämnas utanför <title>-kodningen när de bara signalerar att det är fråga om ett verknamn. Om ett enskilt verknamn har försetts med citattecken p.g.a. dess informella (t.ex. folkliga eller skämtsamma) natur ska citattecknen däremot inkluderas i namnkodningen. Citattecknen inkluderas också i kodningen om det finns ett bandnummer utanför citattecknen. Ex. 1: Efter den leken kommo flera andra, såsom ”<title>Höga berg och djupa dalar</title>”, eller ”<title>Intet aktar jag på rikedomar</title>”. Ex. 2: <title>”Läsning för barn” IV</title> 4.5 Främmande språk Uppdaterad 20.9.2013 I ett xml:lang-attribut, som vanligen införs i <foreign>, anges vilket främmande språk det är fråga om. De vanligast förekommande språken anges med följande attributvärden: ang ara cel dan eng est fin fre ger gre heb ita lap lat nor oic rus spa tib fornengelska arabiska keltiska danska engelska estniska finska franska tyska grekiska hebreiska italienska samiska latin norska fornisländska ryska spanska tibetanska 58 Ifall man inte kan fastslå vilket språk det är fråga om inför man språkkodning med bara <foreign>, utan xml:lang och något attributvärde. Attributvärden för andra främmande språk än de ovannämnda bestäms i samråd med kodningskoordinatorn och införs därefter i denna kodningsmanual. Ex. 1: Alldenstund man numera ej hade någon <foreign xml:lang="fre">secours</foreign>att vänta [...] Observera att <foreign> inte behöver användas om hela texten i strukturelementet <p> är på samma främmande språk: då används xml:lang direkt i <p>. Förutom i <p> får xml:lang i vår kodning användas också i strukturelementen <l>, <lg>, <list> och <div> samt i namnkodningselementen <persName>, <placeName> och <title>. Ex. 1: <p xml:lang="lat">Pax et Aeternum foedus!</p> Ett helt stycke skrivet på ett främmande språk. Ex. 2: I landet <placeName xml:lang="fin">Suomi</placeName> [...] Ett geografiskt namn på främmande språk. Även om xml:lang inom ramen för TEI är ett s.k. universalattribut begränsar vi alltså användningen till ovannämnda element. Ifall inslaget på främmande språk sammanfaller med innehållet i något annat element än de ovannämnda används <foreign xml:lang=""> innanför elementet ifråga. I och med att xml:lang får användas i <div> behöver det dock införas endast en gång ifall en text – t.ex. ett brev – i sin helhet är skriven på ett och samma främmande språk. Kodning för främmande språk används endast om skribenten haft för avsikt att använda ett främmande språk. Enbart avvikande stavning räcker inte som kriterium för xml:lang-kodning. Rotvälska, skämtlatin och liknande kodas inte som främmande språk. Ord böjda enligt svenskt mönster kodas inte heller. Ex. 1: 24 <foreign xml:lang="fre">de Octobre</foreign> Trots att skribenten inte behärskar det främmande språket till fullo (korrekt franska är d’Octobre) används <foreign>-kodning, eftersom avsikten har varit att skriva på franska. Ex. 2: moitié, cousin, vuer, chaise, concert, lustre, billet, charactère, ordres, factum, esquisse, cottillon, jaloux Kan ses som avvikande stavningar av ord som finns i svenskan och nu stavas moatjé, kusin, vyer, schäs, konsert, lyster, biljett, karaktär, order, faktum, skiss, kotiljong, jalu (finns i SAOB). Ex. 3: aorta, tutti, forte, pianissimo Termer som saknar motsvarighet på svenska. De främmande orden är samtidigt de svenska termerna och behöver därför ingen <foreign>-kodning. Ex. 4: Titulus, pro primo, pro secundo, per posto, Nota Bene, hujus, pajazzo, en passant Dessa ord är visserligen främmande till sitt ursprung, men finns upptagna i SAOB. Ex. 5: vis à vis, gentleman Uttryck som är främmande till sitt ursprung, men ändå allmänt förekommande i svenskan. 59 Ex. 6: Han var en riktig gentleman. Ex. 7: Han var <foreign xml:lang="eng">a true British gentleman</foreign>. Uttryck av samma typ som de i ex. 5 kan ses antingen som svenska (ex. 6) eller som främmande språk (ex. 7), beroende på sammanhanget. Endast ett språk får anges för ett och samma ord. I meningen Aura betecknar i finskan plog, i latinet en vindfläkt, men äfven glans och fägring. kan Aura lämnas utan kodning, eftersom det ju samtidigt betecknar flera olika språk. Ifall det förekommer utgivaringrepp i inslag på främmande språk får <choice> införas innanför <foreign> (och självfallet innanför <p>, <lg> och <l>). 4.6 Dubbel kodning Uppdaterad 29.8.2011 Namnkodningselement av samma typ används inte innanför varandra. Borgå län kodas alltså <placeName>Borgå län</placeName> utan extra namnkodning runt Borgå. Personnamn som ingår i verktitlar behöver inte kodas: Ex. 1: <title>Regina von Emmeritz</title> Författarnamn som ingår i informella verktitlar kodas däremot: Ex. 1: <title><persName>Erslevs</persName> geografi</title> Geografiska namn som ingår i personnamn, personers titlar samt verknamn behöver inte kodas: Ex. 1: <persName>Hans Erikson till Brinkala</persName> Ex. 2: <title>Helsingfors Tidningar</title> Personnamn förses inte med xml:lang-kodning, förutsatt att det inte är fråga om en kunglighet som av en eller annan anledning omnämns med en namnmotsvarighet på främmande språk. Geografiska namn kodas som inslag på främmande språk endast om det normala hade varit att använda en svensk motsvarighet. Jämsä xml:lang-kodas alltså inte, men däremot Suomi och Porvoo. Verktitlar följer samma princip för xml:lang-kodning. Attributet xml:lang kan användas direkt i samtliga namnkodningselement, och <foreign> behöver därmed inte användas: Ex. 1: <placeName xml:lang="fin">Suomi</placeName> Ifall avgränsningen av namn respektive inslag på främmande språk inte sammanfaller kan emellertid namnkodningselementen användas innanför <foreign>, och tvärtom. 60 Det gör inget om sidbrytningstaggen <pb/> hamnar innanför ett namnkodningselement, inte ens om namnet är grafiskt markerat. Detta eftersom det tomma <pb/>-elementet inte i kodningstekniskt hänseende innehåller någon text. Samtliga namnkodningselement – alltså även <title> – får innehålla <choice>, <corr> och <reg>. Även det motsatta är tillåtet, d.v.s. <choice> får innehålla namnkodningselement, om än inte direkt utan underordnade <orig> och <reg>. OBS: Om man – efter att ha tagit del av dessa instruktioner – är osäker på om man i något enskilt fall ska införa namnkodning eller inte, är det bättre att koda än att låta bli. Det är lättare att senare ta bort överflödig kodning än att hitta sådant som inte alls har markerats. 61 5 Utgivarens ändringar 5.1 Mindre normaliseringar Uppdaterad 14.11.2011 Mindre normaliseringar samt konsekvensändringar förses med enkel <reg>-kodning, d.v.s. stället markeras endast med <reg>-taggar. Detta innebär att vi inte registrerar hur stället ser ut i originalet, utan enbart inför vår normaliserade form. Enkel <reg>-kodning används t.ex. vid normalisering av tusental, ändrad ordningsföljd i fråga om citattecken och interpunktion, tillagda citattecken (om det är fråga om ett normaliseringsingrepp, inte en korrigering av ett entydigt fel) samt normalisering av antalet punkter som signalerar paus eller avbrott. Ex. 1: ”När jag rätt besinnar mig, så får det bli <reg>osagdt.”</reg> I originalet står punkten efter citattecknet. Ex. 2: ”Fy hvad du är <reg>otäck”,</reg> var <persName>Rosas</persName> svar. I originalet står kommatecknet före citattecknet. I t.ex. Novellerna saknas citattecken ofta före och efter anföringssatsen, eller så är citattecknen placerade enligt en annan praxis än den nuvarande. Normaliseringen kan förklaras i den textkritiska inledningen och behöver inte utmärkas med dubbel kodning, i synnerhet som fenomenet förekommer mycket ofta. Ex. 3: Således hade man nu <reg>6 000</reg>blanka silfverriksdalrar. I samband med normalisering från 6,000 eller 6000 till 6 000 bör entitetsreferens för smalt hårt blanksteg införas. Smalt hårt blanksteg införs inte i tusental som utgör årtal, om originalets form är den allmänna 1845. Om det däremot står 1,845 f. Chr. i originalet normaliseras årtalet, antingen till 1845 eller 1 845, beroende på genre. Ex. 4: Opium? <reg>...</reg> ja så står det verkligen. I Novellerna har antalet punkter som signalerar en paus eller ett avbrott normaliserats till att vara minst tre. I originalet är de allt mellan två och åtta, oftast dock tre. Detta ses inte som ett så viktigt ingrepp att originalets två punkter borde registreras. Ex. 5: – Hvad nu? <reg type="empty"/> sade hans far. <reg type="empty"/> Du ser ju ut som en oklippt stallgumse! I Läsning för barn finns emellanåt repliker med talstreck även före anföringssatsen samt före fortsättningen av repliken. När dessa talstreck tas bort som en normaliseringsåtgärd används <reg type="empty"/> för att signalera att något tagits bort utan att ha ersatts med något annat. Eftersom talstrecket är fristående kan man inte använda sig av <reg> runt sade. Blankstegen före och efter koden reduceras i visningen till ett enda blanksteg, såvida inte ingreppet ska visas. Övergripande normaliseringar av grafiska markeringar sköts av en stilmall. Vi kodar texten så som den ser ut i originalet, och att vi vill att t.ex. alla spärrade ord ska visas med kursiv stil definieras i stilmallen i stället för i XML-filen. Ingen <reg>-kodning behövs alltså. 62 Ex. 1: I slutet af November infann sig den tappre partigångaren <persName rend="expanded">Stefan Löving</persName>, [...] Originalets Stefan Löving kommer att visas som Stefan Löving i utgåvan. I den textkritiska inledningen förklaras att all spärrad stil ersatts av kursiv. Normaliseringar av vissa grafiska markeringar markeras med <reg>-kodning. Det är alltså inte fråga om en övergripande normalisering och inte heller om en korrigering av ett enskilt fel, utan om en återkommande normalisering av en inkonsekvent praxis i originalet. Ifall utgivaren önskar ta bort en omotiverad grafisk markering som förekommer på endast ett eller ett fåtal ställen används <choice>-kodning. Ex. 1: Detta var det ryktbara <reg><placeName>Mendolaks pass</placeName></reg>, hvilket naturen gjort vida starkare än <placeName>Fredrikshamns fästning</placeName>. I originalet är vissa geografiska namn kursiverade, bl.a. Mendolaks pass, men utgivaren önskar att alla geografiska namn ska visas på samma sätt, med rak stil. Kursiveringen kodas inte och det normaliserade stället utmärks med <reg>-taggar. Normaliseringar av styckeindrag anges i elementet <p>, ingen skild <reg>-kodning behövs. Om det första stycket i varje kapitel eller avsnitt är indraget i originalet och man vill ersätta detta med ett stycke utan indrag, kodas stycket med <p n="1">. Ifall en del av originalets inledande stycken trots allt är utan indrag kodas de som vanligt med <p rend="noIndent">. Om vissa av originalets icke-indragna stycken ska visas med indrag används <p rend="normalizedIndent">, så att man kan göra skillnad på normaliserade (inget indrag i originalet, visas med indrag) och icke-normaliserade (inget indrag i originalet, visas utan indrag) stycken. 5.2 Kompletteringar Uppdaterad 24.8.2011 Om det är uppenbart att ett eller flera ord saknas i originalet, en s.k. haplografi, läggs ordet till innanför <supplied>-taggar. Om det är fråga om en konjektur, d.v.s. en ändring av texten utan ledning av varianter, används endast attributet resp. Om det däremot är fråga om en emendation − en utgivarändring som grundar sig på ett annat textvittne − används därtill attributet source. Ex. 1: Hör ni ej, karl, hvad <persName>Hans Majestät</persName> befaller? brummade den andre <supplied resp="AT">af</supplied> herrarne. Ex 2: <supplied resp="NN" source="2 uppl. 1882">och</supplied> När utgivaren kompletterar med skiljetecken används inte <supplied> utan i stället <choice>kodning, eftersom skiljetecknet hänger ihop med ett ord. När utgivaren kompletterar med ett tankstreck, som föregås och efterföljs av mellanslag, används däremot <supplied>, såvida det inte är fråga om en återkommande normalisering med enkla <reg>-taggar. 63 Ex. 1: [...] – var hemma hela e. m. som var rätt tråkig – jag var endast till <placeName>théejungfrun</placeName> och drack 2 koppar thée samt betalte henne 1 R. <supplied resp="PiA">–</supplied> afton <persName>Fryxell</persName> – [...] OBS: Det ovanstående gäller när ett helt ord eller ett fristående skiljetecken saknats från början. När skiljetecken som hänger ihop med ord saknas används <choice>-kodning. När ord, bokstäver och tecken saknas i ett manuskript till följd av t.ex. skada eller inbindning: se Manuskriptbeskrivande kodning, avsnitt 3.3. 5.3 Rättelser i originalet Uppdaterad 10.3.2011 Ifall det finns en rättelseförteckning i originalet införs rättelserna med <corr>-kodning, i vilken det anges att textstället har korrigerats i enlighet med rättelsen i förteckningen: Ex. 1: <corr source="Rättelser">[korrigering]</corr> Ex. 2: [...] att <corr source="Erratalista" type="empty"/> jag [...] I ex. 2 innebär rättelseförteckningens rättelse att något tas bort ur texten, t.ex. ett av misstag upprepat att: originalets ordalydelse är alltså i ex. 2 att att jag, vilket korrigerats i erratalistan. Elementet blir tomt eftersom det inte har något innehåll. OBS: I sådana här fall registreras felen inte i kodningen, och <choice>-elementet behöver därmed inte användas. Beträffande avgränsningen av kodningen gäller samma principer som för <choice>-kodning (se nedan). 5.4 Övriga utgivaringrepp Uppdaterad 10.3.2011 Övriga utgivaringrepp, oberoende av om man vill kalla dem normaliseringar, korrigeringar, rättelser eller utgivarens ändringar, införs med dubbel kodning, vilket innebär att de kodas i ett <choice>-element. Både originalets och utgivarens text registreras, originalet inom <orig> och utgivarens ändring inom <reg resp="NN">. Genom att använda <choice> kan man alltså i samma fil koda såväl grundtexten – med alla dess fel – som den etablerade texten med korrigeringar av uppenbara fel. Med hjälp av stilmallar kan man sedan välja om man vill visa grundtexten med alla fel, eller den etablerade texten med dess korrigeringar. I attributet resp, för responsibility, anges initialerna för den som infört ändringen. Tekniskt sett har det ingen betydelse i vilken inbördes ordning <orig>- och <reg>-elementen införs, men kodningen blir lättare att granska om vi alltid inför originalets text först. Ifall pagineringskodningen hamnar innanför <choice> bör den införas i såväl <orig> som <reg>. 64 Tidigare användes även <sic> och <corr> för utgivarens ändringar, men indelningen i två olika <choice>-kategorier, <orig> och <reg> samt <sic> och <corr>, upplevdes som onödig. Ex. 1: <choice><orig>1700 talet</orig><reg resp="NN">1700-talet</reg></choice> Ex. 2: Nyss förut hade alla passioner råkat i strid <choice><orig>öfvor</orig><reg resp="AT">öfver</reg></choice> denna fråga. Ex. 3: När all <choice><orig>han</orig><reg resp="CE">hans</reg></choice> kunskaps sköna bubblor brista, [...] Ex. 4: <placeName>Finlands</placeName> sjöar äro icke som andra sjöar, dess kärr icke som andra <choice><orig>kärr .Der</orig><reg resp="KP">kärr. Der</reg></choice> är en stor [...] Ibland berör rättelsen två ord samtidigt. Ex. 5: Derföre må de fjerranlände säga sin <choice><orig>önskan</orig><reg resp="AT">önskan,</reg></choice> de i gyllne södern fostrade icke tvifla. Utgivaren har lagt till ett kommatecken Eftersom kodningen avgränsas enligt teckenföljder berör ändringen även ordet önskan, och <choice>-kodning används i stället för <supplied>. Om det finns ett dubblerat ord, en s.k. dittografi, i texten kodas rättelsen, d.v.s. borttagandet av ordet, med ett tomt <reg>-element: <reg type="empty" resp="NN"/>. Ex. 1: ”Sade jag icke det?” hviskade nu <choice><orig>nu</orig><reg type="empty" resp="AT"/></choice> åter den fjerde – [...] Utgivarens ändringar av enskilda grafiska markeringar: Ex. 1: Nu vet ju hela verlden detsamma som <choice><orig><hi rend="expanded">du</hi></orig><reg resp="AT">du</reg></choice> och jag, att du är en hedersgosse, <persName>Göran</persName>! Originalets spärrade du uppfattas som omotiverat och är kanske rentav ett tryckfel. Det ändras till rak stil. Ex. 2: <choice><orig><persName>Jakob Keith</persName></orig><reg resp="ThG"><persName rend="expanded">Jakob Keith</persName></reg></choice> Ifall originalets personnamn i regel är spärrade vid sin första förekomst i texten, men ett namn förblivit omarkerat, korrigeras det enligt exemplet. Här måste vi alltså göra ett litet undantag från principen att attributet rend alltid används för att registrera hur ett textställe ser ut i originalet. Om det är uppenbart att det finns ett fel i grundtexten, men det inte är lika entydigt hur felet ska korrigeras, kan man stödja sig på ett annat textvittne, s.k. emendation, och ange att man gjort det i attributet source inne i elementet <reg>: Ex. 1: <choice><orig>[fel]</orig><reg resp="ThG" source="2 uppl. 1882">[emendation]</reg></choice> 65 Fel i originalets fotnotshänvisningar (t.ex. på not 33 följer not nummer 43 i stället för 34) korrigeras utan att ingreppet kodas. <choice>-kodning i hänvisningarna skulle förutsätta att fotnoterna kodades på ett annat sätt, men felen kan ändå gärna omnämnas i redaktionella kommentarer. 5.5 Avgränsning av kodning, sammanfall med annan kodning Uppdaterad 1.4.2011 Avgränsning av kodning vid utgivarändringar För att utgivaringreppen skall kunna markeras vid visningen av den etablerade texten är det viktigt att man inte inkluderar mera text i <choice>-taggarna än det som faktiskt har ändrats. Utgångspunkten bör alltså vara att man inkluderar så lite text som möjligt i <choice> (och i <reg> ifråga om små konsekvensändringar). Det är ändå ändamålsenligt att utgå från enhetliga teckenföljder och inte enskilda tecken, vilket innebär att: a) om faskade har ändrats till fuskade så införs hela ordet i kodningen. b) om faskade, har ändrats till fuskade, så inkluderas också kommatecknet. c) om fuskade, har ändrats till fuskade så kodas såväl skiljetecknet som det föregående ordet. d) om fuskade har ändrats till fuskade, så kodas såväl skiljetecknet som det föregående ordet. Utgivarändringar och övrig kodning Eftersom överlappande kodning inte är tillåten inom ramen för XML måste vi i vissa fall avvika från vår generella princip för avgränsning av utgivaringrepp. Såväl kodning av normaliseringar som kodning av utgivarens ändringar får avgränsas snävare ifall kodningen annars skulle avbryta semantisk kodning. Till den semantiska kodningen räknas <persName>, <placeName>, <title> och <foreign>. Ex. 1: Få hertiginnor hafva upplefvat det underbara öde, som <persName>Eva Merthen</persName><choice><orig type="empty"/><reg resp="AT">,</reg></choice> att så hastigt se det allmännaste hat och förakt öfvergå i den allmännaste beundran och kärlek. Tillagda kommatecken kodas i vanliga fall tillsammans med föregående ord: helheten borde vara Merthen i <orig> och Merthen, i <reg>. I det här fallet fungerar detta inte, eftersom <choice> inte kan placeras framför Merthen med sluttaggen </choice> efter </persName>. Element måste alltid stängas i samma ordningsföljd som de öppnats, d.v.s. <choice> kan bara finnas innanför <persName> om det stängs innan <persName> stängs: <persName><choice></choice></persName>. Om <choice> placeras före hela namnkodningselementet tas onödigt mycket med i kodningen: Eva ändras ju inte. Att avbryta namnkodningen så att Eva kodas som ett namn och Merthen som ett annat skulle se dåligt ut i 66 visningen, som ju bygger på färgade bakgrunder, i och med att det blir ett ofärgat glapp mellan för- och efternamnet. Om exemplet inte hade innehållit ett tvådelat namn hade kodningen sett ut som i exempel 2 och kunnat både kodas och visas utan problem: Ex. 2: Få hertiginnor hafva upplefvat det underbara öde, som <choice><orig><persName>Eva</persName><orig><reg resp="AT"><persName>Eva</persName>,</reg></choice> att så hastigt se det allmännaste hat och förakt öfvergå i den allmännaste beundran och kärlek. Det tomma elementet <orig type="empty"/> används för att lösa dessa specialfall. <supplied> ska inte användas, eftersom det ju bara anger komplettering av hela ord eller av (skilje)tecken som har blanksteg både före och efter sig. Semantisk kodning för namn, titlar och främmande språk (elementen <persName>, <placeName>, <title> och <foreign>) får införas såväl utanför som innanför <choice>-kodning (visserligen inte direkt innanför <choice>, utan innanför de däri ingående elementen <orig> och <reg>). Om möjligt bör kodningen ändå helst placeras utanför kodningen av utgivaringrepp. Ex. 1: Enligt <persName><choice><orig>Mannsteins</orig><reg resp="AT">Mansteins</reg></choice></persName> ord [...] På detta sätt behöver man införa endast ett <persName>-element (och oberoende av om innehållet i <orig> eller <reg> visas så finns ett personnamn på textstället ifråga). Ifall semantisk kodning måste placeras innanför <choice>-elementet bör den alltså införas i bägge underordnade element. Också paginering som blir innanför <choice> bör kodas i både <orig> och <reg>. 67 6 Varianter 6.1 Kategorisering och kodning Uppdaterad 3.9.2012 För variantkodningen behövs en skild fil som innehåller grundtexten med enbart kodning av allmänna textuella företeelser eller manuskriptbeskrivande kodning. Dessutom behövs filerna med de övriga textversionerna, också de innehållande endast kodning av allmänna textuella företeelser eller manuskriptbeskrivande kodning. Variantkodningen bör alltså inte införas i huvudfilen med den etablerade texten som innehåller semantisk kodning, utgivarkommentarer, kodning av allmänna textuella företeelser och ev. manuskriptbeskrivande kodning. Eventuella rättelser ur originalens erratalistor införs i texterna, men alltså inte de ändringar och normaliseringar utgivaren gjort i den etablerade texten. Variantkodningen utgår från enhetliga teckenföljder. Varianterna indelas i fyra kategorier: a) substantiella varianter: type="sub" b) ortografiska/typografiska varianter: type="ort" c) interpunktionsvarianter: type="int" d) positiva varianter: type="ide" I varje fil som innehåller variantkodning bör man införa en variantapparatsdeklaration i <teiHeader>, närmare bestämt i <encodingDesc>-elementet. Detta gäller alltså för såväl grundtexterna som de andra textvittnena. Den kodningsmetod som vi utgått ifrån går under benämningen parallel segmentation method. <encodingDesc> införs efter <fileDesc>: <teiHeader> <fileDesc> <!-- ... --> </fileDesc> <encodingDesc> <variantEncoding method="parallel-segmentation" location="internal"/> </encodingDesc> Kodningsmetoden anges alltså i det tomma elementet <variantEncoding/>. Varianterna får inte överskrida indelningen i textstycken och strofer, d.v.s. <p>- och <lg>taggarna. Däremot kan varianterna omfatta flera versrader och överskrida gränserna för <l>elementen (vilket egentligen strider mot TEI:s riktlinjer). Om det förekommer konsekvensavvikelser – t.ex. beträffande diakritiska tecken – inkluderas dessa inte i variantkodningen utan beskrivs endast på ett generellt plan. 68 I filen med grundtexten införs textställen med varians i ett <lem>-element, som står för lemma. <lem> införs i sin tur i ett <app>-element, apparatus entry, som förses med ett id. Ett <app>element med samma id införs sedan på motsvarande textställen i filerna med de andra textversionerna, innehållande den reading, <rdg>, som förekommer i texten i fråga. Därtill anges i varianttexternas <app> vilken slags variant det är fråga om i förhållande till grundtexten, t.ex. <app id="var1" type="sub">. id:na är av typen var1, var2 o.s.v., men de behöver inte komma i nummerordning. Om man hittar en ny variant mellan de redan kodade var1 och var2 kan man ge den antingen id:t var1b eller var[siffra] där siffran är en siffra som ännu inte använts i filen. var1b kan i sin tur vid behov följas av var1c o.s.v. Substantiella varianter Med substantiella varianter, type="sub", avses betydelsebärande avvikelser, vilket vanligen innebär att ett eller flera ord (eller meningar) har bytts ut/lagts till/tagits bort eller att ordningsföljden har ändrats, t.ex. tröst och tro – tro och tröst. Två versrader som bytt plats är också en substantiell variant. Till denna kategori hänförs också: – substantiv-/adjektivform som slutar med -e vs -a (måne – måna, historie – historia, vittre – vittra, andarna – andarne, skyarna – skyarne) – synonymer (på – uppå, mellan – emellan, icke – inte) – singular vs plural (sitt hufvud – sina hufvuden) – olika former av samma verb, t.ex. presens vs imperfekt (tillägga – tillade, bli – blifva) – förkortningar vs utskrivna ord (Sept. – September, den – d.) Ortografiska/typografiska varianter Med ortografiska/typografiska varianter, type="ort", avses: – skillnader i stavning (också – ochså, orgeln – orgelen, kristall – christall, Helsinge – Hälsinge, aldeles – alldeles, fins – finns, herskap – herrskap, anförarn – anföraren, armén – arméen) – särskrivning vs hopskrivning samt användning av bindestreck (en gång – engång, magistratssekreterare – magistrats sekreterare) – ord skrivna med eller utan apostrof (sen – se’n) – versal vs gemen begynnelsebokstav (hans – Hans) – tryck-/sättningsfel som inte rättats i erratalistan och gäller bokstäver, mellanslag eller citattecken (tnsensköna – tusensköna, Lunkentus – Lukentus, panna.” Men – panna. ”Men) Till denna kategori hänförs dessutom avvikelser beträffande grafisk markering, t.ex. att ett ord är spärrat i grundtexten men inte markerat i varianttexten. Observera ändå att vi vad gäller det sistnämnda inte variantkodar konsekvensavvikelser, och inte heller att en markering har ersatts av en annan, t.ex. spärrning med kursiv, ifall bägge står för samma sak. Interpunktionsvarianter Med interpunktionsvarianter, type="int", avses avvikelser beträffande skiljetecken, och alltså även tankstreck (Gudbevare! – Gudbevare, andra. Hur – andra – hur, de, – de, bekände, – bekände;). Citattecken och apostrofer hör inte till skiljetecknen utan räknas som 69 ortografiska/typografiska varianter. Däremot hör tryck-/sättningsfel som inte rättats i erratalistan och gäller skiljetecken till interpunktionsvarianterna (slut. Sedan – slut Sedan). Positiva varianter Positiva varianter, d.v.s. textställen som inte avviker från grundtexten, kodas ifall det finns minst en textversion som uppvisar någon avvikelse på motsvarande ställe. type="ide" står för identical. Om det bara finns en grundtext och en varianttext finns alltså inget behov av att koda positiva varianter. Flera variantkategorier inom samma variant En variant kan innehålla avvikelser av flera olika slag. I sådana fall införs flera variantkategorier i <app>, d.v.s. type="sub ort int" ifall det förekommer såväl substantiella skillnader som avvikelser i stavning/typografi och skiljetecken. Men ifall t.ex. innehållet i en versrad har ändrats helt, och det avslutande skiljetecknet till följd av det, kategoriseras detta med enbart sub. Detsamma gäller när t.ex. långt har ändrats till långt, långt: detta kategoriseras med enbart sub eftersom skillnaden i interpunktion är en direkt följd av det tillagda ordet. I vissa fall kan en skillnad gällande stavning eller interpunktion uppfattas som betydelsebärande. I sådana fall anger man i <app> type="sub ort" eller type="sub int". Värdena ort int används ifall det i samma variant finns en avvikelse ifråga om såväl stavning som interpunktion. Ifall man dessutom uppfattar den avvikande stavningen som betydelsebärande anges tre kategorier: sub ort int. Värdet ide kan självfallet inte förekomma i kombination med andra värden, men alla övriga kombinationer är tillåtna, dock bara i den inbördes ordning som fastslås här ovan och i valideringsschemat. Det värde som kommer först avgör vilken färg varianten får i visningen: type="sub ort" färgas på samma sätt som alla andra sub, men den ruta som dyker upp vid muspekaren berättar att stället har både substantiell och ortografisk/typografisk varians. Ex. 1: Avvikelse gällande både ortografi och interpunktion: Grundtext: <app id="var427"><lem>officern,</lem></app> Varianttext: <app id="var427" type="ort int"><rdg>officeren</rdg></app> Ex. 2: Substantiell skillnad samt skillnad i interpunktion: Grundtext: <app id="var1155"><lem>Nu begynte sjukdomarna –</lem></app> våldsama dödande febrar, som på illa försedda lasaretter ingen bot funno. Varianttext: <app id="var1155" type="sub int"><rdg>Sjukdomar begynte,</rdg></app> våldsama dödande febrar, som på illa försedda lasaretter ingen bot funno. Skillnader som inte utgör varianter Som varianter noteras inte: – skillnader i titlars typografi (t.ex. rak stil vs kursiv) – punkt eller avsaknad av punkt efter titel – parentes/avsaknad av parentes i titel eller undertitel – parentesbåge/avsaknad av parentesbåge samt andra skillnader i hänvisningstecken i fotnotshänvisning (ord.* – ord.1)) 70 – skillnader i fotnotshänvisningstecknets placering i förhållande till närstående skiljetecken (ord*. – ord.*, ord1), – ord, 1)) – gemen eller versal bokstav i början av versrad – skillnader i typsnitt, teckenstorlek eller indrag – användning av I eller J för att beteckna Ni – konsekvensavvikelser i stavningen i HT (i huvudsak förorsakade av frakturstilen) (qv – qu, v – w, ss – ß) – initialer efter dikt och avsaknad av årtal efter dikt i HT och kalendrarna - ev. verkspecifika konsekvensavvikelser Observera också att den tryckta variantförteckningen, ifall en sådan görs, skiljer sig från variantkodningen och inte nödvändigtvis upptar alla varianter som kodats! Avgränsningen av varianter För att varianterna ska kunna framhävas vid visning, ungefär på liknande sätt som i kollationeringsprogrammet Juxta, är det viktigt att man inte inkluderar mer text i variantkodningen än de ställen på vilka det faktiskt förekommer varians. Utgångspunkten bör vara att så litet text som möjligt inkluderas i <lem> och <rdg>. Men man utgår ändå alltid från enhetliga teckenföljder, inte enskilda tecken. För att undvika ”tomma” varianter inkluderas närmast föregående eller efterföljande ord i <lem> och <rdg> när ett eller flera ord i en mening saknas i endera texten. Några exempel: a) Grundtext: Men, som [...] Varianttext 1: Men som [...] Men, inkluderas i <lem> och Men i <rdg>. b) Grundtext: en vacker morgon i Varianttext 1: en solig morgon i vacker inkluderas i <lem> och solig i <rdg>. c) Grundtext: en vacker morgon i Varianttext 1: en solig morgon i Varianttext 2:en morgon i vacker morgon inkluderas i <lem> och solig morgon respektive morgon i <rdg>. d) Grundtext: Text 2: Men som [...] Men – som [...] I det här fallet kan som och – som inkluderas i <lem> respektive <rdg>. I de fall man inte kan avgöra om ett tankstreck – eller t.ex. tre punkter – ska hänföras till den närmast föregående eller den närmast efterföljande texten kan man i undantagsfall låta ett <lem>- eller <rdg>element bli tomt. Detta anges då med <lem type="empty"/> eller <rdg type="empty"/>. Huruvida en skillnad bestående av flera på varandra följande ord är att betrakta som en enda variant eller flera olika beror på sammanhanget. 71 Ex. 1: Två på varandra följande ord utgör två skilda varianter. Den substantiella skillnaden om – mot hänger inte på något speciellt vis ihop med den efterföljande ortografiska skillnaden sekreta – Sekreta. Då är det logiskt att koda varianterna som två separata. Grundtext: [...] och utforo i de skarpaste ordalag <app id="var219"><lem>om</lem></app> <app id="var220"><lem>sekreta</lem></app> utskottet, [...] Varianttext: [...] och utforo i de skarpaste ordalag <app id="var219" type="sub"><rdg>mot</rdg></app> <app id="var220" type="ort"><rdg>Sekreta</rdg></app> utskottet, [...] Ex. 2: Tre på varandra följande ord utgör två skilda varianter. Skillnaden mumlade:” Så – mumlade: ”Så är ett sättningsfel och kategoriseras som ort. Den har inget samband med den efterföljande substantiella skillnaden tag – tog. Grundtext: [...] Då gnuggade trollqvinnan händerna af förnöjelse, upphörde med sången och <app id="var276"><lem>mumlade:” Så</lem></app> <app id="var277"><lem>tag</lem></app> det då ändtligen! [...] Varianttext: [...] Då gnuggade trollqvinnan händerna af förnöjelse, upphörde med sången och <app id="var276" type="ort"><rdg>mumlade: ”Så</rdg></app> <app id="var277" type="sub"><rdg>tog</rdg></app> det då ändtligen! [...] Ex. 3: Två på varandra följande ord utgör en och samma variant. Skillnaden andra. Hur – andra – hur är en interpunktionsskillnad vid andra som resulterar i att det efterföljande ordet blir Hur respektive hur. De två skillnaderna hänger klart ihop med varandra. Eftersom skillnaden i versal/gemen är ett direkt resultat av den föregående interpunktionsvariansen räcker det med int som kategori. Grundtext: [...] Om några timmar skall vi vara der ute på fjärden med de <app id="var521"><lem>andra. Hur</lem></app> jag gladt mig deråt!! [...] Varianttext: [...] Om några timmar skall vi vara der ute på fjärden med de <app id="var521" type="int"><rdg>andra – hur</rdg></app> jag gladt mig deråt!! [...] Varians inom ett stycke eller en strof Ex. 1: Kodning av textställe där variansen består i att ett ord bytts ut mot ett annat. I grundtexten står Det var en vacker morgon i Maj år [...], och den andra textversionen uppvisar en avvikelse ifråga om ordet vacker: Grundtext: <p>Det var en <app id="var1"><lem>vacker</lem></app> morgon i Maj år [...]</p> Varianttext 1: <p>Det var en <app id="var1" type="sub"><rdg>solig</rdg></app> morgon i Maj år [...]</p> Ifall en av textversionerna inte uppvisar någon varians i förhållande till grundtexten på det aktuella stället kodas detta på följande sätt: Varianttext 2: <p>Det var en <app id="var1" type="ide"><rdg>vacker</rdg></app> morgon i Maj år [...]</p> Ex. 2: Kodning av textställe där variansen består i att en del av en mening bytts ut: 72 Grundtext: Innan kort uttryckte hon sig med ledighet <app id="var982"><lem>på fransyska, samt gjorde närmare bekantskap med tyska</lem></app> och engelska språken, hvilket sednare Keith gerna talade i förtroliga stunder, emedan det var hans modersmål. Varianttext: Innan kort uttryckte hon sig med ledighet <app id="var982" type="sub"><rdg>icke blott på tyska, utan äfven på fransyska</rdg></app> och engelska språken, hvilket sednare Keith gerna talade i förtroliga stunder, emedan det var hans modersmål. När ett eller flera ord eller en del av en mening saknas undviks tomma varianter. Ifall det i exempel 1 ovan fanns ännu en textversion som helt saknade motsvarighet till lemmat i grundtexten, så att det i den versionen stod bara [...] en morgon [...], hade därför också ordet morgon inkluderats i <lem>och <rdg> i alla texterna. Om det är föregående eller efterföljande ord som ska inkluderas bedöms av sammanhanget: vacker/solig morgon är en mer logisk enhet än en vacker/solig. Ex. 1: Ett ord saknas i varianttexten (ex. ur ”Waldemars hemlighet.”, Ljungblommor II): Grundtext: <p>[...] Hon <app id="var5"><lem>är lik</lem></app> en morgon i Maj. [...]</p> Varianttext: <p>[...] Hon <app id="var5" type="sub"><rdg>är</rdg></app> en morgon i Maj. [...]</p> Ex. 2: Ett ord saknas i grundtexten: Grundtext: <p>[...] emedan hon <app id="var916"><lem>förmådde</lem></app> segra öfver sig sjelf.</p> Varianttext: <p>[...] emedan hon <app att</rdg></app> segra öfver sig sjelf.</p> id="var916" type="sub"><rdg>förmådde Ex. 3: Slutet på meningen saknas i grundtexten. Föregående ord tas med i kodningen, och har dessutom interpunktionsvarians. Varianten klassificeras ändå som enbart substantiell, eftersom skillnaden i interpunktion vid redskap är en direkt följd av tillägget. Grundtext: Bland desse väckte isynnerhet Mathesii öde mycket deltagande, ty han var Finne och, hvad mera var, en ärlig man, som i sin godtrogenhet hade tjenat de mäktige till <app id="var217"><lem>redskap.</lem></app> Varianttext: Bland desse väckte isynnerhet Mathesii öde mycket deltagande, ty han var Finne och, hvad mera var, en ärlig man, som i sin godtrogenhet hade tjenat de mäktige till <app id="var217" type="sub"><rdg>redskap, eller, som han sjelf hade uttryckt sig, till ”kastkäpp.”</rdg></app> När en hel mening, flera hela meningar eller en hel versrad saknas i endera texten används däremot kodning för tomma varianter. Detta anges med <lem type="empty"/> eller <rdg type="empty"/> beroende på i vilken text meningen/meningarna saknas. Den tomma varianten visas sedan med ett rött kryss, och för att det ska bli fristående och inte hänga ihop med föregående eller efterföljande ord införs ett mellanslag före och efter <app></app> i texten med den tomma varianten. Ifall den tomma varianten finns först i ett stycke får den 73 mellanslag efter men inte före sig, och omvänt om den är sist i ett stycke: <p><app id="var1"><lem type="empty"/></app> [...]. Ex. 1: En hel mening saknas i varianttexten: Grundtext: [...] läste ordentelig bordsbön. <app id="var150"><lem>Hela sällskapet knäppte hop händerna och läste sakta sina böner, hvar för sig, hvilket varade i minst fem minuter.</lem></app> Dermed voro dock förberedelserna för ingen del slut; [...] Varianttext: [...] läste ordentelig bordsbön. <app id="var150" type="sub"><rdg type="empty"/></app> Dermed voro dock förberedelserna för ingen del slut; [...] Ex. 2: Versrad saknas i grundtexten (ex. ur ”Då vill jag ej mera sörja.”, Ljungblommor II): Grundtext: <lg> [...] <l>Låt mig här i hennes ögas</l> <l>Glans mitt ögas ömhet spegla,</l> <l><app id="var1"><lem type="empty"/></app></l> <l>Här vid hennes hjerta gerna</l> [...] </lg> Variant 1: <lg> [...] <l>Låt mig här i hennes ögas</l> <l>Glans mitt ögas ömhet spegla,</l> <l><app id="var1" type="sub"><rdg>Här vid hennes läppars ljufhet,</rdg></app></l> <l>Här vid hennes hjerta gerna</l> [...] </lg> Vid rubrikskillnader som Ynglingens val och 6. Ynglingens val låter man <lem> eller <rdg> bli tomt. Endast 6. inkluderas i variantkodningen, eftersom det skulle bli missvisande om rubriken i sin helhet framhävdes vid visning. Ifall en rubrik som finns i en version saknas helt i en annan införs <head> också i den senare, och variantkodningen med type="empty" placeras innanför <head>. Varians inom fotnotstexter kodas som vanliga varianter. När en fotnot saknas helt i endera texten börjar variantkodningen med det ord som har/saknar fotnotstecknet, och varianten blir alltså inte tom. Ex. 1: Fotnot saknas helt i varianttexten. han31) respektive han färgas i visningen. Denna lösning syns bättre i visningen än om bara själva fotnotens text samt en tom variant skulle ha kodats. Grundtext: [...] beslöt han31) att, trogen sin vana, [...] Varianttext: [...] beslöt han att, trogen sin vana, [...] 74 Grundtext: [...] beslöt <app id="var1377"><lem>han<note id="ftn31" n="31)" place="foot" anchored="true">Detta beslut synes ha varit generalens eget. Från Bergby till Helsingfors, d. ä. från d. 17 Juli till d. 13 Aug., är en lucka i krigskonseljernas protokoller.</note></lem></app> att, trogen sin vana, [...] Varianttext: [...] beslöt <app id="var1377" type="sub"><rdg>han</rdg></app> att, trogen sin vana, [...] Ex. 2: Varians inne i fotnoten. Fotnotstecknets placering i förhållande till skiljetecknet utgör ingen variant, och inte heller skillnaden i fotnotssymbol. Grundtext: [...] de följande olyckorna19). Varianttext: [...] de följande olyckorna.*) Grundtext: [...]de följande olyckorna<note id="ftn19" n="19)" place="foot" anchored="true">Det är den enda strid under hela detta krig, der Svenskarne visat mod, säger <app id="var1147"><lem>Manstein. </lem></app></note>. Varianttext: [...]de följande olyckorna.<note id="ftn9" n="*)" place="foot" anchored="true">Det är den enda strid under hela detta krig, der Svenskarne visat mod, säger <app id="var1147" type="sub"><rdg>general Manstein, i sina intressanta memoirer, om detta slag.</rdg></app></note> Strukturella avvikelser (varians gällande hela stycken eller strofer) Kodning med <app><lem type="empty"/> används inte på <p>- och <lg>-nivå, eftersom en <app> inte kan gå över flera stycken eller strofer. Strukturella avvikelser som omfattar ett eller flera textstycken eller en eller flera strofer markeras alltså inte med egentlig variantkodning och färgvisning, utan med tomma <anchor/>-element, som möjliggör att man vid visning kan införa små triangelsymboler runt styckena/stroferna. <anchor/>-elementen fungerar samtidigt som länkar till en parallellvisning i jämbredd. Dessutom gör detta system varianterna mer lättlästa och -kodade, eftersom varians inom en strukturell avvikelse kan kodas på vanligt sätt och man inte behöver ta till kodning för variant-i-variant. Utan särskild kodning för strukturella avvikelser skulle t.ex. fem på varandra följande strofer som finns i grundtexten och ett textvittne, men som saknas helt i ett annat textvittne, färgas helt och hållet både i grundtexten och det ena textvittnet, och varians på ord- och versradsnivå i de texter som innehåller stroferna skulle inte kunna visas med de vanliga färgerna utan bara med variant-i-variant. Strukturella avvikelser kan vara t.ex. strofer som bytt plats, stycken som behandlar samma ämnen men med mycket olika formuleringar, att en av grundtextens strofer saknas i ett textvittne eller att varianttexten innehåller ett texstycke som saknas helt i grundtexten. <anchor/> införs i början och i slutet av textstället i fråga, direkt efter <p> eller strofens första <l>, i såväl grundtexten som alla övriga textvittnen (även om ett enskilt textvittne inte avviker från grundtexten). I <anchor/> införs ett id av typ struct1a, struct1b, struct2a, struct2b o.s.v. <anchor/> med id:n som slutar på a införs där den strukturella avvikelsen börjar, innanför <p> eller <l>, och<anchor/> med id:n som slutar på b införs där avvikelsen slutar, innanför </p> eller </l>. Ifall textavsnittet i fråga saknas helt i någon version införs i den ett nytt <p> eller <lg> innehållande enbart <anchor id="struct1a"/> och <anchor id="struct1b"/> efter varandra med 75 ett mellanslag mellan sig. Start- och slutpunkterna visas sedan i form av framåt- och bakåtpekande trianglar vid textstället i grundtexten samt i de övriga textvittnena. Varje id får förekomma endast en gång per fil, och samma id:n som i grundtexten införs på motsvarande ställen i de andra textvittnena. Ex. 1: Strof som finns i grundtexten saknas i varianttext 1 (ex. ur ”En liten tid.”, Ljungblommor I): Grundtext: [</lg>] <lg> <l><anchor id="struct7a"/>Hur outsägeligt kär och dyr</l> <l>Du är, o vår, som lik flamman flyr!</l> <l>Hur skönt, o lif, när, mot höjden vändt,</l> <l>Till flygt din vinge du spännt!<anchor id="struct7b"/></l> </lg> [<lg>] Variant 1: [</lg>] <lg><anchor id="struct7a"/> <anchor id="struct7b"/></lg> [<lg>] Ex. 2: Två strofer efter varandra som båda saknas i text 2 (ex. ur ”1 Januari 1850.”, Ljungblommor II). Grundtexten har vanlig variantkodning inne i den strukturella avvikelsen eftersom det finns textvittnen som inte saknar stroferna och dessutom uppvisar varians. Grundtext: <lg> <l><anchor id="struct1a"/>Din sol har gått <app id="var5"><lem>opp</lem></app> i glans och storm,</l> <l>Och mörkret har flytt för den;</l> <l>Ha skyarna ren bytt färg och form,</l> <l>Och stundar en natt igen?</l> </lg> <lg> <l>O dag af sorger och längtan, om</l> <l>Vår väntan du så bedrog,</l> <l>Då låt oss <app id="var6"><lem>dö</lem></app> förrän qvällen <app id="var7"><lem>kom,</lem></app></l> <l><app id="var8"><lem>Förrän all</lem></app> vår fröjd du tog!<anchor id="struct1b"/></l> </lg> Variant 1: <lg><anchor id="struct1a"/> <anchor id="struct1b"/></lg> Ex. 3: Ett textstycke som helt klart behandlar samma ämne men med så olika formuleringar och så stor omflyttning av texten att vanlig variantkodning inte är tillämpbar. Likheterna finns ändå där: – kejsarinnan Elisabeths manifest – detta manifest – vederläggning behöfdes icke –manifestet vann intet gehör – det enda märkliga resultatet – dess enda märkvärdiga verkan – fröet till ett fåtaligt parti – fröet till ett drömmande parti 76 – bland adeln – bland finska adeln – mer än 40 år sednare – 1788 – Anjalaförbundet – Anjala förbundet. Grundtext: <p><anchor id="struct32a"/>Den vederläggning Kongl. Majestät lät utgå d. 27 April samma år behöfdes icke. Det enda märkliga resultatet af kejsarinnan Elisabeths manifest var fröet till ett fåtaligt parti bland adeln och tjenstemännen, hvars planer mer än 40 år sednare förlorade sig i det politiska trassel, som är kändt under namn af Anjalaförbundet.<anchor id="struct32b"/></p> Varianttext: <p><anchor id="struct32a"/>Detta manifest vann intet gehör hos Finlands invånare. Dess enda märkvärdiga verkan likväl var fröet till ett om sjelfständighet drömmande parti bland finska adeln, hvilket, i början ytterst svagt och fåtaligt, sedan tillvexte genom oppositionen mot Gustaf III och exploderade i det för 1788 års krig och svenska statsförfattningen så betydelsefulla Anjala förbundet.<anchor id="struct32b"/></p> Varianter-i-varianter Varianter-i-varianter förses med en enkel <seg>-kodning, inga attribut används. Denna kodning behövs bara då det finns fler än två textversioner. <seg>-kodning införs inte i grundtexten, utan endast i de övriga textversionerna. Ex. 1: Versrad där hela raden utgör en variant eftersom inget ord är gemensamt för alla texter. Varje textvittne har ändå ord som är gemensamma med grundtexten och ord som skiljer sig (ex. ur ”Nyåret 1854.”, Ljungblommor III): Grundtext: <l><app id="var5"><lem>Der strålar häfdernas dygd;</lem></app></l> Varianttext 1: <l><app id="var5" type="sub"><rdg>Der <seg>stråla vishet och</seg> dygd;</rdg></app></l> Varianttext 2: <l><app id="var5" type="sub"><rdg><seg>Framtittar</seg> häfdernas dygd;</rdg></app></l> Varianttext 3: <l><app id="var5" type="sub"><rdg>Der <seg>skymtar ett djup, jag vet;</seg></rdg></app></l> <seg>-kodning införs alltså trots att nästan allt ändrats, så länge det inte är en ren tillfällighet att ett ord – som t.ex. ett inledande Der – är det samma. Ex. 2: Variant-i-variant i prosadikt (ex. ur ”Engelen och skyn.”, Ljungblommor I): Grundtext: <p>[...] rosor. <app id="var8"><lem>Skön, hvit och oskuldsfull var den ljusa gestalten i skyn;</lem></app> <app id="var9"><lem>blåa</lem></app> himlar logo [...]</p> Varianttext 1: <p>[...] rosor. <app id="var8" type="sub int"><rdg>Och den unga engeln war så skön, så hwit, så oskuldsfull!</rdg></app> <app id="var9" type="ort"><rdg>Blåa</rdg></app> himlar logo [...]</p> Varianttext 2: <p>[...] rosor. <app id="var8" type="sub int"><rdg><seg>Skön och hvit</seg> var den ljusa gestalten i skyn;</rdg></app> <app id="var9" type="sub"><rdg>blå</rdg></app> himlar logo [...]</p> 77 Sammanfall med annan kodning Det kan hända att variantkodningen sammanfaller med annan kodning, främst grafiska markeringar. P.g.a. problem med överlappande kodning kan man då bli tvungen att t.ex. avsluta <hi>-kodning före varianten och påbörja den på nytt inne i varianten. Ex. 1: Texterna uppvisar följande skillnader: Grundtext: [...] Finnarne visade häröfver ganska stort nöje, ”utlofvandes att vilja stå så länge blodet var varmt, allenast de finge slåss”. Och när generalen dem derom försäkrade, hafva åtskillige af dem utropat: ”Gud gifve det hade skett förr, så hade vi sluppit detta besväret!” [...] Varianttext: [...] ”Finnarne visade häröfver ganska stort nöje, ut lof van d e s att vilja stå sålän ge b lod e t var var mt , alle n ast d e f in ge slåss . Och när generalen dem derom försäkrade, hafva åtskillige af dem utropat: Gud gif ve d et had e ske t t f örr , så hade vi sluppit detta besväret!” [...] – Finnarne – ”Finnarne – ”utlofvandes – u t lof van d e s – så länge – sålän ge – slåss”. – slåss . – ”Gud – G u d – förr, så hade vi sluppit detta besväret!” – f ör r , så hade vi sluppit detta besväret!” Variansen gäller vad som hör till det citerade, sär-/sammanskrivningen av så länge/sålänge samt omfattningen av den sista grafiska markeringen. Alla skillnader klassificeras som ortografiska/typografiska. Att markeringen gjorts med kursiv i den ena texten och spärrning i den andra utgör ingen skillnad i sig så länge samma ställen är markerade. Vid den första <hi>förekomsten placeras <app> efter <hi>. Men sedan måste <hi>-kodningen avbrytas och påbörjas samt avslutas på nytt inne i varianten, eftersom punkten efter slåss” respektive slåss inte hör till det grafiskt markerade. Däremot hör punkten till varianten, för variantkodningen görs enligt enhetliga teckenföljder. Kodningen <hi rend="italics">”utlofvandes att vilja stå så länge blodet var varmt, allenast de finge <app id="var1367"><lem>slåss”</hi>.</lem></app> är tekniskt omöjlig eftersom elementen måste avslutas i rätt ordning: när <hi> har påbörjats först måste det också avslutas sist och </hi> placeras efter </app>, men det skulle i sin tur leda till att punkten blir grafiskt markerad, vilket ju inte var fallet. Den sista <hi>-förekomsten i varianttexten har samma problem: markeringen slutar med f örr men varianten fortsätter. Därför måste <hi> avbrytas, påbörjas samt avslutas på nytt även i det fallet. Grundtext: <p>[...] <app id="var1364"><lem>Finnarne</lem></app> visade häröfver ganska stort nöje, <hi rend="italics"><app id="var1365"><lem>”utlofvandes</lem></app> att vilja stå <app id="var1366"><lem>så länge</lem></app> blodet var varmt, allenast de finge</hi> <app id="var1367"><lem><hi rend="italics">slåss”</hi>.</lem></app> Och när generalen dem derom försäkrade, hafva åtskillige af dem utropat: <hi rend="italics"><app id="var1368"><lem>”Gud</lem></app> gifve det hade skett <app id="var1369"><lem>förr, så hade vi sluppit detta besväret!”</lem></app></hi> [...]</p> Varianttext: <p>[...] <app id="var1364" type="ort"><rdg>”Finnarne</rdg></app> visade häröfver ganska stort nöje, <hi rend="expanded"><app id="var1365" type="ort"><rdg>utlofvandes</rdg></app> att vilja stå <app id="var1366" 78 type="ort"><rdg>sålänge</rdg></app> blodet var varmt, allenast de finge</hi> <app id="var1367" type="ort"><rdg><hi rend="italics">slåss</hi>.</rdg></app> Och när generalen dem derom försäkrade, hafva åtskillige af dem utropat: <hi rend="expanded"><app id="var1368" type="ort"><rdg>Gud</rdg></app> gifve det hade skett</hi> <app id="var1369" type="ort"><rdg><hi rend="expanded">förr</hi>, så hade vi sluppit detta besväret!”</rdg></app> [...]</p> OBS: Pagineringskodning är tillåten innanför variantkodningen. Mycket omfattande strukturell avvikelse (fallet Hertiginnan af Finland) I vissa fall kan grundtexten och en annan textversion ha mycket omfattande skillnader. Hertiginnan af Finland har t.ex. en helt annorlunda disposition i bokutgåvan än i följetongsversionen i HT: kapitel har bytt plats och stycken har flyttats från ett kapitel till ett annat. T. ex. är det kapitel som i boken benämns ”Sednare Afdelningen. 5. Ryssarne komma!” i HT-versionen ”9. Ryssarne komma!”. För att göra det lättare för läsaren att orientera sig i de bägge texterna och för att kunna lokalisera textstycken som motsvarar varandra men placerats i olika kapitel i de bägge versionerna infördes en ”symbol för motsvarande stycke”. Varje textstycke som har en motsvarighet i den andra textversionen har försetts med en symbol (eller flera symboler, ifall det finns mer än en motsvarighet). Symbolen har en pop up-ruta som anger i vilket kapitel motsvarande textstycke finns, och ett klick på symbolen gör att varianttexten scrollas till rätt ställe. Denna typ av omfattande strukturell avvikelse kan kodas m.h.a. programmet TEI-Comparator, ett gratisprogram för jämförelse av TEI-kodade texter som kan laddas ner från http://teicomparator.sourceforge.net/. Programmet ger varje <p>- och <lg>-element i en text ett id och utför sedan själva jämförelsen av vilka stycken som verkar likna varandra. Resultatet är en lista med länkar som .tex. säger att det som står i stycke 100 i den ena texten återfinns i stycke 505 och 506 i den andra texten. Informationen ur länklistan har sedan inarbetats i våra XML-filer i form av <xptr>-element, som på ZTe visas som ”symbol för motsvarande stycke”. Ex. 1: Två stycken som motsvarar varandra i HaF boken och HaF HT, med kodning genererad av TEI-Comparator och sedan vidarebearbetad. Varje <p> har automatiskt fått ett id (ns0:cid="") med TEI-Comparators namespace (xmlns:ns0="http://teic.org/TextComparator"), och utgående från TEI-Comparators länklista har sedan <xptr type="variant"/>-element genererats. Deras target-attribut innehåller namnet på variantfilen (det namnet innehåller i sin tur verkets ZTe-id, 5_1) som stycket länkats till, kapitel-id:t och stycke-id:t, allt separerat av semikolon. Grundtext: <p xmlns:ns0="http://tei-c.org/TextComparator" ns0:cid="sid-41a31af6-cb634677-9b9d-5688aa87ce28"><xptr type="variant" target="5_1_var_2.xml;ch1;sid-b4bfe5e06a6c-4b11-b0ed-2d2c6425f053"/>”Kusin är en skalk ännu på gamla dar. Vi tala nu blott om den tidens ungdom; det var ett mycket friare sätt då än nu, och ändå ett mycket tadelfriare, det får kusin medge.”</p> Varianttext: <p xmlns:ns0="http://tei-c.org/TextComparator" ns0:cid="sid-b4bfe5e0-6a6c4b11-b0ed-2d2c6425f053"><xptr type="variant" target="5_1_var_1.xml;ch10;sid-41a31af679 cb63-4677-9b9d-5688aa87ce28"/> Kusin är en skalk ännu på gamla dar. Vi tala nu blott om den tidens ungdom; det var ett mycket friare sätt då än nu, och ändå ett mycket tadelfriare, det får kusin medge.</p> TEI-Comparator kräver installation av en virtuell server med diverse program samt Unixkunskaper, men själva textjämförelsen kan kontrolleras och bearbetas utan speciella förkunskaper via en webbapp liknande Juxta. 80 7 Kommentarer 7.1 Tidigare kodningspraxis Uppdaterad 5.9.2012 Punktkommentarer har i utgåvorna av Ljungblommor och Finland framställdt i teckningar införts direkt i huvudfilen med den etablerade texten. Efter att Kommentarverktyget tagits i bruk 2011 införs kommentarerna i stället där, på ett användarvänligare sätt, och utgivaren behöver inte längre utföra den kommentarkodning som beskrivs nedan. Kommentarverktyget inför i stället länkar i huvudfilen med <anchor xml:id="start[siffra]"/> och <anchor xml:id="end[siffra]"/> runt lemmat. Själva kommentaren finns i en MySQL-databas i stället för inne i filen. Vid publicering på ZTe omvandlar Publiceringsverktyget Kommentarverktygets HTML till XML och skriver in punktkommentarerna från databasen i den allmänna kommentarens XML-fil. Filen döps om automatiskt och sparas på webbservern. Den filen editeras normalt inte, utan ändringar i kommentarerna görs alltid i Kommentarverktyget varpå kommentarerna publiceras på nytt. Utgivarens kommentarer infördes alltså tidigare i elementet <note>. Eftersom samma element används för noter och anteckningar i textkällan behövdes värdet editor i attributet type. Kommentarerna försågs också med ett id, och eftersom varje id bör finnas bara en gång i XMLfilen i fråga användes prefixet en (editorial note) i kombination med en löpande numrering som i varje dokument började med 1. I attributet resp infördes initialerna för den som skrivit kommentaren. Lemmat avgränsades med hjälp av id:n som infördes i ett target-attribut samt i ett tomt <anchor/>-element. <anchor/> angav var lemmat började. Lemmats slutpunkt var där kommentaren infördes, och behövde alltså inte anges explicit. De id:n som användes för lemmatisering försågs med prefixet lem, som efterföljdes av en löpande numrering som började med 1. Ex. 1: [...] men <anchor id="lem1"/>filosofen i <placeName>Königsberg</placeName><note type="editor" id="en1" resp="NoN" target="#lem1">Immanuel Kant</note> hade [...] <anchor/> och <note> infördes utanför namnkodning, kodning av främmande språk8 etc. Standardkommentarer om personer infördes redan tidigare på annat sätt, se avsnitt 7.2. Kommentarkodningen placerades också utanför eventuell <choice>-kodning. Ifall lemmat bestod av ett helt textstycke infördes kommentarkodningen däremot innanför <p>-taggarna: Ex. 1: <p><anchor .../>[texten i ett stycke]<note ...>[kommentartext]</note></p> 8 Men ifall det var bara ett av flera efterföljande ord på främmande språk som kommenterades placerades <anchor/> och <note> innanför <foreign>-kodningen. 81 Namnkodning etc. infördes inte i kommentartexter, utan för ev. typografiska markeringar användes enbart <hi>. Källhänvisningar föutsågs få en grundläggande <bibl>-kodning i samband med kommenteringen. Ex. 1: <bibl>(Klinge 1995, s. 89–111)</bibl> 7.2 Uppgifter om personer, orter och verktitlar Uppdaterad 23.2.2012 Standardkommentarer om personer, orter och verktitlar som förekommer i Topelius texter (och gällande brevutgåvan även korrespondenternas texter) införs i en databas och kopplas till det aktuella textstället med ett id. Införandet av länknings-id:n sker halvautomatiskt med hjälp av programmet TEI Id Selector, som har konstruerats av Mikael Norrgård. id:na för namn på historiska personer har prefixet pe efterföljt av ett unikt nummer, som fastslås av länkningsprogrammet. Mytologiska och bibliska personer har prefixet my och fiktiva personer prefixet fi. Orter har prefixet pl och verktitlar har tw för huvudposter och tu för enhetsposter. Huvudposterna är böcker, periodika och småskrifter medan enhetsposterna är t.ex. enskilda dikter eller noveller som ingår i en verkhelhet. Även om länkningskodningen består av ett id används i det här sammanhanget inte attributet id utan attributet corresp, som alltså kan ha värden som pe3516, my342, pl145 och tw11. Attributet och det för hela utgåvan unika värdet införs av TEI Id Selector i namnkodningselementet, så att resultatet blir t.ex. <persName corresp="pe3516">Fredrik I</persName>. I de fall när en person förekommer i en text utan att alls nämnas vid (fullständigt) namn används i brev och dagböcker <rs>, och namnet har ibland skrivits ut i attributet corresp i samband med namnkodningen. När länkningskodning sedan införs ersätter programmet automatiskt det utskrivna namnet med ett id. I fall där man vill signalera att det finns osäkerhet ifråga om en corresp-kodad persons (eller titels eller plats) identitet kan correspUncert="Y" införas efter corresp. Se även skilda instruktioner för varje databas. OBS: Att ett namn på en person länkas till en standardkommentar utgör inget hinder för att man omedelbart efter namnet inför en egentlig punktkommentar som beaktar sammanhanget, t.ex. förklarar hur det kom sig att personen befann sig på den aktuella platsen vid tidpunkten i fråga. 82 8 Genrespecifikt 8.1 Prosa Uppdaterad 27.4.2010 Versrader i prosatext: Ex. 1: <lg> <l>Han lefde, sålde salt,</l> <l>Och det var allt.</l> </lg> Med elementet <lg> grupperas versraderna i strofer, och man kan vid visning åstadkomma en tom rad mellan stroferna. Även om det inte finns någon strofindelning bör elementet <lg> användas. Detta för att möjliggöra ett större radmellanrum före och efter versinslaget än mellan versraderna. Eventuella blankrader i originalet före och efter versinslagen registreras alltså inte i kodningen. Ex. 2: <lg> <l>Skatan hon skrattar på rönnelegren,</l> <l rend="center">Qvatt, qvatt, filidu!</l> <l>Si, nu har jag stulit mig silfverneske’n,</l> <l>Qvatt, qvitt, olohoj, oj, oj!</l> </lg> <lg> <l>Ekorrn han gör sig en snara af bast,</l> <l rend="center">Qvatt, qvatt, filida!</l> <l>Så stjäl han den skeden med hiskelig hast,</l> <l>Qvatt, qvitt, olohoj, oj, oj!</l> </lg> <lg> <l>Skatan blef hängd, så fick ekorrn medalj,</l> <l rend="center">Qvatt, qvatt, filidu!</l> <l>Han stal af en tjuf, det var ärlig batalj,</l> <l rend="indent">Qvatt, qvitt, olohoj, oj, oj!</l> </lg> Centrering av kortare rader åstadkoms med <l rend="center">. Med samma element och attribut men med värdet indent anges att en enskild versrad är indragen men inte centrerad i förhållande till de övriga. Se även avsnittet om lyrik nedan. 8.2 Lyrik Uppdaterad 25.4.2012 83 Allmänt Strofer införs i <lg>, som står för line group. Innanför <lg> införs de enskilda versraderna i <l>element. Ifall en versrad är indragen bör det anges explicit med <l rend="indent">, det finns nämligen inget förvalt värde för <l>, i motsats till <p>. Observera att <l> står för verse line och alltså endast får innehålla versrader. Prosalyrik bör därför kodas med <p> och varken <l> eller <lg> får användas. Eventuella blankrader i prosalyriken kodas med det tomma elementet <lb/>, som införs efter att ett <p>-element stängts och före det följande öppnas. Ex. 1: <lg> <l>I skogen är det stilla,</l> <l>Och ingen vaka slår,</l> <l>Och ingen uggla störer</l> <l>Den tystnad som der rår.</l> </lg> Ifall en enskild versrad i originalet har fördelats på två rader p.g.a. att spaltbredden inte räcker till för långa rader, såsom t.ex. i ”Prins Gustaf.” i Ljungblommor III, bör detta inte kodas fototroget mot originalet: Ex. 2a: <lg> <l>Men hvar finns en graf så tidig, bäddad uti nordens höst,</l> <l>Mera värd att strös med blommor, helgas utaf saknans röst?</l> <l>Och hvar finns en vissnad ynglings bild, så huld, så mild</l> <l rend="indent">som din,</l> <l>Uti tusen, tusen hjertan ristad outplånligt in?</l> </lg> utan i stället så som versmåttet, de andra stroferna och indraget indikerar: Ex. 2b: <lg> <l>Men hvar finns en graf så tidig, bäddad uti nordens höst,</l> <l>Mera värd att strös med blommor, helgas utaf saknans röst?</l> <l>Och hvar finns en vissnad ynglings bild, så huld, så mild som din,</l> <l>Uti tusen, tusen hjertan ristad outplånligt in?</l> </lg> Att ord flyttats ner på följande rad av utrymmesbrist men egentligen hör till föregående versrad brukar nämligen indikeras i originalet med ett mycket stort indrag, avsevärt större än det som används för ”vanliga” indragna versrader. Förutom vanliga indrag och mycket stora indrag p.g.a. liten spaltbredd finns också en tredje typ av indrag, där en enskild versrad har fördelats på två rader. Av versmåttet, de andra stroferna samt indragets storlek framgår att det är fråga om en enda versrad, och inte två enskilda. I stället för rend="indent" används då attributet part med värdena I, M och F, vilka står för initial, medial och final, d.v.s. den inledande, mellersta och avslutande delen av en inkomplett versrad. Värdet M används alltså tillsammans med I och F när en enskild versrad fördelats på tre rader, vilket i originalet kan se ut som t.ex.: Ord ord 84 Ord ord Ord ord Ord ord ord ord ord ord Ord ord ord ord ord ord I exemplet nedan ur ”Toinis Julafton.” i Lfb II framgår det både optiskt och av versmåttet att de två första raderna utgör en enda versrad fördelad på två rader: Ex. 3: <lg> <l part="I">Min goda Emmi!</l> <l part="F">Efter just</l> <l>Min mamma skrifver till din mamma</l> <l>Om Ulå lax och Smålands ost,</l> <l>Så får jag en så hjertlig lust</l> <l>Att skrifva till dig med detsamma.</l> </lg> <lg> <l>Jag hoppas du mår rysligt bra</l> <l>Och att du haft förskräckligt roligt.</l> <l>Alltsen vi fingo lof, så ha</l> <l>Vi lackat hela qvällarna</l> <l>Och lekt och roat oss otroligt.</l> </lg> Genom kodningen med <l part="I"> och part="F" kan rad två visas med ett annat indrag än rader som kodats med rend="indent", och kodningen är också mer logisk eftersom den beskriver att det är fråga om en inkomplett versrad, i stället för att bara registrera att rad två har ett indrag. Kodningen med part möjliggör också att de två raderna vid ombrytning kan få samma radnummer, vilket är det önskade för inkompletta versrader. Ex. 4: <p>Derborta – så långt en öfvad vandrare går på dagarna twå eller ryttaren rider på 14 timmar eller mer, på gångare goda, – derborta i en gård som du icke wet bor någon som du icke känner.</p> Ifall textstycket är inte är indraget i originalet kodas det − precis som ifråga om vanlig prosa − med <p rend="noIndent">. Ifall radbrytningarna i prosalyriken uppfattas som betydelsebärande kan de kodas med <lb/> inne i <p>. Paginering: Pagineringskodning införs genom att man i sidbrytningstaggen <pb/> inför sidnumret som värde för attributet n, och som värde för type anger antingen orig, orig unprinted, ZTS eller ZTS unprinted (se Kodning av allmänna textuella företeelser, avsnitt 2.1). Förutsatt att dikten börjar uppe på sidan införs det första sidnumret mellan <div>-starttaggen och <head>. De övriga <pb/>-taggarna införs mellan två <l>- eller <lg>-taggar, beroende på om sidbrytningen infaller mellan två versrader eller mellan två strofer. En kort dikt som börjar ett stycke ner på sidan och slutar på samma sida blir utan pagineringskodning. Detta torde dock inte ha någon 85 större praktisk betydelse: användarna kan se sidnumren i närmast föregående eller efterföljande dikt. Radnumrering: Kodning för radnumrering av den etablerade texten införs automatiskt av Publiceringsverktyget. Samtliga versrader förses med n="[siffra]", och i stilmallarna kan man sedan välja att visa t.ex. enbart nummer som är delbara med fem. Kommentarer: Punktkommentarer har tidigare införts direkt i själva diktkodningen på det aktuella textstället, i enlighet med de generella instruktionerna om kodning av punktkommentarer, men detta görs inte längre i och med att Kommentarverktyget finns. Den allmänna kommentaren infördes också i samma fil som den etablerade texten och placerades efter själva dikttexten, avgränsad med <div type="comment">. Ev. bakgrundstexter för e-versionen infördes i <div type="background">, underordnat <div type="comment">. Filerna hade alltså följande övergripande struktur: <text> <body> <div type="poem"> [själva dikten med punktkommentarer] </div> <div type="comment"> [Den övergripande kommentaren] <div type="background"> [Bakgrundstext] </div> </div> </body> </text> Elementet <div type="background"> infördes i kodningen endast om det verkligen fanns en bakgrundstext. Kodning av diktmanuskript Diktmanuskriptets signum: Anges i <title> som ingår i <teiHeader>: Ex. 1: <title>[manuskriptets hela signum]</title> Titel: Ex. 1: <head>Grafven i Karttula</head> Citat, överskrifter, motton el. dyl. anteckningar i anslutning till titeln: 86 Ex. 1: <head type="motto">efter Rückert</head> Datering: Manuskriptets datering införs i <date>-elementet och standardformat anges – se Manuskriptbeskrivande kodning, avsnitt 3.2. Dateringarna införs inte i något <l>- eller <p>element, utan <date> bör i stället alltid omslutas av strukturelementet <dateline>. Ev. datum som omnämns i dikten kodas inte. Ifall dateringen har integrerats i själva dikten bör <date>-kodning däremot införas, men utan att <dateline> används. OBS 1: endast själva datumet (eller en tidsperiod) får införas i <date>. Ev. angivelse av tillkomstort får endast införas i <dateline>. Ex. 1: <dateline>Helsingfors <date>den 4 maj 1864</date></dateline> OBS 2: <dateline> bör alltså användas även om det inte innesluter någon annan text än den som markeras med <date>. Dateringarna får inte placeras innanför <lg> eller <l>. Ifall en datering i manuskriptet har införts till höger om en versrad bör den därför införas i kodningen efter ifrågavarande strof, d.v.s. efter att ett <lg>-element stängts och före det följande öppnats. Underskrift: Ifall Topelius har signerat ett diktmanuskript införs underskriften i <signed>, som i sin tur bör omslutas av <p>. Ex. 1: <p><signed>Zacharias Topelius</signed></p> Tillägg på raden: Tillägg på raden kodas <add place="inline">[tillägg]</add>. Härmed avses tillägg i slutet av raden, tillägg som skrivits in (ev. med annan penna) på ett sådant textställe där författaren tidigare har reserverat utrymme med tanke på att senare kunna införa ett eller flera ord, samt bokstäver som ”klämts in” mellan två tidigare inskrivna ord. Tillägg mellan raderna: Ifall en hel versrad har tillagts mellan tidigare skrivna versrader kodas detta med <addSpan/> och <anchor/>, utan att place eller type="noAnchor" behöver anges: Ex. 1: <addSpan spanTo="#add4"/> <l>Osmanernas välde är slut</l> <anchor id="add4"/> ”etc.” eller motsvarande i slutet av eller efter versraden: Även om t.ex. ett etc. inte är tänkt att ingå i versradens slutliga utformning kodas det innanför <l>. Detta eftersom det vid visning annars skulle placeras på ny rad. 87 Ex. 1: <l>Som ett vårregn öfver häggen etc.</l> Strofrubriker och liknande: Ifall strofer − t.ex. i vänstra marginalen − har försetts med ”etiketter”, såsom t.ex. A eller B, kodas de som strofrubriker, d.v.s. i <head> innanför <lg>: Ex. 1: <lg> <head>A.</head> <!--Strofrubrikerna skrivna i vänstra marg. (TG)--> <l>Ägde jag blott dig,</l> <l>himmel för mitt hopp</l> <l>späda rosenknopp,</l> <l>ägde jag blott dig!</l> </lg> Motsvarande ”etiketter” i början av versraderna (gäller ej numrering, se nedan) markeras däremot inte med någon skild kodning utan inkluderas i <l>: Ex. 2: <l>A: Ditt öga är blått som himlen –</l> <l>B: Ditt öga är svart som en skön åska.</l> <l>A: – Solsken sprider du kring dig –</l> Numrerade strofer och versrader: Ifall strofer eller versrader har försetts med numrering som tyder på att författaren har tänkt sig att deras inbördes ordningsföljd ska ändras, men det är oklart exakt hur numreringen ska uppfattas, kan <switchPos>-kodningen utelämnas. Istället inför man enbart siffrorna i <l> eller <lg>, t.ex som <l n="7"> eller <lg n="3">. Strykning av en hel rad eller titel: När endast en hel rad eller titel har strukits används <delSpan/> och <anchor/> utanför <l> och <head>. <delSpan/> ges attributet rend="strikethrough" för att den enskilda raden ska kunna visas som genomstruken i stället för med grå bakgrund såsom vid vanliga omfattande strykningar. Flera strukna rader eller en hel struken strof kodas med vanlig <delSpan/>kodning utan rend="strikethrough". Strykningar innanför en sådan omfattande strykning återges med <del> för enstaka ord och med <delSpan rend="strikethrough"/> för hela rader. Ex. 1: <delSpan rend="strikethrough" spanTo="#del1"/> <head rend="underline"/>Stenarna i <placeName>Kyro</placeName>.</head> <anchor id="del1"/> I ex. 1 ses en rubrik som strukits och som ska visas som genomstruken. Vanlig <del>-kodning kan inte användas, eftersom <del> inte får innesluta <l>, <lg> eller <p> och här inte heller kan placeras innanför dessa element, eftersom det då blir en tom rad kvar i visningsalternativet med inarbetade ändringar. Vanlig <delSpan/>-kodning skulle visa rubriken med grå bakgrund, utan genomstrykning. 88 Ex. 2: <addSpan spanTo="#add1"/> <delSpan rend="strikethrough" spanTo="#del1"/><l>Smektes som ett litet spenbarn.</l> <anchor id="del1"/><anchor id="add1"/> En hel rad har först lagts till och sedan strukits, visas i blått för tillägg samt genomstruken. Exemplet ur ”Kantele.”, Ljungblommor I. Ex. 3: <delSpan spanTo="#del4"/><lg> <l>Ser du den gråa kämpen – <del>han derborta</del></l> <l>Vid torpet uti skogen – bräcklig, böjd,</l></lg> <anchor id="del4"/> Strykning av enstaka ord innanför en omfattande strykning. Exemplet ur ”Veteranerne.”, Sånger I. Kodning av ofullständigt Oavslutad versrad: Ofullständiga versrader kodas med <l part="y">. part är i det här fallet en förkortning av partial. Det förvalda värdet är att versraden är avslutad: man behöver alltså aldrig explicit ange part="n". Ofullständig strof: Om man entydigt kan sluta sig till att en hel versrad eller flera versrader saknas i en strof bör detta anges i <lg> på följande sätt: <lg part="y">. Kodningen av ofullständigt bör införas så exakt som möjligt, och inte dubbelt eller trippelt. Med det här avses att om en versrad är ofullständig införs part="y" endast på den aktuella raden. Att en enskild versrad är ofullständig innebär inte att strofen, d.v.s. <lg>, ska kodas med part="y". Strofer kodas med part="y" endast om en hel rad saknas, d.v.s. är helt oskriven eller har strukits i sin helhet. OBS: En halvfärdig versrad eller strof som har strukits i sin helhet ska inte kodas som ofullständig. Ifall t.ex. versraden inte har ersatts av en annan – och om dikten därmed måste uppfattas som ofullständig – införs kodningen på strofnivå, alltså i <lg>. Kodning av etablerad text Den etablerade texten förses med semantisk kodning på samma sätt som i andra genrer. Även kodningen av titlar och rubriker följer de allmänna instruktionerna. Exempel på kodad dikt OBS: <teiHeader> återges inte i exemplet, som är ”Villande vägar.”, Ljungblommor II. <text> <body> 89 <div type="poem"> <pb type="orig" n="155"/> <head>Villande vägar.</head> <lg> <l>O Gud, min Gud, förbarma dig i natten!</l> <l>Min själ har natt, fast lifvets morgon randas,</l> <l>Min ande törstar, räck mig lifvets vatten,</l> <l>Ty jordens dryck med dödens floder blandas!</l> <l>Fast lifvet ler och skön är ungdomsskatten,</l> <l>Till jorden trycker mig den luft jag andas,</l> <l>Och himlens stjernor slockna bort i natten.</l> </lg> <lg> <l>I töcken går jag; vägen jag ej finner,</l> <l>Som till din kärlek går igenom verlden;</l> <l>Mig villar jordens glans, som snart förbrinner,</l> <l>Jag kan ej trampa rosorna på färden,</l> <pb type="orig" n="156"/> <l>Och derför aldrig fram till dig jag hinner.</l> <pb type="ZTS" n="166"/> <l>En stjerna lik i djupet utaf fjärden,</l> <l>Din herrlighet jag ser och aldrig finner.</l> </lg> <lg> <l>I dina armar, Gud! i dina armar</l> <l>Jag hvila vill. Min själ är trött till döden,</l> <l>Och lifvets lust mig outsägligt harmar;</l> <l>Förbrunnen är den vilda ungdomsglöden,</l> <l>Och jag vill dö, om du dig ej förbarmar.</l> <l>Om du mig flyr, skall jag förgås i nöden;</l> <l>O <choice><orig>Gud.</orig><reg resp="CE">Gud,</reg></choice> min Gud! jag flyr i dina armar.</l> </lg> <dateline><date when="1840">1840.</date></dateline> </div> </body> </text> 8.3 Brev Uppdaterad 23.9.2013 Inledande del 90 Textkategori: Direkt efter <body> införs textindelningselementet <div> med tillhörande precisering av texttyp: <div type="letter"> Som attributvärde anges alltid letter, även om det är fråga om en biljett, ett postkort eller ett telegram. Att det är fråga om t.ex. ett postkort framgår ändå av brevdatabasen. Även attributet xml:lang kan användas i <div>, ifall brevet i sin helhet är skrivet på ett främmande språk. <div>-taggen stängs i slutet av brevet, strax före <body>-elementets sluttagg. Avskrifter, kopiebrev och utkast: Om brevet transkriberats efter avskrift, kopiebrev eller utkast noteras detta i xml-dokumentet inom ett <p> i <sourceDesc>: ex. <p>Handskriven avskrift av annan hand<p> Om kodningen görs på basis av en avskrift kodas inte ändringar och tillägg. Kontrakt: Kontrakt saknar databaspost och får därför inte de automatiska överskrifter som genereras för brev. Överskriften införs därför i headern. I <profileDesc> placeras ett <creation>-element som omsluter <title type="desc">: <profileDesc> <creation><title type="desc">Överskriftstexten skrivs in här</title></creation> <handNotes> <handNote medium="black-ink"/> </handNotes> </profileDesc> Inledande del: Till brevets inledande del räknas ev. adressrad överst på sidan, ort och datum, och inledande hälsning, d.v.s. allt som står skrivet före den löpande brevtexten. Den inledande delen införs i elementet <opener>. Element som kan ingå i <opener> är alltså <address>, <dateline> (med dess ev. underordnade namnelement) och <salute>. Med hjälp av <opener> kan man i stilmallarna åstadkomma standardiserade mellanrum mellan brevets inledande del och den löpande texten. Det får finnas flera <opener> i ett och samma brev när det mitt i brevet förekommer en ny hälsningsfras eller datering, som inte är skriven som en del av den löpande texten. Detta även om brevet inte är indelat i en tidigare och en senare del, se nedan. Det kan också förekomma text före <opener>, t.ex. om brevet inleds med en dikt före datering och hälsningsfras, men i allmänhet är <opener> det som inleder brevet. I vissa fall kan <head type="letter"> ersätta <opener>, t.ex. om brevet utgörs av ett kontrakt eller liknande. De båda elementen kan också samexistera. 91 Indrag, centreringar och högerställningar kodas inte för text som ingår i <opener> eller <closer>. Adressat: Om mottagarens namn och ev. boningsort (eller fullständig adress) har antecknats i den inledande delen, t.ex. överst på sidan, införs detta i <address>: Ex. 1: <address>Herr <persName>Albert Bonnier</persName>, <placeName>Stockholm</placeName></address> Adress eller datering i slutet av brevet: se avsnittet om Avslutande hälsning och underskrift. Ort och datum: Angivelse av ort och datum i början eller slutet av brevet kodas med <dateline>. Orten kodas därtill som namn på plats, men någon egentlig datumkodning införs inte eftersom dateringen anges i databasen, i standardformat. Ex. 1: <dateline><placeName>Helsingfors</placeName> den sjunde maj 1853.</dateline> Ifall hela innehållet i <dateline> är grafiskt markerat kan rend användas i elementet ifråga. Om innehållet i <dateline> endast delvis är t.ex. understruket införs rend antingen i <placeName> − ifall det är ortnamnet som är grafiskt markerat − eller i ett <hi>-element som placeras innanför <dateline>. Öppningshälsning: Den inledande hälsningen införs i elementet <salute>. Ex 1: <salute>B. Broder!</salute> Eventuella tomma rader mellan hälsningen och den löpande texten noteras inte i kodningen. Rubrik: Ifall det istället för en öppningshälsning finns en rubrik av något slag används <head type="letter">. Brevrubrikerna ska i visningen vara mindre till storleken än vanliga rubriker i andra genrer och specificeras därför med attribut och attributvärde. Ex 1: <head type="letter">Fullmakt.</head> Motton och dylikt i anslutning till rubriken kodas med <head type="motto">. Observera att <head>-elementet enligt TEI-riktlinjerna inte får vara underordnat <opener>. I motsats till <salute> måste alltså <head> införas före eller efter <opener>. Löpande text Tomma rader: 92 Tomma rader mellan den löpande brevtexten och inledande respektive avslutande del kodas inte, utan tack vare <opener> och <closer> kan standardiserade mellanrum införas med hjälp av stilmallar. Tomma rader före ett PS införs inte heller i kodningen, eftersom även de kan åstadkommas med stilmallar. Löpande brevtext: Före den löpande brevtexten börjar stängs <opener>-elementet. Den löpande textens stycken införs sedan i <p>-element. Observera att enbart <p> står för ett indraget stycke; om ett stycke är utan indrag används i stället <p rend="noIndent">. Inledande stycke och stycke efter <milestone/>, tabell eller annan avvikande uppställning återges utan indrag och kodas med <p rend="noIndent">; ifall ett sådant stycke är indraget görs alltså en stillatigande normalisering. Vi har också den normaliseringen att alla övriga stycken visas med indrag också fast det inte finns i början av ett stycke eller vid <pb/> (detta har ofta kodats fel i breven). Olika långa streck, vertikala och diagonala, som understryker avstånd mellan två textstycken, återges som <milestone type="smallBar"/>. Personreferenser: Ex. 1: <rs corresp="Anders Andersson">Landshöfdingen</rs> var där. [...] Och landshöfdingen sade [...] Om det hänvisas till en identifierbar person med t.ex. titel eller relationsbeteckning (t.ex. ”redaktören”, ”moster”, ”din son”) som inte alls nämns vid namn i brevet, förses personreferensen ifråga med <rs>-kodning. rs står för reference string. I <rs> kan man registrera vem som avses m.h.a. corresp (även om namnet senare − i samband med länkningen med TEI Id Selector − ersätts av ett id). Till skillnad mot <persName> behöver <rs> införas endast då personen förekommer för första gången, andra förekomster i samma brev lämnas utan <rs>-kodning. Om personnamn eller titel utgör tilltalsord kodas detta inte, t.ex. ”Statsrådet”, ”Herr Edlund, inte heller brevets undertecknare <signed>. Grafiska markeringar: Om ett eller flera ord är understrukna eller på annat sätt framhävda används <hi> tillsammans med grafiska preciseringar. Ex. 1: <hi rend="underline">[understruken text]</hi> Trots att kodningen registrerar att understrykning använts i originalet är det inget som hindrar att det senare visas som kursiverat. 93 Radbrytning: Radbrytningar kodas inte i den löpande brevtexten, däremot i den inledande och den avslutande delen (med <lb/>), förutsatt att det är fråga om radbyte av estetiska skäl, inte enbart till följd av utrymmesbrist. Observera att <lb/> ersätter blankstegen mellan orden före respektive efter radbrytningen. Ex. 1: avslutningsfras och underskrift som skrivits i högerkanten på tre rader: Glöm aldrig din ödmjuke tjänare Z. Topelius Kodas på följande sätt: <closer> <salute>Glöm aldrig<lb/>din ödmjuke tjänare</salute><signed>Z. Topelius</signed> </closer> OBS: Det behövs alltså inte någon <lb/>-tagg före <signed>. I de inledande och avslutande delarna, d.v.s. i <opener> och <closer>, placeras texten i ett nytt element (<address>, <salute>, <head>, <dateline> och <signed>) automatiskt på ny rad vid visning. Före <salute> behövs det inte heller någon <lb/>-tagg: det närmast föregående <closer>-elementet står för radbrytning och ev. tom mellanrad. Sidbrytning och paginering: Paginering införs inte, men sidbrytningar anges med <pb/>. Ifall sidbrytningen sker mellan två fristående ord införs blanksteg efter men inte före <pb/>. Om sidbrytningen finns inne i ett ord ska det inte finnas något blanksteg vare sig före eller efter taggen Ifall sidbrytningen sker mellan två textstycken behövs inga blanksteg: <p>[...]</p><pb/><p>[...]</p> ”Vänd!” etc: Om ”vänd” eller motsvarande uppmaning står skriven längst ner till höger på sidan transkriberas och kodas den inte, eftersom inte heller sidnummer införs. Versinslag: Versinslag kodas som i lyriken, d.v.s. enskilda versrader markeras med <l>, och för strofindelning används <lg>. Även om det inte finns någon strofindelning bör <l>-elementen omslutas av <lg>-taggar. Detta för att möjliggöra ett ev. större radmellanrum före och efter versinslaget än mellan versraderna. 94 OBS 1: <l> får användas enbart för vers. Om man i prosatext uppfattar radbrytningarna som betydelsebärande använder man <p> och <lb/>. OBS 2: Kodning för sofortkorrekturer används inte i fråga om brev som är skrivna helt eller delvis på vers. Tryckta inslag: Färdigt tryckt text (t.ex. brevhuvud, visitkort) som ingår i själva brevtexten kodas med <print>. Stämplat brevhuvud kodas med <stamp>. Om brevhuvudet är satt med enbart kapitäler eller versaler normaliseras de stillatigande till versal och gemener. Ex. 1: <print>Dr <persName>Zacharias Topelius</persName></print> tackar för inbjudan till [...] Namnkodningen bör införas innanför <print>. Ifall det färdigt tryckta är t.ex. kursiverat anges detta som följer: Ex. 2: <print><persName rend="italics">Dr Zacharias Topelius</persName></print> Observera att rend inte får användas direkt i <print>: oberoende av om det tryckta inslaget är t.ex. kursiverat i sin helhet eller endast delvis så används alltså <hi> eller ett namnkodningselement innanför <print>. Ex. 3: <print>Dr <hi rend="italics">Zacharias Topelius</hi></print> I exemplet är alltså själva namnet kursiverat, men inte titeln. Elementet <print> ingår inte i TEI, och det finns därmed inga färdiga riktlinjer för hur det ska användas. I vår kodning använder vi det endast innanför <opener> och <p> samt i <closer> endast innanför däri ingående <salute> och <signed>. Händer och pennor: Se Manuskriptbeskrivande kodning, avsnitt 3.5. Observera att eventuella anteckningar som mottagaren har gjort i breven inte alls ska inkluderas i textfilerna. Avslutande del Indrag, centreringar och högerställningar kodas inte för text som ingår i <opener> eller <closer>. Avslutande hälsning och underskrift: Brevets avslutande del, som vanligen består av hälsning och signatur, införs i elementet <closer>. Observera att <closer> ändå stängs före ett eventuellt PS. Med hjälp av <closer> kan man i stilmallarna åstadkomma standardiserade mellanrum mellan den löpande brevtexten och den avslutande delen, samt t.ex. högerställning av hälsning och underskrift. 95 Den avslutande hälsningen kodas på samma sätt som den inledande med <salute>. Brevskribentens underskrift markeras med <signed>. Ifall underskriften efterföljs av en punkt inkluderas denna i <signed>. Punkten kan anses höra till autografen, och framför allt hamnar den annars på ny rad. Ex. 1: <salute><foreign xml:lang="lat">Tuus</foreign></salute> <signed>Fred. Cs.</signed> OBS 1: Namnkodning används inte i samband med <signed> eftersom elementet per definition innehåller ett personnamn. OBS 2: Man kan använda två <closer> i samma brev även om det inte är indelat i en tidigare och en senare del, se nedan. Detta kan behövas t.ex. när det finns en datering efter ett postskriptum. <closer> kan i vissa fall också innehålla ett <address>-element, ifall brevskrivaren placerat mottagarens adress efter sin signatur eller avslutande hälsning. Ifall brevskrivaren placerat sin egen adress där kodas den däremot med <dateline>. Integrerade avslutningar: En avslutande hälsning som är skriven som en del av den löpande brevtexten kodas inte med <salute> och inkluderas inte heller i <closer> utan införs i det sista textstyckets <p>-taggar. Däremot bör underskriften kodas med <signed> samt inkluderas i <closer>. Ex. 1: Originalet: [...] önskar Din broderligt förbundne Zachris Kodas: <p>[...] önskar Din broderligt förbundne</p> <closer><signed>Zachris</signed></closer> Om den avslutande hälsningen språkligt utgör en fortsättning på den löpande texten, men ifråga om brevets utformning är åtskild från den närmast föregående texten, kodas den helt normalt innanför <closer>: Ex. 2: Originalet: [...] önskar Din broderligt förbundne Zachris Kodas: <p>[...] önskar</p> <closer> <salute>Din broderligt förbundne</salute> <signed>Zachris</signed> </closer> Stämpel: Om det istället för en vanlig underskrift finns en stämpel med brevskribentens namn kodas detta med ett <stamp>-element innanför <signed>: 96 Ex. 1: <signed><stamp>Zacharias Topelius</stamp></signed> Om det däremot utöver en handskriven signatur finns en stämpel som ett slags namnförtydligande noteras stämpeln inte i kodningen. Ifall det finns en stämpel i början av brevet kodas den i ett <stamp>-element som är direkt underordnat <opener>. <stamp> får inte användas innanför <address>. Postskriptum: Postskriptum införs i elementet <postscript>, och innanför det kodas själva texten med <p>taggar, förutsatt att postskriptumet inte är skrivet på vers. Alla någorlunda korta texter som följer efter avslutningsfras och signatur kodas som postskriptum, också om det inte finns något utskrivet P.S. eller motsvarande. Ett postskriptum kodas inte som ett tillägg − d.v.s. med <addSpan/> − bara för att det till följd av utrymmesbrist har skrivits i vänster- eller högermarginalen. I fråga om postskriptum som inte utgör egentliga tillägg anges det inte i kodningen var de är införda. Ifall man däremot på en eller annan grund kan sluta sig till att ett PS skrivits in senare än den övriga texten, kodas PS:et först som ett tillägg med <addSpan/> och <anchor/>, och mellan dem som ett PS med <postscript> och <p>. Betr. användningen av <addSpan/> och <anchor/>: se även kapitlet om Manuskriptbeskrivande kodning, avsnitt 3.6. Ex 1: <addSpan spanTo="#add3" place="rightMargin"/><postscript><p rend="noIndent">Hvem blef utsedd till din efterträdare?</p></postscript><anchor id="add3"/> En rubrik ovanför ett postskriptum kodas med <head>, som placeras efter </closer> och före <postscript>. Det vanliga P.S. anses inte vara en rubrik. Ex 1: <closer><salute>din tillgifna</salute><signed>Aurore</signed></closer> <head rend="underline2">Helsningar</head> <postscript><p rend="noIndent">Framför Tusende helsningar till <persName>Rosenkampffs</persName> och <persName>Emelie</persName>!</p></postscript> Tidigare och senare brevdel Tidigare och senare del: Om en lång text har skrivits till efter signaturen, kanske först litet senare, kan man överväga att istället för <postscript>-kodningen indela brevet i en tidigare och en senare del. Detta sker med <div type="letterpart">: Ex. 1: <div type="letter"> <div type="letterpart" part="i"> <opener>[text]</opener> <p>[brevtext]</p><pb/><p>[brevtext]</p> <closer>[text]</closer> 97 </div> <div type="letterpart" part="f"> <opener>[text]</opener> <p>[innehåll]</p> <closer>[text]</closer> </div> </div> Ex. 2: <div type="letter"> <div type="letterpart" part="i"> <opener>[text]</opener> <p>[brevtext]</p><p>[brevtext]</p><pb/> </div> <div type="letterpart" part="f"> <head>[rubrik]</head> <p>[text]</p><pb/> <table>[innehåll]</table> <closer>[text]</closer> </div> </div> Attributvärdet i står för initial och värdet f för final. Brevkodningselementen <opener> och <closer> kan användas i vardera brevdelen. Ifall det i samma manuskript finns två brev som inte har någon som helst gemensam text kodas de skilt för sig. Kodning i en tidigare och en senare del är motiverat t.ex. om Topelius och Emilie under en gemensam datering och ortangivelse har skrivit var sin brevtext med öppnings- och avslutningshälsning. Tillägg i marginalerna eller där den löpande texten vanligen finns Beträffande dessa tillägg måste man bedöma om det är fråga om: a) en förankrad (fot)not som skrivits i marginalen eller där den löpande texten vanligen finns: kodas med <note>, place anges med värdena leftMargin, rightMargin, topMargin, foot eller other, och dessutom anges anchored="true". b) en (fot)not som författaren skrivit i marginalen eller där den löpande texten vanligen finns och glömt att förankra: införs där hänvisningstecknet skulle ha stått, kodas med <note> och place enligt ovanstående, samt därtill anchored="false". c) ett förankrat tillägg till den löpande brevtexten: kodas med <add> eller <addSpan/> och place anges med leftMargin, rightMargin, topMargin, botMargin eller other. d) ett oförankrat tillägg till den löpande brevtexten: kan införas på det ställe i texten som det ev. anknyter till, eller mellan textstycken som finns på ungefär den sidhöjd som tillägget börjat skrivas på. Tillägget kodas med <add> eller <addSpan/>, place enligt ovanstående samt type="noAnchor". e) ett postskriptum (med eller utan utskrivet PS): kodas med <postscript>, se ovan. Vanligen är postskriptum skrivna på sista sidan, men det kan finnas tillägg också på andra sidor som kan 98 uppfattas som PS. Om det finns ett oförankrat tillägg i marginalen på en annan sida än den sista, och det inte anknyter till den löpande texten på sidan, utan av allt att döma har skrivits till sist i brist på utrymme, kan detta betraktas som ett PS. Det införs i slutet av brevet och kodas som <postscript>. Om det finns flera PS som skrivits i marginalerna kan de lämpligen införas i samma ordningsföljd som de (sannolikt) har skrivits, d.v.s. PS:et på sista sidan först, sedan PS:et på nästsista sidan o.s.v. Om det framgår att ett PS i marginalen har införts senare och alltså utgör ett egentligt tillägg omsluts <postscript> av <addSpan/> och <anchor/>. Exempel på kodat brev Nedan visas som exempel ett brev från Zacharias Topelius till G. W. Edlund (ZTS-signum Br3135). <?xml version='1.0' encoding='UTF-8'?><?xml-stylesheet type="text/css" href="../../../TEIscheman%20(AM)/oxygen_css_author/tei_all.css"?><TEI xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.tei-c.org/ns/1.0 file:/T:/TEI-scheman%20(AM)/tei_brevschema.xsd" xmlns="http://www.tei-c.org/ns/1.0"> <teiHeader> <fileDesc> <titleStmt> <title>Br3135</title> <respStmt> <resp> </resp> <name> </name> </respStmt> </titleStmt> <publicationStmt> <publisher>Zacharias Topelius Skrifter</publisher> </publicationStmt> <sourceDesc> <p>Arkivsignum: se databas</p> <p>Handskriven avskrift</p> </sourceDesc> </fileDesc> <profileDesc> <handNotes> <handNote medium="black-ink"/> </handNotes> </profileDesc> </teiHeader> <text> 99 <body xml:space="preserve"> <div type="letter"> <opener><address>Herr <persName>G. W. Edlund</persName>, <placeName >Hfors</placeName>.</address><dateline><placeName>Björkudden</placeName> 9 Febr. 1880.</dateline></opener> <p>Haf vänskapen och återsänd genom <persName>Lindeman</persName> det ofullständiga ex. <title>Ljungblommor</title>. Ett fullständigt d<hi rend="raised">o</hi> skall korrigeradt insändas utan dröjsmål, när det behöfves.</p> <p>Jag har fått korrektur på 6:te arket ”<title>Finska Vinterqvällar</title>”, men <persName>B.</persName> lärer ej utlemna 1:sta häftet, innan det andra är färdigt, alltså i Mars.</p> <p>Låt mig också snarligen veta om och när det blir afgjordt angående<pb/> tryckningen i <placeName>Sthm</placeName> af <title>Läsning för Barn</title>!</p> <closer><salute>Vän och tjenare</salute><signed>Z. T.</signed></closer> </div> </body> </text> </TEI> Telegram Texten i telegramhuvudet återges inte i de kodade textfilerna. Uppgifterna om avsändning och ankomst (datum, klockslag och ort) införs i stället i brevdatabasen. Uppgifterna längst ner i telegrammet (om telegraftider och vem som telegraferat och expedierat) införs inte heller i XML-filerna. Själva telegramtexten kodas i princip på samma sätt som vanlig brevtext. Nämnas bör ändå att namnunderskriften kodas med <signed> trots att den inte är egenhändig. Observera också att kodning av händer inte behöver införas, eftersom det enbart är avsändaren som dikterat, och det är likgiltigt vilken tjänsteman som skrivit texten. Kodning av pennor införs däremot på samma sätt som för vanliga brev. I början av filen − lämpligen genast efter <title> − införs en redaktionell kommentar. I den anges att det är fråga om ett telegram, och uppgifter om avsändning och ankomst införs. Detta för att vi under arbetets gång inte ska behöva gå in i databasen för att kunna se när telegrammet har avsänts. Observera att vi − såsom ovan framkommit − också för telegram anger värdet letter i <div>-elementets type-attribut. Exempel på kodat telegram <?xml version="1.0" encoding="UTF-8"?> <TEI xmlns="http://www.tei-c.org/ns/1.0" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.tei-c.org/ns/1.0 ../../TEI_brevschema/tei_brev.xsd"> <teiHeader> <fileDesc> 100 <titleStmt> <title>Br1818</title> <!--Telegram. Avsänt Helsingfors 3.11.1872 kl. 14.50, mottaget Stockholm 3.11.1872 kl. 16.30--> <respStmt> <resp>Ansvarig redaktör:</resp> <name>Laura Mattsson</name> </respStmt> </titleStmt> <publicationStmt> <publisher>Zacharias Topelius Skrifter</publisher> </publicationStmt> <sourceDesc> <p>Arkivsignum: se databas</p> </sourceDesc> </fileDesc> <profileDesc> <handNotes> <handNote medium="blue-ink"/> </handNotes> </profileDesc> </teiHeader> <text> <body> <div type="letter"> <opener> <address>Herr <persName>Albert Bonnier</persName><lb/> <placeName>Stockholm</placeName><lb/> <placeName>Ålandsgatan 17</placeName> </address> </opener> <p>Ömsesidiga missförstånd. Skicka boken till <placeName>Finland</placeName>. Jag begär icke wederlag endast wiss tid.</p> <closer> <signed>Topelius.</signed> </closer> </div> </body> </text> </TEI> 8.4 Dramatik Uppdaterad 25.4.2012 101 OBS: Den genrespecifika kodningen för dramatik används också för dramatiska inslag inom andra genrer. Dramarepliker kodas med <sp>-taggar, som står för speech. De placeras ytterom rollinnehavaren och repliken. Ett nytt <sp> används för varje enskild talare eller replik. Olika delar inom samma rollinnehavares tal får alltså inte skilda <sp>, även om replikhelheten innehåller t.ex. flera prosastycken, en versdeklamation och dessutom scen- eller regianvisningar. Först när talaren byts börjar ett nytt <sp>. Ex. 1: <sp> <p><persName rend="uppercase">MYLLY MATTI</persName>. Puh – jag tror ryggen börjar på att bli gammal. Månntro jag kan sjunga ännu med säcken på nacken? <stage type="speaker">(Sjunger)</stage></p> <l>Jag heter <persName>Mylly Matti</persName> jag,</l> <l>Är mjölnare båd’ natt och dag ...</l> <p>Nej, det vill inte gå numera. [...] <stage type="speaker">(Går gnolande ut.)</stage></p> </sp> <sp> <p><persName rend="uppercase">LISA</persName> <stage type="speaker">(kommer in).</stage> Jag tyckte mig höra min fars röst. [...]</p> </sp> Om en replik inte föregås av namnet på en en rollinnehavare utan enbart av en fristående scenanvisning placeras <sp> efter scenanvisningen, runtom den egentliga repliken. Ex. 2: <stage rend="indent">Trumpetstötar. Härolden utropar:</stage> <sp> <l>Kungens bud och vilja är,</l> <l>Att, se’n perlan nu är funnen,</l> <l>Skola alla men’skor här</l> <l>Krypa strax på stund ur brunnen.</l> </sp> Om rollinnehavaren står på en egen rad markeras namnet med <speaker> innanför <sp>. En eventuell punkt efter rollnamnet tas med i <speaker>. <speaker>-kodningen är alltså ett sätt att inte behöva koda ett fristående namn som rubrik. Med enbart vanlig namnkodning skulle ju namnet inte kunna visas på en egen rad, eftersom <persName> bara får förekomma innanför <p>. Om rollinnehavarens namn uppfyller kriterierna för namnkodning förses namnet med <persName> innanför <speaker>. Ex. 1: <sp> <speaker rend="center"><persName>Stina</persName>.</speaker> <p>Nå, räkna ut hvad väder det blir i morgon.</p> </sp> <p>-elementet används för den text som utgör repliken. Ifall det är fråga om dramatik på vers används <l> istället för <p>. Om versraderna inom en replik är indelade i strofer används 102 dessutom <lg>. När en och samma versrad är fördelad på två eller tre rader, t.ex. så att en replikinnehavare uttalar den första halvan av en versrad och nästa replikinnehavare uttalar den avslutande halvan av versraden, används part="I" och part="F" i respektive <l>. Ex. 2: <sp> <speaker><persName rend="uppercase">VERA</persName>.</speaker> <l>Månntro jag, stackars lilla,</l> <l>Törs krypa ur min korg?</l> </sp> <sp> <speaker> <persName rend="uppercase">BUMBURRIFEX</persName>.</speaker> <l>Jag gör dig intet illa,</l> <l>Haf derför ingen sorg!</l> </sp> Inget förvalt värde är i bruk för rend i <speaker>, så något av värdena noIndent, indent och center bör alltid anges i kodningen, såvida man inte beslutat annorlunda för en viss utgåva. I Läsning för Barn kommer alla rollinnehavare i dramatik på vers att visas centrerade, så där behövs inget värde anges eftersom man ändå vet att <speaker> betyder <speaker rend="center">. Flera namn kan anges inom samma <speaker>-taggar, men om namnkodning används får varje namn ett eget <persName>. Ex. 3: <speaker rend="indent"><hi rend="italics">Kungen.</hi></speaker> Ex. 4: <speaker rend="center"><persName rend="uppercase">ROSA</persName> och <persName rend="uppercase">LILA</persName>.</speaker> Ex. 5: <speaker rend="center"><hi rend="uppercase">ALLA BARNEN</hi>.</speaker> <speaker> ska inte användas när talaren anges på samma rad som själva repliken. Då står rollinnehavaren innanför <sp> och <p> samt kodas enligt namnkodningsreglerna med eller utan <persName>, beroende på rollnamnets karaktär. Observera att en punkt som efterföljer rollnamnet då står efter ett eventuellt </persName>, eftersom namnkodning inte får innehålla skiljetecken. Om rollinnehavaren är grafiskt markerad anges detta med rend och lämligt värde, antingen i <persName> eller i <hi>. Ex. 1: <sp><p><persName rend="uppercase">GRETA</persName>. Men så blek du är, <persName>Pehr</persName>! Jag tror du blöder.</p></sp> Ex. 2: <sp><p><hi rend="uppercase">FLICKAN MED BÄREN</hi>. Kära du, jag har inga pengar, men här skall du få hela min korg. Är du hungrig, så ät.</p></sp> Fristående scenanvisningar som utgör ett eget stycke kodas med <stage> och ges värdet noIndent, indent, center eller right. Om texten i scenanvisningen är grafiskt markerad anges detta med <hi> runt texten. En inledande scenanvisning direkt efter en rubrik eller en rollförteckning kodas med <stage n="1"> för att kunna visas på ett annat sätt än de övriga. 103 Fristående scenanvisningar omges inte av <sp>. <p>-taggar införs innanför <stage> endast ifall anvisningen är uppdelad på två eller flera textstycken. Ex. 1: <stage rend="center">(<hi rend="italics">Barnen väsnas i trädgården.</hi>)</stage> Ex. 2: <stage rend="indent">(<persName>Rinaldo</persName> inkommer, åtföljd af <persName>Gonzalov</persName> och <persName>Mazarino</persName>.)</stage> Ex. 3: <head type="sub2">FÖRSTA ÄFVENTYRET.</head> <stage n="1"><persName>Mylly Mattis</persName> qvarn. Det är tidigt på morgonen och ännu halfmörkt. Mjölsäckar stå på golfvet och mellan säckarna en korg. <persName>Tattar Dara</persName> smyger sig in och bär på armen ett sofvande barn.</stage> Fristående regianvisningar som utgör ett eget stycke kodas på samma sätt som fristående scenanvisningar, fast med <stage type="speaker">. Ex. 1: <stage type="speaker" rend="right">(<hi rend="italics">Smyger sig bort.</hi>)</stage> Scenanvisningar som står inne i en replik kodas med <stage> om de inte hänför sig direkt till rollinnehavaren utan beskriver något som sker utanför repliken, och med <stage type="speaker"> om de är regianvisningar, alltså specificerar vad rollinnehavaren ska göra, hur han/hon ska se ut och liknande. <stage type="speaker"> kan även stå efter <speaker>, innan den egentliga repliken börjar. Ex. 1: <sp> <p><persName rend="uppercase">FRIDE</persName> <stage type="speaker">(ensam).</stage> Hu, huru illa björnen grinar! Hör hur han brummar! <stage>(Man hör björnen brumma).</stage> Nu äter han upp <persName>Frode<persName>!</p> </sp> Ex. 2: <sp> <speaker rend="center"> <persName rend="uppercase">FLORINNA</persName></speaker> <stage type="speaker">(klappar händerna.)</stage> <l>Min sköna fågel blå,</l> <l>Du till mig flyga må!</l> </sp> Melodiangivelser kodas med <stage type="melody">. Namnet på ”verk-i-verk”, oftast sånger, ges koden <head type="incorp">. Ex. 1: <sp> <speaker rend="center"> <persName rend="uppercase">LISA</persName></speaker> <stage type="speaker"> (sjunger).</stage> 104 <stage type="melody">(Mel: ”<title rend="italics">Jag helsar dig fredliga flagga</title>”.)</stage> <l>Mitt skepp far till <placeName>Spanien</placeName> med krikon</l> <l>Och kommer tillbaka med fikon,</l> <l>Och dem skall jag ge åt mitt barn,</l> <l>Min docka, som sofver i qvarn.</l> </sp> Ex. 2: <head type="incorp" rend="uppercase"> <persName>MYLLY MATTIS</persName> VISA.</head> <stage type="melody">(Mel.: ”<title rend="italics">Jag heter <persName>Papageno</persName> jag. </title>”)</stage> Ex. 3: <head type="incorp" rend="uppercase"> <persName>FLORINNAS</persName> SÅNG</head> <stage>(med ackompagnement af cittra <stage type="melody">på melodien af: ”<title>Tuoll on mun kultani</title>.”)</stage> </stage> <sp> <l>Rosorna dofta och fåglarna sjunga,</l> <l>Sommarens vindar i grenarna gunga.</l> <l>[...]</l> </sp> Rollförteckningar kodas som <castList>. De enskilda rollerna kodas med <castItem>. En rad som utgör en uppräkning av flera roller kodas med <castItem type="list">. Ifall vissa roller är grupperade tillsammans omges de av <castGroup>, som får rend="braced" om rollerna har grupperats med hjälp av en spetsparentes, tecknet }. Text som står efter spetsparentesen kodas med <head>. Också för rubriker används <head>, som då placeras innanför antingen <castList> eller <castGroup>, beroende på om rubriken gäller hela förteckningen eller en viss grupp inom den. Ex. 1: <castList> <head>Personer:</head> <castItem>Magister Bas, skollärare.</castItem> <castGroup> <head>Skolgossar, som beslutat bli röfvare, nemligen:</head> <castItem>Robert Friman..........Rinaldo Rinaldini.</castItem> <castItem>Carl Kronfelt..........Carl Moor.</castItem> <castItem>Frans Boström..........Mazarino.</castItem> </castGroup> <castItem>Länsman Black.</castItem> <castItem type="list">En bondgubbe och en bondgumma.</castItem> </castList> Ex. 2: <head>Var god mot de fattiga.</head> 105 <head type="sub">Lek i tre akter.</head> <castList> <head>Personerna:</head> <castItem>Grefvinnan.</castItem> <castGroup rend="braced"> <castItem>Axel,</castItem> <castItem>Rosina,</castItem> <head>hennes barn.</head> </castGroup> <castItem>Ma Bonne, deras gouvernante.</castItem> <castItem>Mor Brita, en fattig gumma.</castItem> </castList> Ex. 3: <castItem>Funtus i Furusund, en mjölnargosse.</castItem> Ex. 4: <castItem type="list">Gubbar, gummor och barn i kungens stad.</castItem> Ex. 5: <castItem type="list">Fyra små englar.</castItem> 8.5 Dagböcker Uppdaterad 25.4.2012 Dagböckerna kodas i de flesta hänseenden på samma sätt som andra manuskript (se avsnittet om Manuskriptbeskrivande kodning). I det praktiska arbetet med etablerandet av texten och införandet av kodning utgår vi från Paul Nybergs dagboksutgåva från 1920-talet. Den har skannats och OCR-behandlats, och sparats som TEI-filer med grundläggande kodning. Filerna kollationeras mot de ursprungliga dagböckerna. I filerna ingår kodning av pagineringen i den Nybergska utgåvan. Till dagböckernas särdrag hör chiffer, sifferkoder (för personer), piktogram samt dateringar som försetts med betydelsebärande dekorationer. Chiffret återges med vanliga bokstäver, och sifferkoderna för personer uttolkas. För chiffrets del markeras skriftens normalisering genom att den uttydda betydelsen innesluts i <reg>-taggar med type-, rend- och resp-attribut: <reg type="decoded" rend="cipher" resp="PiA">en solig vårdag</reg> Personkoderna ges <choice>-kodning med <orig> och <reg>. Piktogram, som kunnat uttolkas och i lästexten ersätts med sina motsvarigheter i ord kodas: <figure type="pictogram"><figDesc>Reuter</figDesc></figure> Piktogram vars betydelser inte kunnat fastslås (visas med symbol i den elektroniska utgåvan): <figure type="pictogram"/>. Övriga bildelement registreras i kodningen i form av tomma <figure type="illustration"/>-element. De dekorerade datumangivelsernas betydelse (de anger hurudan dagen har varit) tas upp i kommentarerna. Länkning till bilder av dateringarna och/eller manuskriptsidorna införs. De 106 dateringar som är dekorerade kan under arbetets gång markeras t.ex. med en redaktionell kommentar (<!--dekorerad med ..., står för ...-->). Datumangivelserna för varje dagboksanteckning förses med <date>-kodning med standardformat för datum. <date> står innanför <p>, och ev. veckodag kan inkluderas i <date>. Variationen ifråga om användningen av versaler och kapitäler i datumangivelserna registreras och normaliseras i <orig>-respektive <reg>-taggar, som i sin tur införs i <choice>. I den mån datumangivelserna är helt eller delvis understrukna registreras det med rend. Rubriker som Juli Månad År 1834 kodas enbart med <head> utan <date>, och även andra datum inne i den löpande texten lämnas utan datumkodning. Ett avslutande/sammanfattande motto sist i ett textavsnitt kodas med elementet <trailer>, som så att säga utgör en pendang till <head type="motto">, som endast kan förekomma i anslutning till en rubrik. Ett grafiskt markerat avslutande motto ges attributet rend och lämpligt värde. <trailer> kan också kombineras med xml:lang. Stycken som skrivits utan indrag ska i de flesta fall visas med indrag. Denna normaliseringsåtgärd kodas med <p rend="normalizedIndent">. Rubriker på titelsidor kodas som vanliga stycken, alltså med <p> i stället för <head>, men i övriga fall kodas rubriker som sådana. För fotnoter som skrivits på den löpande textens plats används vanlig fotnotskodning och place="other". Personer vars identitet inte är likgiltig men som inte omnämns med namn utan som t.ex. Magistern eller frun kodas med <rs>. För samma person införs endast en <rs>-kodning per dagboksdag, vid personens första förekomst. Ex. 1: [...] – läste <persName>Virgilius</persName> från 8 till 10 för <rs corresp="Johan Ludvig Runeberg">Magistern</rs>; kunde bäst af alla – [...]– Magistern och <persName>Krabbarne</persName> voro här inne – Endast den första förekomsten av Magistern under en dagboksdag kodas alltså med <rs>. Sofortkorrekturer kodas inte. Markeringar i marginalen (och en del inskrivna ord) som förmodligen härstammar från utgivningsarbetet på 1910- och 1920-talet beaktas inte i kodningen av händer och införs inte alls i textfilerna. Beträffande förkortningar som inte är allmänt vedertagna utan har använts för att underlätta skrivandet: se avsnittet om Manuskriptbeskrivande kodning. 8.6 Föreläsningar Uppdaterad 21.12.2011 De föreläsningar som Topelius höll vid Kejserliga Alexanders-Universitet 1854–1875 omfattar ca 3 600 manuskriptsidor fördelade på sex arkivkapslar. I kodningen är materialet uppdelat i filer som omfattar en termin. Texterna transkriberas direkt i Oxygen, och samtidigt införs manuskriptbeskrivande kodning. Följande arbetsskede inbegriper kollationering av texten, granskning av manuskriptkodningen och införande av semantisk kodning. Rättelser och 107 normaliseringar införs och kodas först i ett senare skede, efter att en redaktör har tagit ställning till vad som ska åtgärdas. Föreläsningarna förses med i stort sett samma kodning som andra manuskript (se avsnittet om manuskriptkodning). Det finns i allmänhet två pagineringar: Topelius egen samt en som införts med blyerts av annan hand. Bägge inkluderas i kodningen. Föreläsningsseriens namn kodas som verktitel, d.v.s. med <head type="title">. De enskilda föreläsningarnas namn med tillhörande datum kodas som rubriker, d.v.s. <head>. Kodning som avdelningsrubrik, d.v.s. med <head type="section">, förutsätter att texten är antingen ensam på raden, centrerad eller understruken. Eventuella understrykningar eller centreringar registreras dock inte i kodningen för någon av rubriktyperna. Topelius har ibland skrivit in t.ex. Finlands Geografi i marginalen invid föreläsningens namn, men det kan ignoreras eftersom det redan ingår i föreläsningsseriens namn. Ex. 1: <head>Tredje föreläsningen. <date when="1855-02-14">14/2 55.</head> Ex. 2: <head type="section">1. Religion.</head> Det första stycket i en föreläsning är vanligen skrivet med indrag, men för att det enligt nuvarande praxis ska kunna visas utan indrag kodas det med <p n="1">. I de fall då Topelius har skrivit första stycket utan indrag – och ingen normalisering behövs – kodas det istället med <p rend="noIndent">. Alla övriga stycken kodas enbart med <p>-taggar. Också de ganska fåtaliga stycken som inleds utan indrag kan alltså kodas med enbart <p>-taggar. Ifall ett tillägg slutar med ett skiljetecken, trots att det redan finns ett skiljetecken i den löpande texten, bortlämnas det ena skiljetecknet stillatigande: Ex. 1: Det var Finnarne <add>och Svenskarne</add>; de hade [...] Originalets text innehåller två skiljetecken efter varandra när tillägget placeras på sin plats: Det var Finnarne och Svenskarne; ; de hade [...] Dessa reduceras stillatigande till ett enda. Kodning för sofortkorrekturer införs inte i, eftersom det inte är fråga om texter av konstnärlig natur. Olika slags vertikala streck eller klamrar i marginalen kodas inte heller. De torde oftast ha införts först senare, för att t.ex. visa vilka stycken Topelius tänkt återanvända i ett annat sammanhang. Olika större parenteser eller klamrar som lagts till runt textställen återges inte heller. Ensamma symboler i marginalen eller i texten utan något bifogat tillägg ges en redaktionell kommentar. Cediljer återges enbart då de förekommer i franska ord som faktiskt stavas med cedilj, i övriga fall utelämnas de utan att ingreppet kodas. Tillägg som utgör en repetition eller sammanfattning av föreläsningens innehåll kodas med <add> eller <addSpan/> samt subtype="revision". Vanligtvis är de daterade och har infogats när Topelius återanvänt gammalt föreläsningsmaterial för en ny kurs. Datumet kodas med standardformat. I och med denna särskilda kod för repetitioner kan tilläggen sedan visas på ett annat sätt än vanliga tillägg, eftersom de inte passar in i den löpande texten. Ex. 1: <addSpan spanTo="#add4" place="leftMargin" type="noAnchor" subtype="revision"> 108 <p><hi rend="underline">Repet.</hi> <date when="1871-09-25">25/9 71.</date> Plan. Natur. Folk etc. – <hi rend="underline">Landet</hi> Daning. Refflor. Grytor.</p> <p><hi rend="underline">Jättegrytor.</hi></p> <anchor id="add4"> Tillägg som utgör stickord för innehållet på sidan kodas med <add> eller <addSpan/> samt subtype="keyword". Dessa tillägg finns främst i kapsel 244.130, där de tidvis förekommer på varje sida, oftast högst upp på sidan. De utgör inga egentliga repetitioner som tillagts åratal senare, såsom i de andra kapslarna, utan verkar ha skrivits ganska samtidigt som själva föreläsningen, så att man med en blick kan se vad som avhandlas på sidan. I och med denna särskilda kod för stickord kan tilläggen sedan visas på ett annat sätt än vanliga tillägg, eftersom de i likhet med repetitionerna inte passar så bra i den löpande texten. Huvudregeln vid avskrift av manuskript är att den interna variansen respekteras. Undantag görs enbart för förkortningar där fasta blanksteg   införs. Punkter som signalerar paus skrivs av i samma antal som författaren använt (i motsats till en tidigare, inte längre giltig standardisering till tre punkter). På motsvarande sätt skrivs streck (tankstreck) av i ursprungligt antal. Tusental normaliseras inte utan skrivs av som de står (med punkt, kommatecken eller utan). De har tidigare normaliserats till <reg>3 550</reg> med smalt hårt blanksteg, den ursprungliga formen återställs där det här påträffas. 109 9 Förteckningar 9.1 Element, attribut och attributvärden Uppdaterad 20.9.2013 I förteckningen ingår alla tillåtna kombinationer av attributvärden i samma element och attribut. Däremot upptar förteckningen inte olika kombinationer av attribut som kan förekomma i ett och samma element. Element som inte längre är i aktiv användning återges med grå kursiv stil och mindre teckenstorlek. De element, attribut och –värden som kan ingå i Headern finns i en separat förteckning (9.4) eftersom en del av elementen för närvarade inte införs i själva kodningsskedet. Element: Attribut och värde: <abbr> [inget attribut] <add> [inget attribut] <add> <add> <add> <add> <add> <add> <add> <add> <add> <add> <add> <add> <add> <add> hand="#[NN]" medium="black-ink" medium="black-inkOther" medium="blue-ink" medium="blue-pencil" medium="brown-ink" medium="brown-inkOther" medium="pencil" medium="red-ink" medium="violet-ink" place="botMargin" place="inline" place="leftMargin" place="nextPage" <add> place="other" <add> <add> <add> <add> place="previousPage" place="rightMargin" place="sublinear" place="topMargin" <add> reason="choice" Kommentar: förkortning, anv. innanför <choice> tills. med <expan> tillägg skrivet ovanför raden + anv. innanför <subst> tillägg av annan hand tillägg med svart bläck tillägg med annat svart bläck tillägg med blått bläck tillägg med blå färgpenna tillägg med brunt bläck tillägg med annat brunt bläck tillägg med blyerts tillägg med rött bläck tillägg med violett bläck tillägg skrivet nederst på sidan tillägg skrivet på raden tillägg skrivet i vänstermarginalen tillägg skrivet på följande sida flyttad text, i kombination med type="move" + tillägg skrivet där den löpande texten vanligen finns tillägg skrivet på föregående sida tillägg skrivet i högermarginalen tillägg skrivet under raden tillägg skrivet överst på sidan alternativ ovanför raden tillagt utan strykning, anv. innanför <seg type="alt"> 110 <add> subtype="keyword" <add> subtype="revision" <add> type="immediate" <add> type="immediate noAnchor" <add> type="move" <add> type="noAnchor" <address> [inget attribut] <addSpan/> <addSpan/> <addSpan/> <addSpan/> <addSpan/> <addSpan/> <addSpan/> <addSpan/> <addSpan/> <addSpan/> <addSpan/> <addSpan/> <addSpan/> <addSpan/> <addSpan/> hand="#[NN]" medium="black-ink" medium="black-inkOther" medium="blue-ink" medium="blue-pencil" medium="brown-ink" medium="brown-inkOther" medium="pencil" medium="red-ink" medium="violet-ink" [inget place-attribut] place="botMargin" place="inline" place="leftMargin" place="nextPage" <addSpan/> place="other" <addSpan/> <addSpan/> <addSpan/> <addSpan/> <addSpan/> place="previousPage" place="rightMargin" place="sublinear" place="topMargin" spanTo="#add[siffra]" <addSpan/> subtype="keyword" <addSpan/> subtype="revision" <addSpan/> type="noAnchor" föreläsningar, dagböcker: tillägg som är ett stickord för det som avhandlas föreläsningar: tillägg som är en senare repetition eller sammanfattning tillägg: sofortkorrektur oförankrat tillägg som utgör sofortkorrektur flyttad text, i kombination med place="other" oförankrat tillägg brev: adressat och adress överst i brevet tillägg av annan hand tillägg med svart bläck tillägg med annat svart bläck tillägg med blått bläck tillägg med blå färgpenna tillägg med brunt bläck tillägg med annat brunt bläck tillägg med blyerts tillägg med rött bläck tillägg med violett bläck lyrik: versrad tillagd mellan rader tillägg skrivet nederst på sidan tillägg skrivet på raden tillägg skrivet i vänstermarginalen tillägg skrivet på följande sida tillägg skrivet där den löpande texten vanligen finns tillägg skrivet på föregående sida tillägg skrivet i högermarginalen tillägg skrivet under raden tillägg skrivet överst på sidan tillagd helhet, id för <anchor/> föreläsningar, dagböcker: tillägg som är ett stickord för det som avhandlas föreläsningar: tillägg som är en senare repetition eller sammanfattning oförankrat tillägg 111 <addSpan/> type="immediate" <addSpan/> type="immediate noAnchor" <anchor/> <anchor/> id="add[siffra]" id="del[siffra]" tillägg: sofortkorrektur oförankrat tillägg som utgör sofortkorrektur <addSpan/>-tillägg slutar <delSpan/>-strykning slutar <anchor/> id="lem[siffra]" utgivarkommentar börjar <anchor/> <anchor/> <anchor/> <anchor/> <anchor/> <app> <app> <app> <app> <app> <app> <app> <app> <app> <bibl> id="pos[siffra]" id="struct[siffra]a" id="struct[siffra]b" xml:id="end[siffra]" xml:id="start[siffra]" id="var[siffra]" type="ide" type="int" type="ort" type="ort int" type="sub" type="sub int" type="sub ort" type="sub ort int" [inget attribut] <body> xml:space="preserve" <castGroup> [inget attribut] <castGroup> rend="braced" <castItem> [inget attribut] <castItem> type="list" <castList> <castList> <cell> [inget attribut] rend="indent" [inget attribut] <cell> cols="[siffra]" <cell> <cell/> <cell/> <choice> <closer> role="label" [inget attribut] rend="botBorder" [inget attribut] [inget attribut] ställe som <xref> hänvisar till strukturell avvikelse börjar strukturell avvikelse slutar lemma för punktkommentar slutar lemma för punktkommentar börjar id för textställe med variant kategorisering av varianter kategorisering av varianter kategorisering av varianter kategorisering av varianter kategorisering av varianter kategorisering av varianter kategorisering av varianter kategorisering av varianter källhänvisning (id införs senare) bevarar all whitespace när man byter till Oxygens Author-vy i rollförteckning: grupp av roller i rollförteckning: grupp av roller, markerad med } i rollförteckning: roll i rollförteckning: rad med uppräkning av flera roller rollförteckning indragen rollförteckning tabeller: vanligt fält tabeller: fält som omspänner flera kolumner tabeller: radrubrik tabeller: tomt fält tom cell med streck (kalkyler etc.) alternativa textlydelser brev: avslutande del <corr> resp="NN" utgivarens rättelse (i <choice>) <corr> source="[Rättelser]" utgivarändring enl. rättelseförteckning i originalet 112 <corr/> type="empty" <creation> [inget attribut] <date> <date> <date> <date> <date> <date> <date> <date> <date> <date> <date> <date> <date> <date> <date> <date> <date> <date> <date> from="[18XX-XX-XX]" hand="#[NN]" medium="black-ink" medium="black-inkOther" medium="blue-ink" medium="blue-pencil" medium="brown-ink" medium="brown-inkOther" medium="pencil" medium="red-ink" medium="violet-ink" [inget rend-attribut] rend="dashUnderline" rend="encircled" rend="encreasedSize" rend="italics" rend="underline" rend="underline2" to="[18XX-XX-XX]" <date> [inget when-attribut] <date> when="[18XX-XX-XX]" <dateline> [inget attribut] <dateline> <dateline> <dateline> <dateline> <dateline> <dateline> <dateline> <dateline> <dateline> <dateline> <dateline> hand="#[NN]" medium="black-ink" medium="black-inkOther" medium="blue-ink" medium="blue-pencil" medium="brown-ink" medium="brown-inkOther" medium="pencil" medium="red-ink" medium="violet-ink" rend="dashUnderline" tomt <corr>-element enl. rättelseförteckning i originalet, i kombination med source="" i kontrakt: innehåller information om textens uppkomst; i <profileDesc>, omsluter <title type="desc"> datering, tidsperiod i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" datumangivelse (i föreläsningar) understreckat (flera korta streck) inringat större handstil kursiverat understruket dubbel understrykning datering, tidsperiod datumangivelse, inget standardformat datumangivelse, standardformat: år-månad-dag fristående ms-datering med ev. tillkomstort i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" understreckat (flera korta streck) 113 <dateline> <dateline> <dateline> <dateline> <dateline> <del> <del> <del> <del> <del> <del> <del> <del> <del> <del> <del> <del> <del> <delSpan/> <delSpan/> <delSpan/> <delSpan/> <delSpan/> <delSpan/> <delSpan/> <delSpan/> <delSpan/> <delSpan/> rend="encircled" rend="encreasedSize" rend="italics" rend="underline" rend="underline2" [inget attribut] hand="#[NN]" medium="black-ink" medium="black-inkOther" medium="blue-ink" medium="blue-pencil" medium="brown-ink" medium="brown-inkOther" medium="pencil" medium="red-ink" medium="violet-ink" type="immediate" type="move" hand="#[NN]" medium="black-ink" medium="black-inkOther" medium="blue-ink" medium="blue-pencil" medium="brown-ink" medium="brown-inkOther" medium="pencil" medium="red-ink" medium="violet-ink" <delSpan/> rend="strikethrough" <delSpan/> <delSpan/> spanTo="#del[siffra]" type="immediate" <delSpan/> type="move" <distinct> <distinct> <distinct> <distinct> <distinct> <distinct> <distinct> <distinct> [inget attribut] hand="#NN" medium="black-ink" medium="black-inkOther" medium="blue-ink" medium="blue-pencil" medium="brown-ink" medium="brown-inkOther" inringat större handstil kursiverat understruket dubbel understrykning strykning + anv. innanför <subst> strykning av annan hand strykning med svart bläck strykning med annat svart bläck strykning med blått bläck strykning med blå färgpenna strykning med brunt bläck strykning med annat brunt bläck strykning med blyerts strykning med rött bläck strykning med violett bläck strykning: sofortkorrektur flyttad text strykning av annan hand strykning med svart bläck strykning med annat svart bläck strykning med blått bläck strykning med blå färgpenna strykning med brunt bläck strykning med annat brunt bläck strykning med blyerts strykning med rött bläck strykning med violett bläck lyrik: strykning av hel rad innanför omfattande strykning + strykning av en hel rad eller hel titel struken helhet, id för <anchor/> struken helhet: sofortkorrektur flyttat stycke som integreras i ett annat stycke, anv. med <add type="move" place="other"> avvikande svenska, ingen grafisk markering infört av annan hand infört med svart bläck infört med annat svart bläck infört med blått bläck infört med blå färgpenna infört med brunt bläck infört med annat brunt bläck 114 <distinct> <distinct> <distinct> <distinct> <distinct> <distinct> <distinct> <distinct> <distinct> <distinct> <distinct> <distinct> <distinct> <distinct> <distinct> <distinct> medium="pencil" medium="red-ink" medium="violet-ink" rend="bold" rend="bold expanded" rend="bold italics" rend="dashUnderline" rend="encircled" rend="encreasedSize" rend="expanded" rend="expanded italics" rend="italics" rend="romanType" rend="underline" rend="underline2" type="borr" infört med blyerts infört med rött bläck infört med violett bläck fetstil spärrad fetstil kursiverad fetstil understreckat (flera korta streck) inringat större handstil spärrat spärrat och kursiverat kursiverat antikva i frakturtext understruket dubbel understrykning lånord <div> [inget attribut] <div> id="ch[kapitlets nummer] " <div> part="f" <div> part="i" <div> title="[kapitlets namn] " <div> type="background" <div> type="chapter" <div> type="comment" <div> type="letter" <div> type="letterpart" <div> type="main" <div> type="poem" <div> <div> type="part[siffra]" xml:lang="" indelning i textpartier prosa: indelning av texten i kapitel, i komb. med type="chapter" och title="" senare brevdel, anv. med type="letterpart" tidigare brevdel, anv. med type="letterpart" prosa: indelning av texten i kapitel, i komb. med type="chapter" och id="" bakgrundstext i lyrikkommentar prosa: indelning av texten i kapitel, i komb. med title="" och id="" allmän kommentar till ett verk brev: anger att det är fråga om brev, biljett, postkort el. telegram brev: indelning av brevet i delar prosa: anger att det är fråga om en prosatext lyrik: anger att det är fråga om en dikt prosa: indelning av texten i delar text(avsnitt) på främmande språk <emph> <emph> <emph> <emph> <emph> <emph> <emph> [inget attribut] hand="#NN" medium="black-ink" medium="blue-ink" medium="blue-pencil" medium="brown-ink" medium="pencil" betoning, ingen grafisk markering infört av annan hand infört med svart bläck infört med blått bläck infört med blå färgpenna infört med brunt bläck infört med blyerts 115 <emph> <emph> <emph> <emph> <emph> <emph> <emph> <emph> <emph> <emph> <emph> <emph> <emph> medium="red-ink" medium="violet-ink" rend="bold" rend="bold expanded" rend="bold italics" rend="dashUnderline" rend="encircled" rend="encreasedSize" rend="expanded" rend="expanded italics" rend="italics" rend="underline" rend="underline2" infört med rött bläck infört med violett bläck fetstil spärrad fetstil kursiverad fetstil understreckat (flera korta streck) inringat större handstil spärrat spärrat och kursiverat kursiverat understruket dubbel understrykning <encodingDesc> [inget attribut] <expan> resp="[NN]" <figDesc> [inget attribut] <figure> type="pictogram" i <teiHeader>, inneh. variantapparatsdeklaration utskriven förkortning, i <choice> dagböcker: omsluter uttolkning av piktogram, i <figure> dagböcker: piktogram <figure/> type="bar" linje eller ornament mellan stycken <figure/> type="illustration" <figure/> type="pictogram" <fileDesc> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> [inget attribut] hand="#[NN]" medium="black-ink" medium="black-inkOther" medium="blue-ink" medium="blue-pencil" medium="brown-ink" medium="brown-inkOther" medium="pencil" medium="red-ink" medium="violet-ink" <foreign> [inget rend-attribut] <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> rend="bold" rend="bold expanded" rend="bold italics" rend="dashUnderline" rend="encircled" rend="encreasedSize" rend="expanded" rend="expanded italics" dagböcker: illustration, tomt element dagböcker: icke uttytt piktogram, tomt element ingår i <teiHeader> i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" främmande språk, ingen grafisk markering fetstil spärrad fetstil kursiverad fetstil understreckat (flera korta streck) inringat större handstil spärrat spärrat och kursiverat 116 <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <foreign> <gap/> <gap/> <gap/> <gap/> <gap/> <gap/> <gap/> <gap/> <gap/> <gap/> <gap/> rend="italics" rend="romanType" rend="romanType expanded" rend="underline" rend="underline2" rend="uppercase" xml:lang="ang" xml:lang="cel" xml:lang="ara" xml:lang="dan" xml:lang="eng" xml:lang="est" xml:lang="fin" xml:lang="fre" xml:lang="ger" xml:lang="gre" xml:lang="heb" xml:lang="ita" xml:lang="lap" xml:lang="lat" xml:lang="nor" xml:lang="oic" xml:lang="rus" xml:lang="spa" xml:lang="tib" extent="[siffra]" hand="#[NN]" medium="black-ink" medium="black-inkOther" medium="blue-ink" medium="blue-pencil" medium="brown-ink" medium="brown-inkOther" medium="pencil" medium="red-ink" medium="violet-ink" <gap/> reason="binding" <gap/> <gap/> <gap/> reason="damage" reason="endline" reason="erased" <gap/> reason="faded" kursiverat antikva i frakturtext spärrad antikva i frakturtext understruket dubbel understrykning versaler/kapitäler fornengelska keltiska arabiska danska engelska estniska finska franska tyska grekiska hebreiska italienska samiska latin norska fornisländska ryska spanska tibetanska oläsligt, omfattning i komb. med reason="overstrike" i komb. med reason="overstrike" i komb. med reason="overstrike" i komb. med reason="overstrike" i komb. med reason="overstrike" i komb. med reason="overstrike" i komb. med reason="overstrike" i komb. med reason="overstrike" i komb. med reason="overstrike" i komb. med reason="overstrike" oläsl. p.g.a. inbindning el. beskärning vid inbindning oläsl. p.g.a. skada oläsl. p.g.a. att raden tagit slut oläsl. p.g.a. utsuddning oläsl. p.g.a. att bläcket är svagt och avmattat, håller på att ta slut 117 <gap/> <gap/> <gap/> reason="glue" reason="ink" reason="overstrike" <gap/> reason="overwritten" <gap/> reason="seal" <gap/> reason="smudge" <gap/> <gap/> reason="stamp" reason="writing" <gap/> type="immediate" <gap/> <gap/> <gap/> unit="letters" unit="lines" unit="words" <handNote> id="[NN]" <handNote> <handNote> <handNote> <handNote> <handNote> <handNote> <handNote> <handNote> <handNote> <handNote> <handNote> medium="black-ink" medium="black-inkOther" medium="blue-ink" medium="blue-pencil" medium="brown-ink" medium="brown-inkOther" medium="copy" medium="pencil" medium="red-ink" medium="typescript" medium="violet-ink" <handNotes> [inget attribut] <handShift/> <handShift/> <handShift/> <handShift/> <handShift/> <handShift/> <handShift/> <handShift/> <handShift/> <handShift/> medium="black-ink" medium="black-inkOther" medium="blue-ink" medium="blue-pencil" medium="brown-ink" medium="brown-inkOther" medium="pencil" medium="red-ink" medium="violet-ink" new="#[NN]" <head> [inget attribut] oläsl. p.g.a. överlimning/tejp oläsl. p.g.a. bläckplump oläsl. p.g.a. strykning oläsl. p.g.a. att något skrivits ovanpå ifrågavarande ställe oläsl. p.g.a. sigill oläsl. p.g.a. avsvärtning, utflutet bläck oläsl. p.g.a. frimärke oläsl. p.g.a. handstil sofortkorrektur: endast i komb. med reason="overstrike" tills. med extent="": tecken tills. med extent="": rader tills. med extent="": ord i <handNotes> i <teiHeader>, beskrivning av enskild hand penna som handen använt penna som handen använt penna som handen använt penna som handen använt penna som handen använt penna som handen använt ms är en (foto)kopia penna som handen använt penna som handen använt ms är en maskinskriven avskrift penna som handen använt i <teiHeader>, innehåller <handNote> ny penna: svart bläck ny penna: annat svart bläck ny penna: blått bläck ny penna: blå färgpenna ny penna: brunt bläck ny penna: annat brunt bläck ny penna: blyerts ny penna: rött bläck ny penna: violett bläck ny hand kapitelrubrik, dikttitel, brevrubrik, strofrubrik, listrubrik el. tabellrubrik 118 <head> <head> <head> <head> <head> <head> <head> <head> <head> <head> <head> <head> <head> <head> <head> <head> <head> <head> <head> <head> <head> <head> <head> <head> <head> <head> hand="#[NN]" medium="black-ink" medium="black-inkOther" medium="blue-ink" medium="blue-pencil" medium="brown-ink" medium="brown-inkOther" medium="pencil" medium="red-ink" medium="violet-ink" rend="bold" rend="bold expanded" rend="bold italics" rend="dashUnderline" rend="encircled" rend="encreasedSize" rend="expanded" rend="expanded italics" rend="italics" rend="romanType" rend="romanType expanded" rend="underline" rend="underline2" rend="uppercase" type="incorp" type="letter" <head> type="motto" <head> <head> <head> <head> <head> <head> <head> <hi> <hi> <hi> <hi> <hi> <hi> <hi> <hi> type="section" type="section2" type="section3" type="sub" type="sub2" type="sub3" type="title" hand="#[NN]" medium="black-ink" medium="black-inkOther" medium="blue-ink" medium="blue-pencil" medium="brown-ink" medium="brown-inkOther" medium="pencil" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" fetstil spärrad fetstil kursiverad fetstil understreckat (flera korta streck) inringat större handstil spärrat spärrat och kursiverat kursiverat antikva i frakturtext spärrad antikva i frakturtext understruket dubbel understrykning versaler/kapitäler rubrik för ”verk-i-verk” rubrik i brev motto/citat i anslutning till rubrik/dikttitel avdelningsrubrik avdelningsrubrik avdelningsrubrik underrubrik underrubrik underrubrik verktitel (ej för omnämnda titlar!) i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" 119 <hi> <hi> medium="red-ink" medium="violet-ink" <hi> rend="bold" <hi> <hi> <hi> <hi> <hi> <hi> <hi> <hi> <hi> <hi> <hi> <hi> <hi> <hi> <hi> <item> rend="bold expanded" rend="bold italics" rend="dashUnderline" rend="encircled" rend="encreasedSize" rend="expanded" rend="expanded italics" rend="italics" rend="raised" rend="sub" rend="romanType" rend="romanType expanded" rend="underline" rend="underline2" rend="uppercase" [inget attribut] <item> n="[siffra]" <item> type="between" <l> [inget attribut] <l> n="[siffra]" <l> part="y" <l> part="I" <l> part="M" <l> part="F" <l> <l> <l> <lb/> <lem> rend="center" rend="indent" xml:lang="" [inget attribut] [inget attribut] i komb. med rend="" i komb. med rend="" fetstil OBS: för grafiska markeringar används rend också direkt i vissa element! spärrad fetstil kursiverad fetstil understreckat (flera korta streck) inringat större handstil spärrat spärrat och kursiverat kursiverat upphöjd text nedsänkt text antikva i frakturtext spärrad antikva i frakturtext understruket dubbel understrykning versaler/kapitäler punkt i lista ändrad ordningsföljd, anv. i <switchPos> text mellan ord som byter plats, i kombination med n="1b" versrad lyrik: används i <switchPos> (och utan <switchPos> ifall numreringens betydelse är oklar) + automatiskt införd radnumrering för etablerad text oavslutad versrad inledande delen av en versrad som fördelats på två el. tre rader mittersta delen av en versrad som fördelats på tre rader avslutande delen av en versrad som fördelats på två el. tre rader centrerad versrad indragen versrad versrad på främmande språk radbrytning variantställe i grundtexten 120 <lem/> <lg> type="empty" [inget attribut] <lg> n="[siffra]" <lg> <lg> <list> <list> part="y" xml:lang="" [inget attribut] rend="indent" <list> xml:lang="xxx" <milestone/> type="bar" <milestone/> type="smallBar" <milestone/> unit="part" <milestone/> when="[18XX-XX-XX]" <name> [inget attribut] <note> anchored="false" <note> anchored="true" <note> hand="#[NN]" tomt lemma strof används i <switchPos> (och utan <switchPos> ifall numreringens betydelse är oklar) ofullständig strof strof på främmande språk lista indragen lista Lista på främmande språk; attributvärden: se <foreign> skiljelinje eller avlångt ornament som markerar avsnitt brev: skiljelinje som understryker avstånd mellan stycken avsnitt börjar (t.ex. följetong i HT) datering av avsnitt (t.ex. följetong i HT), standardformat: år-månaddag, i komb. med unit="part" i teiHeaderns <respStmt> oförankrad not, inget hänvisningstecken nothänvisning (t.ex. asterisk) finns i texten not införd av annan hand <note> id="en[siffra]" id för utgivarkommentar <note> <note> <note> <note> <note> <note> <note> <note> <note> <note> id="ftn[siffra]" medium="black-ink" medium="black-inkOther" medium="blue-ink" medium="blue-pencil" medium="brown-ink" medium="brown-inkOther" medium="pencil" medium="red-ink" medium="violet-ink" <note> n="" <note> place="aboveLine" id för not som tillhör originalet not införd med svart bläck not införd med annat svart bläck not införd med blått bläck not införd med blå färgpenna not införd med brunt bläck not införd med annat brunt bläck not införd med blyerts not införd med rött bläck not införd med violett bläck fotnotshänvisningstecken (t.ex. siffra, asterisk) kommentar ovanför raden <note> place="botMargin" not placerad nederst på sidan <note> <note> <note> place="end" place="foot" place="leftMargin" slutnot (efter texten) fotnot (nederst på sidan) not placerad i vänstermarginalen 121 <note> place="other" <note> <note> place="rightMargin" place="topMargin" not placerad där den löpande texten vanligen finns not placerad i högermarginalen not placerad överst på sidan <note> <note> <note> resp="[NN]" target="#lem[siffra]" type="editor" ansvarig för utgivarkommentar utgivarkommentar: hänv. till id i <anchor/> utgivarkommentar <opener> [inget attribut] brev: inledande del <orgName> <orgName> <orgName> <orgName> <orgName> <orgName> <orgName> <orgName> <orgName> <orgName> <orgName> <orgName> <orgName> <orgName> <orgName> <orgName> <orgName> <orgName> <orgName> <orgName> <orgName> [inget attribut] hand="#NN" medium="black-ink" medium="blue-ink" medium="blue-pencil" medium="brown-ink" medium="pencil" medium="red-ink" medium="violet-ink" rend="bold" rend="bold expanded" rend="bold italics" rend="dashUnderline" rend="encircled" rend="encreasedSize" rend="expanded" rend="expanded italics" rend="italics" rend="underline" rend="underline2" xml:lang="" institutionsnamn, ingen grafisk markering institutionsnamn infört av annan hand infört med svart bläck infört med blått bläck infört med blå färgpenna infört med brunt bläck infört med blyerts infört med rött bläck infört med violett bläck fetstil spärrad fetstil kursiverad fetstil understreckat (flera korta streck) inringat större handstil spärrat spärrat och kursiverat kursiverat understruket dubbel understrykning institutionsnamn på främmande språk <orig> [inget attribut] <orig/> type="empty" <p> [inget attribut] <p> n="[siffra]" <p> n="1" <p> rend="center" används i <choice> i samband med utgivarens ändringar samt för personkoder i dagböckerna tomt <orig>-element i <choice> indraget textstycke + anv. i <teiHeader> används i <switchPos>, ändrad ordningsföljd indraget första stycke i kapitel eller avsnitt, ska visas utan indrag som en normaliseringsåtgärd centrerat textstycke <p> rend="dialogue" replik med replikstreck i prosatext <p> rend="noIndent" <p> rend="normalizedIndent" textstycke utan indrag textstycke utan indrag, ska visas med indrag som en normaliseringsåtgärd 122 <p> rend="parIndent" <p> <p> <pb/> <pb/> <pb/> <pb/> rend="right" xml:lang="" [inget attribut] [inget n-attribut] n="[sidnummer]" type="author" <pb/> type="author unwritten" <pb/> <pb/> <pb/> type="orig" type="orig unprinted" type="other" <pb/> type="other unwritten" <pb/> type="other2" <pb/> type="other2 unwritten" <pb/> type="ZTS" <pb/> type="ZTS unprinted" <persName> [inget attribut] <persName> corresp="" <persName> correspUncert="Y" <persName> <persName> <persName> <persName> <persName> <persName> <persName> <persName> <persName> <persName> <persName> <persName> <persName> <persName> hand="#[NN]" medium="black-ink" medium="black-inkOther" medium="blue-ink" medium="blue-pencil" medium="brown-ink" medium="brown-inkOther" medium="pencil" medium="red-ink" medium="violet-ink" rend="bold" rend="bold expanded" rend="bold italics" rend="dashUnderline" textstycke som är indraget i sin helhet (t.ex. blockcitat) högerställt textstycke textstycke på främmande språk brev: sidbrytning sidan obeaktad vid paginering sidnummer ms: förf:s sidnr ms: outskrivet sidnr i förf:s paginering sidnr i tryckt grundtext outskrivet sidnr i tryckt grundtext ms: sidnr som införts senare ms: outskrivet sidnr i senare införd paginering ms: sidnr vid dubbel paginering av annan hand ms: outskr. sidnr vid dubbel paginering av annan hand sidnr i den tryckta versionen av ZTS outskrivet sidnr i den tryckta versionen av ZTS personnamn, ingen grafisk markering brev: ofullständiga namn + id:n som införs med TEI Id Selector osäkerhet att corresp länkar till rätt person i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" fetstil spärrad fetstil kursiverad fetstil understreckat (flera korta streck) 123 <persName> <persName> <persName> <persName> <persName> <persName> <persName> <persName> <persName> <persName> <persName> rend="encircled" rend="encreasedSize" rend="expanded" rend="expanded italics" rend="italics" rend="romanType" rend="romanType expanded" rend="underline" rend="underline2" rend="uppercase" xml:lang="" <placeName> [inget attribut] <placeName> corresp="pl[siffra]" <placeName> correspUncert="Y" <placeName> <placeName> <placeName> <placeName> <placeName> <placeName> <placeName> <placeName> <placeName> <placeName> <placeName> <placeName> <placeName> <placeName> <placeName> <placeName> <placeName> <placeName> <placeName> <placeName> <placeName> <placeName> <placeName> <placeName> hand="#[NN]" medium="black-ink" medium="black-inkOther" medium="blue-ink" medium="blue-pencil" medium="brown-ink" medium="brown-inkOther" medium="pencil" medium="red-ink" medium="violet-ink" rend="bold" rend="bold expanded" rend="bold italics" rend="dashUnderline" rend="encircled" rend="encreasedSize" rend="expanded" rend="expanded italics" rend="italics" rend="romanType" rend="romanType expanded" rend="underline" rend="underline2" rend="uppercase" <placeName> xml:lang="" <postscript> [inget attribut] inringat större handstil spärrat spärrat och kursiverat kursiverat antikva i frakturtext spärrad antikva i frakturtext understruket dubbel understrykning versaler/kapitäler personnamn på främmande språk geografiskt namn, ingen grafisk markering id:n som införs med TEI Id Selector osäkerhet att corresp länkar till rätt plats i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" fetstil spärrad fetstil kursiverad fetstil understreckat (flera korta streck) inringat större handstil spärrat spärrat och kursiverat kursiverat antikva i frakturtext spärrad antikva i frakturtext understruket dubbel understrykning versaler/kapitäler geografiskt namn på främmande språk brevkodning: PS 124 <print> [inget attribut] <profileDesc> [inget attribut] <publicationStmt> <publisher> <rdg> <rdg/> <reg> [inget attribut] [inget attribut] [inget attribut] type="empty" [inget attribut] <reg> rend="cipher" <reg> resp="[NN]" <reg> type="decoded" <reg/> type="empty" <resp> [inget attribut] <respStmt> [inget attribut] <restore> <restore> <restore> <restore> <restore> <restore> <restore> <restore> <restore> <restore> <restore> [inget attribut] hand="#[NN]" medium="black-ink" medium="black-inkOther" medium="blue-ink" medium="blue-pencil" medium="brown-ink" medium="brown-inkOther" medium="pencil" medium="red-ink" medium="violet-ink" <restore> type="immediate" <row> <row> [inget attribut] role="label" <rs> [inget attribut] brevkodning: tryckt text i <teiHeader>, innesluter <handNotes> i <teiHeader> i <publicationStmt> i <teiHeader> variantställe i varianttexten tom variant normalisering: enkel kodning dagböcker: chiffer som uttytts, tillsammans med type=”decoded” och resp=”NnN” anv. i <choice> för utgivarens ändringar + dagböcker: personkoder som uttytts (i komb. med orig i <choice>) + chiffer som uttytts dagböcker: chiffer som uttytts, tillsammans med rend=”cipher” resp=”NnN” tomt <reg>-element, i <choice> eller för enkel kodning i <teiHeader> i <teiHeader>, innehåller <resp> och <name> först struket, sedan återtaget återtagning av annan hand återtagning med svart bläck återtagning med annat svart bläck återtagning med blått bläck återtagning med blå färgpenna återtagning med brunt bläck återtagning med annat brunt bläck återtagning med blyerts återtagning med rött bläck återtagning med violett bläck sofortkorrektur (omedelbar strykning och återtagning) tabeller: vanlig rad tabeller: rad med kolumnrubriker brev, dagböcker: person som inte nämns vid namn och vars identitet inte är likgiltig, men för tillfället okänd 125 brev, dagböcker: personer som inte nämns vid namn brev, dagböcker: personer som omnämns utan namn men med en beteckning på främmande språk brev: inledande/avslutande hälsning variant-i-variant omsluter båda alternativ när ett alternativ skrivits ovanför raden <rs> corresp="" <rs> xml:lang="" <salute> [inget attribut] <seg> [inget attribut] <seg> type="alt" <sic> [inget attribut] fel i grundtext (anv. i <choice>) <signed> <sourceDesc> [inget attribut] [inget attribut] <sp> [inget attribut] <space/> <space/> <space/> <space/> extent="[siffra]" unit="letters" unit="lines" unit="words" <speaker> rend="center" <speaker> rend="indent" <speaker> rend="noIndent" <stage> <stage> <stage> <stage> [inget attribut] n="1" rend="center" rend="indent" brev och lyrik-ms: underskrift i <teiHeader> dramareplik (inklusive replikinnehavaren) omotiverat tomrum, omfattning tills. med extent="": tecken tills. med extent="": rader tills. med extent="": ord dramatik: rollinnehavare på egen rad, namnet centrerat dramatik: rollinnehavare på egen rad, namnet indraget dramatik: rollinnehavare på egen rad, namnet utan indrag dramatik: scenanvisning inledande scenanvisning centrerad scenanvisning scenanvisning med indrag <stage> rend=”italics” kursiverad scenanvisning <stage> <stage> <stage> <stage> <stamp> rend="noIndent" rend="right" type="melody" type="speaker" [inget attribut] <subst> [inget attribut] <subst> <subst> <subst> <subst> hand="#[NN]" medium="black-ink" medium="black-inkOther" medium="blue-ink" scenanvisning utan indrag högerställd scenanvisning melodiangivelse regianvisning till rollinnehavare brev: stämpel ersättning genom påskrivning OBS: om det ersatta kan tydas används <del> och <add> inne i <subst>! ersättning av annan hand ersättning med svart bläck ersättning med annat svart bläck ersättning med blått bläck 126 <subst> <subst> <subst> <subst> <subst> <subst> <subst> medium="blue-pencil" medium="brown-ink" medium="brown-inkOther" medium="pencil" medium="red-ink" medium="violet-ink" type="immediate" <supplied> [inget reason-attribut] <supplied> reason="binding" <supplied> reason="damage" <supplied> reason="endline" <supplied> reason="erased" <supplied> reason="faded" <supplied> reason="glue" <supplied> reason="ink" <supplied> reason="overstrike" <supplied> reason="overwritten" <supplied> reason="seal" <supplied> reason="smudge" <supplied> reason="stamp" <supplied> reason="writing" <supplied> resp="[NN]" <supplied> source="" ersättning med blå färgpenna ersättning med brunt bläck ersättning med annat brunt bläck ersättning med blyerts ersättning med rött bläck ersättning med violett bläck ersättning: sofortkorrektur komplettering, helt ord eller fristående skiljetecken som saknats från början kompl. med ord el. tecken p.g.a. inbindning el. beskärning vid inbindning kompl. med ord el. tecken p.g.a. skada kompl. med ord el. tecken p.g.a. att raden tagit slut kompl. med ord el. tecken p.g.a. utsuddning kompl. med ord el. tecken p.g.a. att bläcket är svagt och avmattat, håller på att ta slut kompl. med ord el. tecken p.g.a. överlimning/tejp kompl. med ord el. tecken p.g.a. bläckplump kompl. med ord el. tecken p.g.a. strykning kompl. med ord el. tecken p.g.a. att något skrivits ovanpå ifrågavarande ställe kompl. med ord el. tecken p.g.a. sigill kompl. med ord el. tecken p.g.a. avsvärtning, utflutet bläck kompl. med ord el. tecken p.g.a. frimärke kompl. med ord el. tecken p.g.a. handstil ansv. för komplettering + ansv. för emendation källa för emendation 127 <switchPos> [inget attribut] <switchPos> <switchPos> hand="#[NN]" medium="black-ink" <switchPos> medium="black-inkOther" <switchPos> <switchPos> <switchPos> medium="blue-ink" medium="blue-pencil" medium="brown-ink" <switchPos> medium="brown-inkOther" <switchPos> <switchPos> <switchPos> <switchPos> <switchPos> <table> <table> <table> <table> <TEI> medium="pencil" medium="red-ink" medium="violet-ink" type="immediate" type="immediate unnumbered" type="unnumbered" cols="[siffra]" [inget rend-attribut] rend="noBorder" rows="[siffra]" xmlns="" <TEI> xmlns:xsi="" <TEI> xsi:schemaLocation="" <TEI.2> xmnls="" <teiHeader> <text> [inget attribut] [inget attribut] <switchPos> <title> <title> <title> <title> <title> <title> <title> <title> ändrad ordningsföljd, innehåller två eller flera <item>-element ordn.följden ändrad av annan hand följden ändrad med svart bläck följden ändrad med annat svart bläck följden ändrad med blått bläck följden ändrad med blå färgpenna följden ändrad med brunt bläck följden ändrad med annat brunt bläck följden ändrad med blyerts följden ändrad med rött bläck följden ändrad med violett bläck ändrad ordn. följd: sofortkorrektur ändrad ordn.följd: sofortkorrektur + ej numrering ändrad ordn.följd: ej numrering tabeller: antal kolumner tabell med linjer runt fälten tabell utan linjer runt fälten antal rader i tabellen TEI-fil, namespace TEI-fil, schema instance namespace TEI-fil, namespace och plats för schemat ZTS:s TEI-filer, namespace info om TEI-filen och innehållet innesluter <body> omnämnd verktitel, ingen grafisk markering + i teiHeaderns [inget attribut] <titleStmt>: manuskriptsignum för lyrik, brevsignum kopplar ihop med post i corresp="tw[siffra]"/"tu[siffra]" verkdatabasen osäkerhet att corresp länkar till rätt correspUncert="Y" titel hand="#[NN]" i komb. med rend="" medium="black-ink" i komb. med rend="" medium="black-inkOther" i komb. med rend="" medium="blue-ink" i komb. med rend="" medium="blue-pencil" i komb. med rend="" 128 <title> <title> <title> <title> <title> <title> <title> <title> <title> <title> <title> <title> <title> <title> <title> <title> <title> <title> <title> medium="brown-ink" medium="brown-inkOther" medium="pencil" medium="red-ink" medium="violet-ink" rend="bold" rend="bold expanded" rend="bold italics" rend="dashUnderline" rend="encircled" rend="encreasedSize" rend="expanded" rend="expanded italics" rend="italics" rend="romanType" rend="romanType expanded" rend="underline" rend="underline2" rend="uppercase" <title> type="desc" <title> <titleStmt> xml:lang="" [inget attribut] <trailer> [inget attribut] <trailer> <trailer> <trailer> rend="dashUnderline" rend="underline" rend="underline2" <trailer> xml:lang="" <unclear> hand="#[NN]" <unclear> <unclear> <unclear> <unclear> <unclear> <unclear> <unclear> <unclear> <unclear> medium="black-ink" medium="black-inkOther" medium="blue-ink" medium="blue-pencil" medium="brown-ink" medium="brown-inkOther" medium="pencil" medium="red-ink" medium="violet-ink" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" i komb. med rend="" fetstil spärrad fetstil kursiverad fetstil understreckat (flera korta streck) inringat större handstil spärrat spärrat och kursiverat kursiverat antikva i frakturtext spärrad antikva i frakturtext understruket dubbel understrykning versaler/kapitäler i kontrakt: innehåller överskrift; finns i <creation> i <profileDesc> verktitel på främmande språk i <teiHeader>, innehåller <title> dagböcker: avslutande/sammanfattande motto sist i ett textavsnitt understreckat (flera korta streck) understruket dubbel understrykning avslutande motto på främmande språk i komb. med reason="overstrike": svårtytt p.g.a. strykning av annan hand i komb. med reason="overstrike" i komb. med reason="overstrike" i komb. med reason="overstrike" i komb. med reason="overstrike" i komb. med reason="overstrike" i komb. med reason="overstrike" i komb. med reason="overstrike" i komb. med reason="overstrike" i komb. med reason="overstrike" 129 <unclear> reason="binding" <unclear> <unclear> <unclear> reason="damage" reason="endline" reason="erased" <unclear> reason="faded" <unclear> <unclear> <unclear> reason="glue" reason="ink" reason="overstrike" <unclear> reason="overwritten" <unclear> reason="seal" <unclear> reason="smudge" <unclear> <unclear> <unclear> reason="stamp" reason="writing" resp="[NN]" <unclear> type="immediate" <variantEncoding/> location="internal" <variantEncoding/> <xptr/> method="parallelsegmentation" target="[verkets id positionen däri]" <xptr/> type="illustration" <xptr/> type="variant" <xref> target="[verkets positionen däri]" <xref> type="comment" <xref> type="ext" <xref> type="introduction" id svårtytt p.g.a. inbindning el. beskärning vid inbindning svårtytt p.g.a. skada svårtytt p.g.a. att raden tagit slut svårtytt p.g.a. utsuddning svårtytt p.g.a. att bläcket är svagt och avmattat, håller på att ta slut svårtytt p.g.a. överlimning/tejp svårtytt p.g.a. bläckplump svårtytt p.g.a. strykning svårtytt p.g.a. att något skrivits ovanpå ifrågavarande ställe svårtytt p.g.a. sigill svårtytt p.g.a. avsvärtning, utflutet bläck svårtytt p.g.a. frimärke svårtytt p.g.a. handstil ansvarig för uttydningen sofortkorrektur: endast i komb. med reason="overstrike" varianternas placering, införs i <encodingDesc> i <teiHeader> variantkodningsmetod, införs i <encodingDesc> i <teiHeader> samt hänvisar till en bild eller en text, i komb. med type="" hänvisar till en bild, visas som en symbol, i komb. med target="" hänvisar till ett stycke i en varianttext, visas som en symbol, i komb. med target="" samt omsluter en länk som hänvisar till en annan text, i komb. med type="" omsluter en länk som hänvisar till en kommentartext, i komb. med target="" omsluter en länk som hänvisar till en extern webbsida, i komb. med target="[webbadress]" omsluter en länk som hänvisar till en inledning, i komb. med target="" 130 <xref> type="pdf" <xref> type="readingtext" omsluter en länk som hänvisar till en PDF, i komb. med target="[PDF:ens namn]" omsluter en länk som hänvisar till en lästext, i komb. med target="" 131 9.2 Specialtecken (entiteter) Uppdaterad 20.9.2013 Förbjudna tecken Namn Visn. Unicode-nr Unicode-definition Anmärkning amp & & ampersand et-tecken lt < < less-than sign mindre än gt > > greater-than sign större än apos ' ' apostrofe rak apostrof quot " " quotation mark rakt citattecken Använd entitetsnamnet och inte Unicode-numret när dessa tecken införs. Som vanliga citattecken används dock inte de raka citattecknen ' och " utan de typografiska ’ och ”. Se Kodning av allmänna textuella företeelser, avsnitt 2.4. Specialtecken som införs som tecken Namn Visn. Unicode-nr Unicode-definition aacute á á latin small letter a with acute Aacute Á Á latin capital letter a with acute aelig æ æ latin small letter ae AElig Æ Æ latin capital letter ae agrave à à latin small letter a with grave Agrave À À latin capital letter a with grave ast * ∗ asterisk operator ccedil ç ç latin small letter c with cedilla Ccedil Ç Ç latin capital letter c with cedilla copy © © copyright sign dagger † † ddagger ‡ ‡ dash − – dagger (obelisk, obelus, long cross) double dagger (diesis, double obelisk) en dash Anmärkningar korstecken, general punctuation dubbelt korstecken tankstreck, general punctuation 132 deg ° ° degree sign upprepningstecken, cjk symbols and punctuation ditto 〃 〃 ditto mark eacute é é latin small letter e with acute Eacute É É latin capital letter e with acute ecirc ê ê latin small letter e with circumflex egrave è è latin small letter e with grave equals = = equals sign euml ë ë latin small letter e with diaeresis fracslash ⁄ ⁄ fraction slash general punctuation frac12 ½ ½ vulgar fraction one half ett halvt frac13 ⅓ ⅓ vulgar fraction one third number forms frac14 ¼ ¼ vulgar fraction one quarter frac18 ⅛ ⅛ vulgar fraction one eighth åttondelar frac23 ⅔ ⅔ vulgar fraction two thirds number forms frac34 ¾ ¾ vulgar fraction three quarters frac38 ⅜ ⅜ vulgar fraction three eighths frac58 ⅝ ⅝ vulgar fraction five eighths frac78 ⅞ ⅞ vulgar fraction seven eighths hellip … … horizontal ellipsis uteslutn. tecken lcub { { left curly bracket spetsparentes/ klammerparentes lsqb [ [ left square bracket hakparentes minus sign − − minus sign minustecken num # # number sign brädgårdstecken ocirc ô ô latin small letter o with circumflex oelig œ œ latin small ligature oe Ω Ω greek capital letter omega likhetstecken number forms 133 oslash ø ø latin small letter o with stroke Oslash Ø Ø latin capital letter o with stroke ő ő latin small letter o double acute percnt % % percent sign pound £ £ pound sign rcub } } right curly bracket spetsparentes/ klammerparentes raquo » » right-pointing double angle quotation mark gåsögon rdquo ” ” right double quotation mark citattecken rsqb ] D; right square bracket hakparentes rsquo ’ ’ right single quotation mark enkelt citatt. / apostrof sect § § section sign lagparagraf sol / / solidus snedstreck ZTS:s tecken för valutan skilling, IPA extensions [skilling] ʄ ʄ latin small letter dotless j with stroke and hook szlig ß ß latin small letter sharp s sup1 ¹ ¹ superscript one etta i upphöjt läge sup2 ² ² superscript two tvåa i upphöjt läge sup3 ³ ³ superscript three trea i upphöjt läge times × × multiplication sign uuml ü ü latin small letter u with diaeresis Specialtecken som anges med numerisk entitetsreferens fracn1 ⅟ ⅟ fraction numerator one number forms frac15 ⅕ ⅕ vulgar fraction one fifth femtedelar frac25 ⅖ ⅖ vulgar fraction two fifths number forms frac35 ⅗ ⅗ vulgar fraction three fifths frac45 ⅘ ⅘ vulgar fraction four fifths 134 frac16 ⅙ ⅙ vulgar fraction one sixth frac56 ⅚ ⅚ vulgar fraction five sixths ⎧ left curly bracket upper hook ⎨ left curly bracket middle piece ⎩ left curly bracket lower hook ⎰ upper left or lower right curly bracket L℔ [versalt L + ent. ref. för skålpund] lispund nbsp   no-break space hårt blanksteg nnbsp   narrow no-break space ℔ l b bar symbol ⎫ right curly bracket upper hook ⎬ right curly bracket middle piece ⎭ right curly bracket lower hook right moustache ⎱ upper right or lower left curly bracket space   space left curly bracket left curly bracket left curly bracket left moustache [lispund] pounds L℔ ℔ right curly bracket right curly bracket right curly bracket sub0 ₀ ₀ subscript zero sub1 ₁ ₁ subscript one sub2 ₂ ₂ subscript two i tredelad klammerparentes i tredelad klammerparentes i tredelad klammerparentes tvådelad klammerparentes: övre vänstra eller nedre högra halvan smalt hårt blanksteg skålpund, finns i "letterlike symbols" i tredelad klammerparentes i tredelad klammerparentes i tredelad klammerparentes tvådelad klammerparentes: övre högra eller nedre vänstra halvan endast om flera blanksteg, och om man inte kan använda <space>kodn. siffror i nedsänkt läge superscripts and subscripts 135 sub3 ₃ ₃ subscript three sub4 ₄ ₄ subscript four sub5 ₅ ₅ subscript five sub6 ₆ ₆ subscript six sub7 ₇ ₇ subscript seven sub8 ₈ ₈ subscript eight sub9 ₉ ₉ subscript nine sup0 ⁰ ⁰ superscript zero sup4 ⁴ ⁴ superscript four sup5 ⁵ ⁵ superscript five sup6 ⁶ ⁶ superscript six sup7 ⁷ ⁷ superscript seven sup8 ⁸ ⁸ superscript eight sup9 ⁹ ⁹ superscript nine white square □ □ white square siffror i upphöjt läge sup1, 2 och 3 kan införas som sådana geometric shapes 136 9.3 TEI-moduler Uppdaterad 3.9.2012 Modul: analysis certainty core corpus dictionaries drama figures gaiji header iso-fs linking msdescription namesdates nets spoken tagdocs textcrit textstructure transcr verse Element som inte ingår i TEI Ibruktagna element: <abbr> <add> <address> <bibl> <choice> <corr> <date> <del> <distinct> <emph> <expan> <foreign> <gap> <head> <hi> <item> <l> <lb/> <lg> <list> <milestone/> <name> <note> <orig> <p> <pb/> <publisher> <reg> <resp> <respStmt> <rs> <sic> <sp> <speaker> <stage> <title> <unclear> <castGroup> <castItem> <castList> <cell> <figure> <row> <table> <catRef> <creation> <encodingDesc> <fileDesc> <handNote> <profileDesc> <publicationStmt> <sourceDesc> <teiHeader> <textClass> <titleStmt> <anchor/> <seg> <idNo> <origDate> <stamp> <orgName> <persName> <placeName> <app> <lem> <rdg> <variantEncoding/> <body> <closer> <dateline> <div> <opener> <postscript> <salute> <signed> <TEI> <text> <trailer> <addSpan/> <delSpan/> <handNotes> <handShift/> <restore> <space/> <subst> <supplied> <print> <switchPos> <TEI.2> <xptr/> <xref> 9.4 Element i TEI Header Uppdaterad 20.9.2013 Förteckningen nedan omfattar TEI Headerns element. Element <catRef> Attribut och -värden [inget attribut] <creation> [inget attribut] Kommentar i <textClass>; anger textens genre/texttyp 137 <encodingDesc> [inget attribut] <fileDesc> [inget attribut] <handNote> <handNote> <handNotes> medium=”[penna]” id=”[#NN]” <idNo> [inget attribut] <idNo> type=”collection” <idNo> type=”group” <name> [inget attribut] <origDate> [inget attribut] <persName> <persName> <placeName> <placeName> <profileDesc> <publicationStmt> type=”sender” type=”addressee” type=”sender” type=”addressee” <publisher> [inget attribut] <resp> [inget attribut] [inget attribut] <respStmt> <sourceDesc> [inget attribut] <TEI> <TEI> xmlns="" xmlns:xsi="" variantkodningsfiler: innehåller variantapparatsdeklaration, <variantEncoding/> alla genrer: minimum för Header handskrifter: anger penna brevr: anger hand handskrifter; omger ett eller flera <handNote> refererar till id i MySQLdatabasen som styr Zte brev: innehåller id till en delutgåva (i MySQL-databas) brev: innehåller id till en korrespondens (i MySQLdatabas) i teiHeaderns <respStmt>; handskrifter: avskrift och kollationering; brev: ansvarig redaktör tillkomstdatum för texten/verket (originalet); mellan taggarna införs ÅÅÅÅMM-DD. i <creation>; brev: avsändare i <creation>; brev: mottagare i <creation>; brev: avsändarort i <creation>; brev: mottagarort i <fileDesc>; omger <publisher> innehåller texten: Zacharias Topelius Skrifter handskrifter: avskrift och kollationering; brev: ansvarig redaktör omger ett eller flera <resp> och <name> innehåller ett <p> med texten Arkivsignum: se databas. Brev ytterligare: <p> där avvikande status anges (t.ex. kopia) TEI-fil, namespace TEI-fil, schema instance 138 <TEI> xsi:schemaLocation="" <TEI.2> xmnls="" <teiHeader> [inget attribut] <textClass> [inget attribut] <title> under <titleStmt> i [inget attribut] <fileDesc> <title> type=”desc” <title> type=”main” <titleStmt> <variantEncoding/> [inget attribut] method="parallellsegmentation" location="internal" namespace TEI-fil, namespace och plats för schemat ZTS:s TEI-filer, namespace info om TEI-filen och innehållet omger <catRef> föreläsningar: arkivsignum; brev: databassignum; dagböcker: Dagbok ÅÅÅÅÅÅÅÅ; lyrik: diktsamlingens namn överskrift för kontrakt; finns under <creation> den egentliga titeln (visas på ZTe i bl.a. sökresultatenfinns under <creation> variantapparatsdeklaration <encodingDesc> i 139
© Copyright 2024