Download Report

Skannede kirkebøker – Hvordan de kom på nett.
Kanskje er du kjent med Arkivverkets tilbud med skannede kirkebøker på nett. Muligens er du også
en bruker av denne tjenesten. Har du lurt på hva som må til for å en slik tjeneste på nett? Da er
denne artikkelen noe for deg.
Bakgrunn
Skannede kirkebøker på nett er et prosjekt Arkivverket gjennomførte i perioden 2005-2207. Røttene
til prosjektet vil en kunne finne enda lengre tilbake i tid. Allerede i 2001 hadde Aftenposten en
artikkel om dette. Snakker du med idealistene bak prosjektet vil de fortelle at ideene kan tilbakeføres helt til 1990 tallet. Likevel var det vanskelig å få gjennomført prosjektet før, mye på grunn av
kostnadene og ressursene som var nødvendig. I ettertid finnes det også lyspunkter i at det tok så
lang tid før man kom i gang. Teknologiutviklingen var i 2005 kommet så langt at det var
økonomisk realiserbart å benytte gråtoneformat i skanningen av mikrofilmene. Det er dette valget
som i stor grad bidrar til den høye kvaliteten på bildene som er publisert på Internett. Tidligere
hadde en ikke sett for seg annet et svart/hvitt skanning slik det ellers var vanlig på den tiden. Det
ville gitt mange bilder som ville vært nærmest uleselig.
Mikrofilm finnes i flere formater. Illustrasjonen
viser en mer moderne 16 mm variant.
Utgangspunktet Arkivverket hadde var en
stor mikrofilmsamling, dels egenfotograferte
og dels arbeide gjort av Mormonerkirken.
Noe var fotografert på 16 mm film, mens
andre benyttet 35 mm. Det var ingen
fargefilmer, slik at gråtoneskanning ville
kunne bevare mesteparten av informasjonen
på filmene uten nevneverdige tap. På det
tidspunktet prosjektet var i forfasen ble det
også klart at gråtoneskanning ville være
økonomisk gjennomførbart: Nye og
rimeligere skanner teknologier var kommet
på markedet. Det ble derfor fort klart at
gråtone var veien å gå.
Det andre store spørsmålet var hvor nøye vi skulle indeksere materialet. Mange overveielser ble
gjort før man endelig og heldigvis landet på konklusjonen at en skulle indeksere hvert bilde. En var
klar over det ville bety mange titalls tusen ekstra timeverk i forhold til en enkel skjematisk
indeksering på bok nivå. De kloke vurderingene da gikk ut på at en detaljert indeksering ville
mangedoble verdien av materialet. Det var også viktig at dette ville være en engangs innsats med
stor verdi i mange mange år. I dag skal vi være takknemlig for disse valgene. Jeg vil påstå at den
løsningen vi har er blant verdens beste på området, og attpå til helt gratis for brukerne.
En tredje viktig faktor i løsningen var brukermedvirkning. De som husker tilbake til 2005 og 2006
minnes kanskje at det var et testsystem i drift fra senhøstes 2005 og utover i 2006. Dette systemet
ble brukt for å teste ut at nødvendig funksjonalitet faktisk virket for det løsningkonseptet vi hadde
valgt. Når det ble klart, startet utviklingen av selve presentasjonløsningen. Da valgte vi å benytte
oss av flere utvalgte sluttbrukere som fikk lov til å komme med direkte tilbakemeldinger og forslag
til hvordan ting skulle gjøres. Det var en udiskutabel positiv erfaring. En kan bare entydig
konkludere at uten denne medvirkningen ville ikke brukergrensesnittet vært så bra som det er.
Gjennomføringen
Jeg skal nå prøve å gi en beskrivelse av produksjonsprosessen fra mikrofilm til ferdig indeksert
bilde på Internett. Det er mange elementer som skal falle på plass og disse må henge sammen.
Utgangspunktet vårt en mikrofilmrull som inneholder opp til omtrent 2000 bilder. Den første
utfordringen var å få skannet denne filmen på en effektiv måte med den kvaliteten vi ønsker. Til
dette ble det anskaffet en mikrofilmskanner. Senere ble det kjøpt to til. Disse skanneren var i stand
til effektiv å skanne ca 1 bilde i sekundet med en oppløsning som vi etter tester burde være ca
4500x3500 gråtone piksler, altså med 8 bit pr. piksel. Disse bildene ble først lagret på skanneren for
en rask etterkontroll av at bildene ble riktig oppdelt, fikk riktig navn osv. Bildene ble deretter
kopiert ut til en server for videre bearbeiding.
Åge Mathisen i Riksarkivet opererer en av mikrofilmskannerne.
Når bildene først var kopiert ut til serveren kunne operatøren gjennom en intern vevside starte og
følge en automatisert prosessering av bildene. Først ble bildene konvertert til et tapsløst komprimert
billedformat, som i dette tilfellet var PNG. Dette bildet ble i prosessen så kopiert til og registrert i
vårt digitale arkiv Det konvertere bildet var så utgangspunktet for å lage ytterligere en kopi med en
redusert oppløsning innenfor rammen av 2048x1536 piksler. Denne versjonen ble så digitalt
skjerpet og kontrast forsterket, for deretter å bli konvertert til høykvalitets JPG bilde. Denne kopien
ble også arkivert i vårt digitale arkiv. Fra dette øyeblikket var bildet tilgjengelig for indeksering.
Hver natt ble alle de nye JPG bilder i det digitale arkivet kopiert ut til vår Internett server. Dette var
en helautomatisert og autonom prosess som på en enkel pragmatisk måte også sikret vårt digitale
magasin. Det er kopier som er tilgjengelig på Internett.
Etter at JPG bildene var kopiert til vårt digitale magasin kunne de som jobbet med indeksering ta
fatt på sin jobb, den største av alle jobbene. Med et web basert grensesnitt kunne de hente opp
bildene de skulle indeksere. De kunne da gjennom dette systemet bla igjennom bilde for bilde og
legge inn nødvendig informasjon. Mange informasjonfelter ble automatisk videreført fra bilde til
bilde, blant annet sidetellere som automatisk talte opp. Likevel var det behov for mange manuelle
endringer da bildene på filmen gjerne kunne hoppe på sidetall på grunn av manglende fotografering
av enkeltsider eller
enkeltsider kunne
komme flere ganger
etter hverandre.
Indeksererene har
faktisk sett på hvert
enkelt bilde, hvilket
også ble brukt som
kvalitetssikring på at
skanning og digital
behandling av bildene
hadde gått som de
skulle. Samtidig var det
også her den største
Forskjellen på svart-hvit og gråtone skanning ser en tydelig på dette
menneskelige faktoren
utsnittet.
for feil lå. Når man
stirret på bilde etter bilde var det fort gjort at noe passerte uoppdaget. Det var vi veldig bevisst på og
valgte å bruke dere brukere som en ytterligere kvalitetssikring. Deres tilbakemeldinger har vært og
er et av våre viktigste hjelpemidler for å fange opp slike feil og andre typer feil. Uten denne
brukermedvirkningen i produksjonen ville ikke kvaliteten på informasjonen vært på det høye nivået
det er i dag, og kvalitetsforbedringen fortsetter fortløpende.
Som det siste leddet i produksjonsprosessen ble databasen over de indekserte bildene hver natt
kopiert til Internett serveren vår. Dermed var ny informasjon og nye bilder fortløpende tilgjengelig
allerede dagen etter at indekseringsjobben var gjort. Framdriften av prosjektet og arbeidet kunne
dere følge på en prosjektoversikt som lå på oppstartsiden fram til romjula 2007. Kanskje det mest
morsomme nettopp har vært denne daglige oppdateringen. Hva kommer i dag?
Oppsummering
Takket være massiv innsats fra mange personer, såvel ansatte i Arkivverket, frivillige og ikke minst
alle brukerne av systemet, har Norge i dag en løsning på verdenstoppen for tilgang til skannede
kirkebøker. Årene framover vil bli brukt til å supplere og forbedre kvaliteten på et materiale som
omfatter 2¼ millioner bilder, tilsvarende 4½ millioner sider.
Selve rosinen i pølsa, en toveis knytning av det transkribert materialet og de skannede kirkebøkene,
vil være forhåpentligvis være gjennomførbart for store deler av materialet i løpet av noen år. Fra det
transkriberte materialet til de skannede kirkebøkene finnes det allerede slike knytninger for enkelte
registreringer.
Lykke til med bruken.