Skannede kirkebøker – Hvordan de kom på nett. Kanskje er du kjent med Arkivverkets tilbud med skannede kirkebøker på nett. Muligens er du også en bruker av denne tjenesten. Har du lurt på hva som må til for å en slik tjeneste på nett? Da er denne artikkelen noe for deg. Bakgrunn Skannede kirkebøker på nett er et prosjekt Arkivverket gjennomførte i perioden 2005-2207. Røttene til prosjektet vil en kunne finne enda lengre tilbake i tid. Allerede i 2001 hadde Aftenposten en artikkel om dette. Snakker du med idealistene bak prosjektet vil de fortelle at ideene kan tilbakeføres helt til 1990 tallet. Likevel var det vanskelig å få gjennomført prosjektet før, mye på grunn av kostnadene og ressursene som var nødvendig. I ettertid finnes det også lyspunkter i at det tok så lang tid før man kom i gang. Teknologiutviklingen var i 2005 kommet så langt at det var økonomisk realiserbart å benytte gråtoneformat i skanningen av mikrofilmene. Det er dette valget som i stor grad bidrar til den høye kvaliteten på bildene som er publisert på Internett. Tidligere hadde en ikke sett for seg annet et svart/hvitt skanning slik det ellers var vanlig på den tiden. Det ville gitt mange bilder som ville vært nærmest uleselig. Mikrofilm finnes i flere formater. Illustrasjonen viser en mer moderne 16 mm variant. Utgangspunktet Arkivverket hadde var en stor mikrofilmsamling, dels egenfotograferte og dels arbeide gjort av Mormonerkirken. Noe var fotografert på 16 mm film, mens andre benyttet 35 mm. Det var ingen fargefilmer, slik at gråtoneskanning ville kunne bevare mesteparten av informasjonen på filmene uten nevneverdige tap. På det tidspunktet prosjektet var i forfasen ble det også klart at gråtoneskanning ville være økonomisk gjennomførbart: Nye og rimeligere skanner teknologier var kommet på markedet. Det ble derfor fort klart at gråtone var veien å gå. Det andre store spørsmålet var hvor nøye vi skulle indeksere materialet. Mange overveielser ble gjort før man endelig og heldigvis landet på konklusjonen at en skulle indeksere hvert bilde. En var klar over det ville bety mange titalls tusen ekstra timeverk i forhold til en enkel skjematisk indeksering på bok nivå. De kloke vurderingene da gikk ut på at en detaljert indeksering ville mangedoble verdien av materialet. Det var også viktig at dette ville være en engangs innsats med stor verdi i mange mange år. I dag skal vi være takknemlig for disse valgene. Jeg vil påstå at den løsningen vi har er blant verdens beste på området, og attpå til helt gratis for brukerne. En tredje viktig faktor i løsningen var brukermedvirkning. De som husker tilbake til 2005 og 2006 minnes kanskje at det var et testsystem i drift fra senhøstes 2005 og utover i 2006. Dette systemet ble brukt for å teste ut at nødvendig funksjonalitet faktisk virket for det løsningkonseptet vi hadde valgt. Når det ble klart, startet utviklingen av selve presentasjonløsningen. Da valgte vi å benytte oss av flere utvalgte sluttbrukere som fikk lov til å komme med direkte tilbakemeldinger og forslag til hvordan ting skulle gjøres. Det var en udiskutabel positiv erfaring. En kan bare entydig konkludere at uten denne medvirkningen ville ikke brukergrensesnittet vært så bra som det er. Gjennomføringen Jeg skal nå prøve å gi en beskrivelse av produksjonsprosessen fra mikrofilm til ferdig indeksert bilde på Internett. Det er mange elementer som skal falle på plass og disse må henge sammen. Utgangspunktet vårt en mikrofilmrull som inneholder opp til omtrent 2000 bilder. Den første utfordringen var å få skannet denne filmen på en effektiv måte med den kvaliteten vi ønsker. Til dette ble det anskaffet en mikrofilmskanner. Senere ble det kjøpt to til. Disse skanneren var i stand til effektiv å skanne ca 1 bilde i sekundet med en oppløsning som vi etter tester burde være ca 4500x3500 gråtone piksler, altså med 8 bit pr. piksel. Disse bildene ble først lagret på skanneren for en rask etterkontroll av at bildene ble riktig oppdelt, fikk riktig navn osv. Bildene ble deretter kopiert ut til en server for videre bearbeiding. Åge Mathisen i Riksarkivet opererer en av mikrofilmskannerne. Når bildene først var kopiert ut til serveren kunne operatøren gjennom en intern vevside starte og følge en automatisert prosessering av bildene. Først ble bildene konvertert til et tapsløst komprimert billedformat, som i dette tilfellet var PNG. Dette bildet ble i prosessen så kopiert til og registrert i vårt digitale arkiv Det konvertere bildet var så utgangspunktet for å lage ytterligere en kopi med en redusert oppløsning innenfor rammen av 2048x1536 piksler. Denne versjonen ble så digitalt skjerpet og kontrast forsterket, for deretter å bli konvertert til høykvalitets JPG bilde. Denne kopien ble også arkivert i vårt digitale arkiv. Fra dette øyeblikket var bildet tilgjengelig for indeksering. Hver natt ble alle de nye JPG bilder i det digitale arkivet kopiert ut til vår Internett server. Dette var en helautomatisert og autonom prosess som på en enkel pragmatisk måte også sikret vårt digitale magasin. Det er kopier som er tilgjengelig på Internett. Etter at JPG bildene var kopiert til vårt digitale magasin kunne de som jobbet med indeksering ta fatt på sin jobb, den største av alle jobbene. Med et web basert grensesnitt kunne de hente opp bildene de skulle indeksere. De kunne da gjennom dette systemet bla igjennom bilde for bilde og legge inn nødvendig informasjon. Mange informasjonfelter ble automatisk videreført fra bilde til bilde, blant annet sidetellere som automatisk talte opp. Likevel var det behov for mange manuelle endringer da bildene på filmen gjerne kunne hoppe på sidetall på grunn av manglende fotografering av enkeltsider eller enkeltsider kunne komme flere ganger etter hverandre. Indeksererene har faktisk sett på hvert enkelt bilde, hvilket også ble brukt som kvalitetssikring på at skanning og digital behandling av bildene hadde gått som de skulle. Samtidig var det også her den største Forskjellen på svart-hvit og gråtone skanning ser en tydelig på dette menneskelige faktoren utsnittet. for feil lå. Når man stirret på bilde etter bilde var det fort gjort at noe passerte uoppdaget. Det var vi veldig bevisst på og valgte å bruke dere brukere som en ytterligere kvalitetssikring. Deres tilbakemeldinger har vært og er et av våre viktigste hjelpemidler for å fange opp slike feil og andre typer feil. Uten denne brukermedvirkningen i produksjonen ville ikke kvaliteten på informasjonen vært på det høye nivået det er i dag, og kvalitetsforbedringen fortsetter fortløpende. Som det siste leddet i produksjonsprosessen ble databasen over de indekserte bildene hver natt kopiert til Internett serveren vår. Dermed var ny informasjon og nye bilder fortløpende tilgjengelig allerede dagen etter at indekseringsjobben var gjort. Framdriften av prosjektet og arbeidet kunne dere følge på en prosjektoversikt som lå på oppstartsiden fram til romjula 2007. Kanskje det mest morsomme nettopp har vært denne daglige oppdateringen. Hva kommer i dag? Oppsummering Takket være massiv innsats fra mange personer, såvel ansatte i Arkivverket, frivillige og ikke minst alle brukerne av systemet, har Norge i dag en løsning på verdenstoppen for tilgang til skannede kirkebøker. Årene framover vil bli brukt til å supplere og forbedre kvaliteten på et materiale som omfatter 2¼ millioner bilder, tilsvarende 4½ millioner sider. Selve rosinen i pølsa, en toveis knytning av det transkribert materialet og de skannede kirkebøkene, vil være forhåpentligvis være gjennomførbart for store deler av materialet i løpet av noen år. Fra det transkriberte materialet til de skannede kirkebøkene finnes det allerede slike knytninger for enkelte registreringer. Lykke til med bruken.
© Copyright 2024