Eva Toller, Riksarkivet

Tillgängliggörande av forskningsdata på Riksarkivet
Eva Toller / Riksarkivet / 2015-11-10
Riksarkivets innehav av
forskningsdata (i registerform)
•
Stor mängd forskningsdata, men inte mycket nytt
•
Förutom registerdata så finns även filsamlingar (pdfdokument, fotografier), audiovisuellt material,
webbplatser …
•
Volymmässigt är det som digitaliserats störst (bilder)
•
Det mesta av registerdata är sekretessbelagt
(personuppgifter). Det finns även register med känsliga
uppgifter (Kriminalvården, Socialstyrelsen,
Utlänningsnämnden…)
Vad är det för typ av register som Riksarkivet tagit emot?
Exempel på mottagna register
Register över BornDigital-register
http://riksarkivet.se/born-digital
forts Register över BornDigital-register
http://riksarkivet.se/born-digital
Öppen data (PSI-direktivet)
http://riksarkivet.se/psidata
Några fler Öppen data-kandidater
•
Allegro-registret (Rikskonserter).
Bokningssystem för artister i Rikskonserters
produktioner.
•
Filmregistret (Statens Biografbyrå).
Uppgifter om granskade filmer och trailers.
•
Daphne (Statens Strålskyddsinstitut).
Användes för att lagra och behandla uppmätta doser
och dosrater och att göra enkla spridningsprognoser.
•
Linnejubiléet 2007.
Webbplats (www.linne2007.se)
Svårigheter och lösningar
•
Många register innehåller personuppgifter
•
En del register innehåller även känslig information
(Kriminalvården, Utlänningsnämnden…) eller
information med betydelse för rikets säkerhet
•
I en del register kan sådan information tas bort utan att
det blir meningslöst att använda innehållet
•
Riksarkivet använder digital “maskning”
•
Exempel: ett personnummer blir xxxxx-xxxx,
59xxxx-xxxx, 5904xx-xxxx, 59xxxx-01xx, osv
Riksarkivets avidentifieringsprogram ROND(p)
•
ROND(p) = Riksarkivet Open Data (prototype)
•
Utvecklat med VINNOVA-pengar (2013)
•
Byggt för Riksarkivets (hittillsvarande) metadatamodell
•
Avidentifierar personnummer, namn, telefonnummer,
epostadresser och så vidare, genom att ersätta texten
med valfritt tecken
•
Lättanvänt men behöver utvecklas
forts ROND(p)
forts ROND(p)
Andra svårigheter
•
Svårt överblicka alla potentiella öppna data som finns
på Riksarkivet
•
Mer än 10 lokaliseringsorter
•
7 landsarkiv
•
15 avdelningar samt 13 enheter (en del självständiga)
•
Inventering ska göras under 2016 (- 2017)
Ny processorganisation från 2016