Tillgängliggörande av forskningsdata på Riksarkivet Eva Toller / Riksarkivet / 2015-11-10 Riksarkivets innehav av forskningsdata (i registerform) • Stor mängd forskningsdata, men inte mycket nytt • Förutom registerdata så finns även filsamlingar (pdfdokument, fotografier), audiovisuellt material, webbplatser … • Volymmässigt är det som digitaliserats störst (bilder) • Det mesta av registerdata är sekretessbelagt (personuppgifter). Det finns även register med känsliga uppgifter (Kriminalvården, Socialstyrelsen, Utlänningsnämnden…) Vad är det för typ av register som Riksarkivet tagit emot? Exempel på mottagna register Register över BornDigital-register http://riksarkivet.se/born-digital forts Register över BornDigital-register http://riksarkivet.se/born-digital Öppen data (PSI-direktivet) http://riksarkivet.se/psidata Några fler Öppen data-kandidater • Allegro-registret (Rikskonserter). Bokningssystem för artister i Rikskonserters produktioner. • Filmregistret (Statens Biografbyrå). Uppgifter om granskade filmer och trailers. • Daphne (Statens Strålskyddsinstitut). Användes för att lagra och behandla uppmätta doser och dosrater och att göra enkla spridningsprognoser. • Linnejubiléet 2007. Webbplats (www.linne2007.se) Svårigheter och lösningar • Många register innehåller personuppgifter • En del register innehåller även känslig information (Kriminalvården, Utlänningsnämnden…) eller information med betydelse för rikets säkerhet • I en del register kan sådan information tas bort utan att det blir meningslöst att använda innehållet • Riksarkivet använder digital “maskning” • Exempel: ett personnummer blir xxxxx-xxxx, 59xxxx-xxxx, 5904xx-xxxx, 59xxxx-01xx, osv Riksarkivets avidentifieringsprogram ROND(p) • ROND(p) = Riksarkivet Open Data (prototype) • Utvecklat med VINNOVA-pengar (2013) • Byggt för Riksarkivets (hittillsvarande) metadatamodell • Avidentifierar personnummer, namn, telefonnummer, epostadresser och så vidare, genom att ersätta texten med valfritt tecken • Lättanvänt men behöver utvecklas forts ROND(p) forts ROND(p) Andra svårigheter • Svårt överblicka alla potentiella öppna data som finns på Riksarkivet • Mer än 10 lokaliseringsorter • 7 landsarkiv • 15 avdelningar samt 13 enheter (en del självständiga) • Inventering ska göras under 2016 (- 2017) Ny processorganisation från 2016
© Copyright 2024