ATT-politiikkaa ja toimintaohjetta valmisteleva

Oulun yliopiston tutkimusrehtorille
Oulun yliopiston avoin tiede ja tutkimus – ATT-politiikkaa ja toimintaohjetta valmistelevan
työryhmän loppuraportti
Opetus- ja kulttuuriministeriö edellyttää yliopistoilta datapolitiikkaa ja
toimenpideohjelmaa. Tutkimusneuvosto käsitteli asiaa kokouksessaan
26.2.2015 ja päätti esittää työryhmän perustamista valmistelemaan Oulun
yliopiston ATT-politiikkaa ja toimintaohjetta yhteistyössä tutkimusneuvoston
kanssa. Työryhmän tulisi ottaa huomioon kansainväliset ja kansalliset ohjeet ja
ratkaisut. Tutkimusneuvoston esityksen mukaisesti tutkimusrehtori on
nimittänyt 13.3.2015 työryhmään seuraavat jäsenet: Sinikka Eskelinen (pj),
Mirka Hintsanen, Kari Keinänen, Riitta Keiski, Päivi Kytömäki, Minna Männikkö
ja Risto Virtanen. Työryhmää täydennettiin elokuussa 2015, kun Päivi
Kytömäki jäi pois yliopiston palveluksesta ja hänen tilalleen tuli Aila
Louhelainen. Työryhmä esitti tutkimusneuvostolle väliraportin kesäkuussa ja
esittelee loppuraportin 26.10.2015. Työryhmä on kokoontunut seitsemän
kertaa.
Työryhmä on tehnyt yliopistojen aineistojen hallinnan nykytila-analyysin
esimerkkien avulla ja laatinut ehdotuksen Oulun yliopiston datapolitiikan
periaatteista ja ensisijaisista toimenpiteistä sekä esittänyt yliopiston tavoitetilan
2017.
Oulussa 15. lokakuuta 2015
Sinikka Eskelinen, pj
johtaja
Mirka Hintsanen
professori
2
Kari Keinänen
johtaja
Riitta Keiski
professori
Aila Louhelainen
informaatikko
Minna Männikkö
johtaja
Risto Virtanen
yli-intendentti
Jakelu:
rehtori, vararehtorit, yliopiston johtoryhmän jäsenet, tutkimusneuvoston jäsenet,
yliopistopalvelujen vastuualuepäälliköt, kirjaston johtaja
3
Oulun yliopiston Avoin tiede ja tutkimus – ATT – politiikkaa ja toiminta-ohjetta valmistelevan
työryhmän loppuraportti tutkimusneuvostolle 26.10.2015
ATT – työryhmän jäsenet: Sinikka Eskelinen (pj), Mirka Hintsanen, Kari Keinänen, Riitta Keiski, Päivi
Kytömäki, Aila Louhelainen, Minna Männikkö, Risto Virtanen, sihteeri Aija Ryyppö
YHTEENVETO
Opetus- ja kulttuuriministeriö edellyttää yliopistoilta datapolitiikkaa ja toimenpideohjelmaa.
Tutkimusneuvosto käsitteli asiaa kokouksessaan 26.2.2015 ja päätti esittää työryhmän perustamista
valmistelemaan Oulun yliopiston ATT-politiikkaa ja toimintaohjetta yhteistyössä tutkimusneuvoston kanssa.
Työryhmän tulisi ottaa huomioon kansainväliset ja kansalliset ohjeet ja ratkaisut. Tutkimusneuvoston
esityksen mukaisesti tutkimusrehtori on nimittänyt 13.3.2015 työryhmään seuraavat jäsenet: Sinikka
Eskelinen (pj), Mirka Hintsanen, Kari Keinänen, Riitta Keiski, Päivi Kytömäki, Minna Männikkö, Risto
Virtanen. Työryhmää täydennettiin elokuussa 2015, kun Päivi Kytömäki jäi pois yliopiston palveluksesta ja
hänen tilalleen tuli Aila Louhelainen. Työryhmä esitti tutkimusneuvostolle väliraportin kesäkuussa ja esittää
loppuraportin 26.10.2015. Työryhmä on kokoontunut seitsemän kertaa.
Työryhmä on tehnyt yliopistojen aineistojen hallinnan nykytila-analyysin esimerkkien avulla ja laatinut
ehdotuksen Oulun yliopiston datapolitiikan periaatteista ja ensisijaisista toimenpiteistä sekä esittänyt
yliopiston tavoitetilan 2017.
Oulun yliopisto pitää hyvinä ja esimerkillisinä UK:n Concordat on Open Research Data periaatteita, jotka
on laadittu Ison Britannian eri rahoittajien, yliopistojen ja tutkimusinstituuttien muodostaman Open
Research Data Forum – konsortion toimesta. Oulun yliopisto on päättänyt ottaa ne oman datapolitiikkansa
perustaksi.
Lyhyesti
- Tutkimusaineistojen avaaminen edistää korkeatasoista tutkimusta, helpottaa innovaatiotoimintaa ja turvaa
hyviä tutkimuskäytäntöjä.
- Hyvä datanhallinta on välttämätöntä tutkimusprosessien kaikilla tasoilla ja se tulisi varmistaa prosessin
alusta lähtien.
- Dataa täytyy hoitaa (kuratoida) niin, että sitä voi päästä käyttämään, se on löydettävissä ja käyttökelpoista.
- Tutkimusaineistojen avaaminen tuo huomattavia kustannuksia, mikä täytyy kaikkien osapuolien ottaa
huomioon.
- On olemassa selkeitä perusteita, miksi tutkimusaineistojen avaamista on tarpeen rajoittaa, mutta näiden
perusteiden täytyy olla oikeutettuja ja toteennäytettävissä.
- Tutkimusaineiston perustajien oikeudet sen ensisijaiseen käyttöön täytyy tunnustaa.
- Muiden tutkijoiden aineistojen käytössä täytyy aina noudattaa asianmukaisia lakeja, eettisiä ohjeita ja
säännöksiä sekä ilmoittaa aineiston lähde sitä käytettäessä.
- Julkaisuissa käytetyt aineistot tulisi olla saatavissa julkaisuhetkellä sellaisessa muodossa, että niihin voi
viitata. Tähän Oulun yliopisto esittää varauksen, että tutkijan täytyy saada päättää, ettei dataa avata
välittömästi mikäli siitä on suunnitteilla useita julkaisuja ja aineiston avaaminen vaikeuttaa tätä. Tässäkin
tapauksessa käytetyt aineistot tulisi rekisteröidä niin, että ne saavat pysyvän tunnisteen, jolla niihin voidaan
viitata. Lisäksi aineisto on voitava antaa pyynnöstä julkaisufoorumin tarkasteltavaksi.
- Kaikkien asianosaisten vastuulla on tukea tutkimusaineistojen tallentamisessa ja avaamisessa tarvittavien
datan käsittelytaitojen kehittämistä.
- Tutkimusaineistojen avaamisen edistymistä tulee arvioida säännöllisesti. Tämä arviointi tulee ottaa Oulun
yliopiston laatukäsikirjan osaksi.
Tutkimusneuvosto ja tutkimuksen johtoryhmä ovat avointa dataa ja tutkimusaineistojen hallinnointia
koskevien toimintojen koordinoivat elimet. Kaikkiin tiedekuntiin ja ydinpalveluyksiköihin nimetään
tutkimusaineistoista vastaava henkilö. Oulun yliopisto ohjaa tutkijoita tutkimusaineistoja hallinnoivien
4
palvelujen käyttäjiksi ja suuntaa omia ja kannustaa tutkijoita hankkimaan lisäresursseja avoimuuden
edistämiseen. Tutkimuksen tukipalvelut, kirjasto, arkisto ja tietohallinto opastavat tutkijoita ja järjestävät
tarvittavaa koulutusta.
Tutkimusyksiköiden tulee määrittää tavoitetila ja toimenpiteet, miten he aikovat toteuttaa
- tutkimusaineistojen rekisteröinnin
- tutkimusaineistojen tallentamisen
- tutkimusaineistojen avaamisen.
Yksikön tutkimusaineistot ja niiden hallinnointi käsitellään tulosneuvotteluissa.
Oulun yliopisto edellyttää, että tutkimusryhmät päättävät tutkimusaineistojen avaamisesta ottaen huomioon
rahoittajatahon ohjeistukset. Yliopistotasolla tulisi rakentaa hallinnointimalli sekä keskitetyt ja
tiedekuntatason palvelujärjestelmät. Näihin palvelujärjestelmiin tulisi liittää neuvonta sopimus- ja
tekijäoikeuksista. Oulun yliopisto suosittelee käytettäväksi mahdollisimman paljon valtakunnallisia, esim.
CSC:n sekä kansainvälisten ESFRI-infrastruktuurihankkeiden palveluja.
Tavoitetila 2017:
- Tutkimusaineistojen rekisteröinti ja metatietojen tallennukseen liittyvät prosessit määritelty
- Tutkimusaineistojen tallennus ja hallinnointi otettu osaksi tulosneuvotteluja
- Tutkimusaineistojen avaamisen perusteet on määritelty ja edellytykset luotu
- Julkaisujen rinnakkaistallentaminen järjestetty
- Tutkijoiden ohjeistus ja koulutus suunniteltu ja toteutus menossa.
5
1. Johdanto
Tiedon hankinta ja tulkinta ovat keskeisiä tutkimuksen toimintatapoja. Tutkijat keräävät aineistoja erilaisissa
muodoissa, fysikaalisina aineistoina, nauhoitteina, mittaustietoina, valokuvina jne. Digitalisaation aikakaudella
on tullut entistä helpommaksi tallentaa ja jakaa tietoja ja aineistoja toisille tutkijoille ja suurelle yleisölle.
Uuden tekniikan avaamat mahdollisuudet ovat synnyttäneet pohdintaa siitä, miten
saataisiin paremmin talletetuksi ja avatuksi uudelleen käyttöön.
tutkimusaineistot
Poliittisten päättäjien ja suuren yleisön
taholta on kasvanut vaatimus julkisella rahoituksella hankitun tiedon ja aineistojen avaamiseksi kansainvälisen
tutkijayhteisön ja tiedon hyödyntäjien saataville.
Suuret tiederahoittajat USA:ssa, Euroopassa ja monissa
muissa maissa ovat jo tehneet rahoituksen saamisen yhdeksi ehdoksi tutkimusdatan tallettamisen julkisiin
arkistoihin ja niiden mahdollisimman laajan avaamisen tutkijayhteisön käyttöön.
Samanaikainen pyrkimys
turvata ihmisten yksityisyys ja mahdollisuus tutkimustulosten kaupalliseen hyödyntämiseen on luonut
tarpeen datapolitiikan ohjeistuksesta, miten nämä näennäisesti vastakkaiset pyrkimykset sovitetaan yhteen.
Suomessa tätä työtä ohjaa Opetus- ja kulttuuriministeriön Avoimen tieteen ja tutkimuksen ATT-hanke.
Oulun yliopiston ATT- ohjeistus on osa tätä pyrkimystä sovittaa yhteen tieteen avoimuuden vaatimukset ja
tutkijan oikeudet sekä tavoite turvata yksilön yksityisyyden suoja kaikissa tilanteissa.
Tutkimusaineistojen avaamiselle on asetettu suuria toiveita siitä, miten avoimuus synnyttäisi uusia
innovatiivisia tutkimusaloja, edistäisi taloudellista kasvua ja parantaisi tutkijoiden sekä tieteen julkista kuvaa.
Tutkimusaineistojen avaamisella tavoitellaan myös huomattavia kustannussäästöjä, kun samaa dataa voidaan
tarkastella useasta näkökulmasta ja yhdistellä erilaisia tietoaineistoja uusien oivallusten perustaksi. Avoimet
tutkimusaineistot toimivat myös tutkimuksen laadun takaajana. Muut tutkijat voivat tarkastella julkaisuissa
esitettyjä tietoja ja todentaa johtopäätösten oikeellisuuden.
Tutkimusaineistojen tallentaminen julkisiin arkistoihin ja niiden avaaminen asettaa tutkimusinstituutioille ja hallinnolle uusia vaatimuksia. Suurin haaste on valtavan datan määrän tallentaminen ja saattaminen
tutkijoiden käyttöön hallitusti, niin että se säilyy ja myös oman tutkijayhteisön ulkopuoliset tutkijat voivat
sitä käyttää. Datan tervehdyttäminen, kuratointi (data curating), on kallista ja aikaa vievää, ja sen
kustannusten kattaminen oikeudenmukaisesti on kansainvälisten sekä kansallisten tiedehallinnon päättäjien
lähiajan tärkeimpiä tehtäviä. Kustannusten kohdentaminen ja tutkijoiden motivointi datan avaamiseen
liittyvät kiinteästi toisiinsa. Kansainväliset rahoittajat hyväksyvät datan avaamisen ja kuratoinnin kulut
rahoituskustannuksiin ja samalla vaativat, että tulokset ovat avoimesti saatavissa. Positiivisten kannustimien
löytäminen tutkijoiden motivoimiseksi on yliopistotason datapolitiikan tärkeitä tehtäviä. Avoimuus toteutuu
vain yksittäisten tutkijoiden innostuksen ja motivaation kautta.
On luotava mekanismit, miten tutkijat
voivat ansioitua tutkimusaineistojen avaamisesta ja nostettava esiin, miten tutkijat ja instituutit voivat
6
profiloitua ja saada tunnettavuutta avoimien aineistojen avulla. Tässä tarvitaan tutkijayhteisön kulttuurin
muutosta.
2. Datapolitiikkaa
Yliopisto – Universitas on tutkijoiden yhteisö, jossa tutkimusta tekevät oppineet keräävät tietoa, jäsentävät
sitä, luovat uusia kokonaisuuksia ja tarjoavat tuloksensa muiden tutkijoiden arvioitavaksi sitten kun katsovat
ajan olevan sopiva. Samanaikaisesti kansainväliset ja kansalliset rahoittajat ovat esittäneet yhä tiukemmin
vaatimuksen tutkijoiden tutkimusaineistojen ja tutkimustulosten avaamisesta sekä järjestämisestä muiden
tutkijoiden ja päättäjien käytettäväksi. Tutkijoita sitovat erilaiset lupamenettelyt ja rahoittajien vaatimukset.
Samanaikaisesti tutkijoiden tulisi saada toteuttaa akateemista vapaata tutkimusta. Kaiken tämän
varmistamiseksi tarvitaan tiedepolitiikkaa sekä datapolitiikkaa.
Kansainväliset, kansalliset ja institutionaaliset tutkimusorganisaatiot ovat laatineet periaatteita ja ohjeistusta
tutkimusaineistojen avaamiseksi. Seuraavassa esitellään lyhyesti Suomen opetus- ja kulttuuriministeriön
ATT-hankkeen, Ison Britannian tutkimusrahoittajien ja Helsingin yliopiston suositukset. Myös Jyväskylän
yliopisto on hyväksynyt oman datapolitiikkansa ja antanut ohjeistuksen sen edistämiseksi.
2.1. OKM:n Avoin tiede ja tutkimus ATT - hanke http://avointiede.fi/
Avoin tiede ja tutkimus -hanke on OKM:n vuonna 2014 käynnistämä hanke tiedon saatavuuden ja avoimen
tieteen edistämiseksi. Tavoitteena on, että vuoteen 2017 mennessä Suomi nousee yhdeksi johtavista maista
tieteen ja tutkimuksen avoimuudessa ja että avoimen tieteen mahdollisuudet hyödynnetään laajasti
yhteiskunnassa. www.avointiede.fi
ATT-hanke
pohjautuu
laajapohjaiseen
ministeriöiden,
korkeakoulujen,
tutkimuslaitosten
ja
tutkimusrahoittajien yhteistyöhön. Hankkeen toteutuksesta vastaavat strategiaryhmä sekä asiantuntijaryhmä.
Asiantuntijaryhmä edistää käytännössä avoimen tieteen ja tutkimuksen palvelujen tuottajien ja käyttäjien
vuoropuhelua, ohjaa tarvittavien työryhmien työtä sekä kokonaisarkkitehtuurityötä ja järjestää tarvittavia
työpajoja ja täsmäselvityksiä. Täsmäselvityksiä on tehty ja meneillään useammissa työryhmissä
(http://avointiede.fi/työryhmät) mm. julkaisujen avoimen saatavuuden edistämisestä, tietomalleista,
oikeuksien hallinnasta sekä vaikuttavuudesta. Hankkeen alla on meneillään myös projekteja, kuten
yhtenäisen Tuuli-aineistonhallintasuunnitelmatyökalun kehittäminen.
OKM rahoittaa ATT-hanketta useilla miljoonilla euroilla.
Sen puitteissa toimii useita työryhmiä, mm.
tutkimusaineistojen pitkäaikaissäilytystä pohtiva työryhmä. ATT-hankkeessa on laadittu avoimen tieteen
käsikirja, jossa on laajasti ohjeita sekä tutkijoille, tutkimushallinnolle, arkistojen ylläpitäjille ja myös
kirjastoille. ATT-hanke ei ole yliopistoja velvoittava, mutta OKM seuraa tarkasti, miten yliopistot edistävät
ja rakentavat valmiuksia toteuttaa tutkimusaineistojen avaamista (http://avointiede.fi/www-kasikirja).
7
Käsikirjassa ja ATT-verkkosivuilla on runsaasti tietoa CSC:n, Kansalliskirjaston ja muiden palvelun tarjoajien
järjestelmistä ja ohjeita, miten tutkimusaineistoja voi tallentaa ja hallinnoida sekä avata muiden tutkijoiden
käyttöön.
2.2. Concordat On Open Research Data by RCUK
The Concordat on Open Research Data has been developed under the auspices of the Open Research
Data Forum by a multi-stakeholder working group, which includes RCUK, JISC, the Wellcome Trust and
Universities UK. The concordat aims to help to ensure that the research data gathered and generated by
members of the UK research community is made openly available for use by others wherever possible in a
manner consistent with relevant legal, ethical and regulatory frameworks and norms.
The concordat aims to establish a set of expectations of good practice with the intention of establishing
open research data as the desired position for publicly-funded research over the long-term. It recognises
the different responsibilities of researchers, their employers, and funders of research, however, it is not the
intention of the concordat to mandate, codify or require specific activities.
http://www.rcuk.ac.uk/research/opendata/
Principle #1
Open access to research data is an enabler of high quality research, a facilitator of innovation and
safeguards good research practice
Principle #2
Good data management is fundamental to all stages of the research process and should be established at
the outset.
Principle #3
Data must be curated so that they are accessible, discoverable and useable.
Principle #4
Open access to research data carries a significant cost, which should be respected by all parties
Principle #5
There are sound reasons why the openness of research data may need to be restricted but any restrictions
must be justified and justifiable
Principle #6
The right of the creators of research data to reasonable first use is recognised.
Principle #7
Use of others’ data should always conform to legal, ethical and regulatory frameworks including appropriate
acknowledgement.
Principle #8
Data supporting publications should be accessible by the publication date and should be in a citeable form.
8
Principle #9
Support for the development of appropriate data skills is recognised as a responsibility for all stakeholders.
Principle #10
Regular reviews of progress towards open access to research data should be undertaken.
2.3. Helsingin yliopiston datapolitiikan periaatteet
Helsingin yliopiston tutkimusdatapolitiikka[1]
1. Helsingin yliopistossa opetetaan ja noudatetaan hyvää aineistonhallintatapaa. Jokainen yliopistoyhteisön jäsen
on vastuussa hyvän aineistonhallintatavan noudattamisesta.
2. Jokaisen yliopistolaisen on noudatettava tutkimuseettisiä ohjeita tutkimusaineistojen ja -datan hallinnassa ja
avaamisessa sekä huolehdittava luottamuksellisten tietojen suojaamisesta, tietoturvasta ja tietosuojasta
lainsäädännön, hyvän tieteellisen käytännön sekä yliopiston antamien ohjeiden ja määräysten mukaisesti.
3. Helsingin yliopisto sisällyttää tutkimusaineisto-osaamisen tutkijoiden perehdytykseen sekä ottaa tämän
osaamisen huomioon akateemisessa ansioitumisessa. Tiedekunnat ja laitokset sekä vastuulliset tutkijat
vastaavat opiskelijoiden ja tutkimushenkilöstön perehdyttämisestä hyvään aineistonhallintatapaan.
4. Helsingin yliopisto tarjoaa koulutusta ja tukea aineistonhallintasuunnitelmien laatimiseen sekä datanhallintaan
tutkimuksen elinkaaren ajan. Koulutusta tarjotaan sekä opintojen osana että henkilöstökoulutuksena.
5. Helsingin yliopisto tarjoaa tutkijoille ja tutkimusryhmille tutkimusdatainfrastruktuurin, joka käsittää datan
hallintaa, käyttöä, löytyvyyttä ja jakamista tukevia työvälineitä, palveluita sekä tallennus-, laskenta- ja
käsittelykapasiteettia. Datainfrastruktuuri rakennetaan ja sitä kehitetään yhteistyössä kansallisten ja
kansainvälisten toimijoiden kanssa, ottaen huomioon myös näiden tarjoamat palvelut ja infrastruktuurit.
6. Helsingin yliopisto tarjoaa tukea tutkimusaineistoihin liittyvien oikeudellisten kysymysten tunnistamiseen ja
ratkaisemiseen. Vastuulliset tutkijat vastaavat siitä, että tutkimuksessa syntyvien aineistojen omistus- ja
käyttöoikeuksia koskevat sopimukset tehdään mahdollisimman varhaisessa vaiheessa, soveltuvin osin ennen
tutkimushankkeen alkua.
7. Rahoitushakemuksiin liitettävissä aineistonhallintasuunnitelmissa on otettava huomioon aineiston ja datan
kerääminen, käsittely, omistajuus ja käyttöoikeudet, (pitkäaikais)säilytys, uudelleenkäyttö ja julkaiseminen,
suunnitelmallinen tuhoaminen sekä erityisesti niiden vaatimat resurssitarpeet. Tutkimusaineistojen
metadatassa on mainittava tutkimusdatan omistaja ja oikeudelliset rajoitukset tutkimusaineistojen käytölle.
Henkilötietojen ja muiden arkaluontoisten aineistojen käsittely ja säilyttäminen on otettava huomioon
aineistonhallintasuunnitelmassa.
8. Helsingin yliopiston piirissä tuotettu, julkaistuihin tutkimustuloksiin liitetty tutkimusdata on lähtökohtaisesti
yhteiskäyttöistä ja avointa. Aineiston löydettävyydestä ja viitattavuudesta on huolehdittava. Aineistojen
käytön yhteydessä tutkimusaineistojen tekijät on mainittava hyvän tavan mukaisesti ja Helsingin yliopisto on
mainittava tutkimusaineistojen lähteenä. Elinkeinoelämän ja yhteiskunnan toimijoiden käyttöön jalostetuista
datakokonaisuuksista voidaan periä korvaus.
9
[1] Tutkimusdatapolitiikka koskee tutkimushankkeissa tuotettavia, käytettäviä ja muokattavia digitaalisia
tutkimusaineistoja eli tutkimusdataa. Tutkimusdatapolitiikan ulkopuolelle on rajattu fyysiset aineistot, joihin
tutkimusdata perustuu (esim. paperiaineistot) sekä biologisen tutkimusmateriaalin käyttö.
Tutkimustoiminnassa syntyvien asiakirjojen ja aineistojen säilytystä ohjaavat asiakirjojen säilytysohje eli
arkistonmuodostussuunnitelma (2013) ja yliopistojen yhteistyönä laadittu tutkimusaineistojen
säilytyskriteeristö (Tutkimustoiminta. Asiakirjat, aineistot, dokumentointi. Helsinki 1997). Biologisen
materiaalin käyttöä tutkimuksessa ohjaa erillinen lainsäädäntö sekä lupakäytännöt.
© 2015 Helsingin yliopisto, lisensoitu Creative Commons Nimeä 4.0 Kansainvälinen -käyttöluvalla.
Ison Britannian ja Helsingin yliopiston teksteissä on näkökulmaero: Concordat antaa enemmän velvoitteita
instituutioille ja Helsingin yliopiston ohjeistaa enemmän tutkijoita avoimen tiedon toteuttamiseen.
3. Tutkimusaineistojen avaamisen reunaehtoja
3.1. Tutkimukseen tarvittavat luvat, oikeudet ja sopimukset
Luvat
Usein tutkimusaineistojen hankkimiseen tarvitaan viranomaislupa ja lupahakemuksessa edellytetään myös
kuvausta aineiston tallettamisesta, saatavuudesta sekä hävittämisestä.
Tutkimus on luvanvaraista kun
-ihmistieteissä tutkitaan potilaita tai ala-ikäisiä lapsia ja nuoria
- käytetään koe-eläimiä
- käytetään geenimuunneltuja organismeja
- tutkimuksia tehdään luonnonsuojelualueilla tai ne koskevat uhanalaisia tai rauhoitettuja lajeja.
Eettiset
toimikunnat,
geenitekniikan
laitos
ja
ympäristöhallinto
käsittelevät
luvanvaraiset
tutkimuskysymykset. Aikuisten ihmisten haastatteluihin ei yleensä tarvita lupaa, mutta usein luodaan
henkilörekisteri, jolloin on noudatettava henkilörekisterilakia. Haastatteluihin voi liittyä tekijänoikeuksia,
joita voi olla sekä haastateltavalla että haastattelijalla. Haastattelujen käytöstä on aina sovittava.
Haastateltavalta on saatava riittävän laajat käyttöoikeudet, mutta henkilötietolain näkökulmasta laajan
suostumuksen saaminen voi olla ongelmallista.
Oikeudet
Aineistojen omistusoikeus on erilainen riippuen siitä, millaisesta aineistosta puhutaan. Fyysiset materiaalit,
mm. biologiset materiaalit kuuluvat yliopistolle (vasta-aineet, hiiret, kivet, kemikaalit jne.), mutta valokuvat
ylittävät usein teoskynnyksen, jolloin omistus on niiden ottajalla. Samaan kategoriaan kuuluvat esim.
10
piirustukset ja itsetehdyt kartat. Tietokoneohjelmien ja tietokantojen (suojattu tekijänoikeudella) oikeudet
kuuluvat tekijälle, jollei oikeuksia ole erikseen siirretty yliopistolle. Tekijänoikeudella suojatun aineiston
(esim. haastattelut, valokuvat, tietokoneohjelmat ja tietokannat) omistus kuuluu lähtökohtaisesti niiden
tekijälle/tekijöille, ja heidän pitäisi tehdä vapaaehtoinen oikeuksiensiirto yliopistolle, jotta aineistoa voidaan
käyttää jatkossakin yliopiston tutkimuksiin. On tärkeää selvittää, miten tämä hoidetaan. Jos yliopistolle
siirretään kaikki oikeudet aineistoihin, on huolehdittava siitä, että tutkija voi paikkaa vaihtaessaan hyödyntää
omia aineistojaan myös myöhemmässä tutkimuksessa.
Kerättyihin aineistoihin voi liittyä myös kolmansien osapuolten oikeuksia, esim. tekijänoikeuksia.
Oikeudenhaltijoita pitää saada riittävän laajat käyttöoikeudet tutkimusaineistojen käyttöön. Yliopisto voi
arkistona digitoida aineistoja, vaikka niihin liittyisi tekijänoikeuksia, mutta jos näitä tekijänoikeuden alaisia
digitoituja aineistoja halutaan levittää muiden käytettäväksi, ei sitä voida tehdä ilman oikeudenhaltijoiden
lupaa. On selvitettävä, miten luvat hankitaan. Esimerkiksi yliopisto voi neuvotella tekijänoikeusjärjestöjen
kanssa sopimuslisenssin. Toisaalta aineiston säilyttäjältä edellytetään teknisiä valmiuksia erotella, kenen
käytettäväksi aineistot tulevat, jotta oikeudenhaltijat ovat valmiita hyväksymään sopimuslisenssin.
Teossuojasta ja aineistojen keräämiseen ja hallintaan liittyvistä sopimuksista saa tietoa esim.
Yhteiskuntatieteellisen
tietoarkiston
sivuilta
http://www.fsd.uta.fi/aineistonhallinta/fi/sopimukset-ja-
oikeudet.html
Monissa yrityksissä työsopimuksessa tekijänoikeudet siirretään työnantajalle, mutta yliopistoissa tällainen
sopimus ei ole yleisesti käytössä. Pitää siis tehdä erilliset siirrot projekti/ tietokanta/ tietokoneohjelmakohtaisesti.
Esim. Tekes-rahoitteisissa projekteissa tehdään oikeuksien siirto yliopistolle
(allekirjoitettu sopimus) projektin alkaessa, koska rahoittaja vaatii, että kaikkien tulosten omistusoikeus pitää
olla yliopistolla (joka voi sitten siirtää oikeuksia esim. yritysosapuolille).
3.2. Tutkimusaineistojen hallinnointi
Tutkimusaineistojen hallinnointia tulisi lähestyä kolmella tasolla
1. Tutkimusaineistojen rekisteröinti
2. Tutkimusaineistojen tallentaminen
3. Tutkimusaineistojen avaaminen.
Nämä toimenpiteet ovat kytkeytyneenä toisiinsa ja tutkijoiden on ratkaistava, mihin he tutkimuksessaan
pyrkivät ja asetettava tavoitteet sen mukaisesti. Toisaalta yliopistoilla ja ulkopuolisilla rahoittajilla on oma
näkemyksensä siitä, miten tutkimuksessa syntyneitä aineistoja käytetään. Seuraavassa käsitellään kolmea
edellämainittua toimenpidettä erikseen.
Tutkimusaineistojen rekisteröinti
Tämä toimenpide on sekä sisällöllisesti että teknisesti helpoin suorittaa eikä vielä velvoita tutkijaa
luovuttamaan aineistojaan kenenkään ulkopuolisen tahon käyttöön. Rekisteröinnistä ei myöskään aiheudu
11
huomattavia kuluja. Toisaalta yliopistolla pitäisi olla kokonaiskuva siitä, mitä tutkimusaineistoja yliopistolla
on, kuka ne omistaa ja mitkä ovat niiden käyttäjäoikeudet.
Yliopistot ovat lähestyneet tätä ongelmaa eri tavoin. Yliopistot voivat laatia omia järjestelmiä, portaaleja,
joihin tutkijat rekisteröivät tutkimusaineistonsa (aihe, laajuus, vastuutaho, rahoittaja, avoimuus ja saatavuus).
Tällainen on mm. Helsingin yliopiston, Aalto-yliopiston ja Lapin yliopiston käyttämä Tuhat-tietokanta. Etsin
(etsin.avointiede.fi) on CSC:n ylläpitämä tutkimusaineistojen hakupalvelu. Palvelussa tutkija voi kuvailla
tuottamansa aineiston ja saada sille pysyvän tunnisteen, jolla aineistoon voi viitata. Etsin kerää
tutkimusaineistojen metatietoja myös
sovituista ulkopuolisista lähteistä.
Kertyneistä
kuvailutiedoista
muodostuu kansallinen tutkimusaineistojen luettelo. Tätä luetteloa voi kuka vain selata ja tehdä siihen
hakuja. Etsimeen ei tallenneta itse aineistoa, mutta kuvailija voi halutessaan tarjota linkin siihen.
Tutkimusaineiston tiedot saa Etsimeen useaa kautta:
1. Tutkija syöttää itse aineistoa kuvailevat tiedot Etsin-palvelussa. Tutkimusorganisaatio voi ohjeistaa
tutkijoitaan toimimaan näin. Organisaatiotason toimijalle voidaan myöntää ylläpito-oikeudet organisaatioon
liitettyihin aineistoihin.
2. Tutkija voi tallentaa aineistojensa tiedot tutkimusorganisaation omaan palveluun. Tällainen voi olla
esimerkiksi tutkimustietojärjestelmä, josta kuvailutiedot voidaan haravoida Etsimeen. Organisaatiota
kehotetaan ehdottamaan niiden toiminnassa syntyvien kuvailutietojen haravointia Etsimeen takaamaan
aineistojen löydettävyyden.
3. Tutkija voi tallentaa aineistonsa tieteenalakohtaiseen tai yleiseen tietoarkistoon, josta kuvailutiedot
haravoidaan Etsimeen. Tällöin aineisto säilyy arkistossa, mutta on löydettävissä Etsimestä. Näin toimitaan jo
muun muassa Yhteiskuntatieteellisen tietoarkiston ja Kielipankin kanssa.
Tutkimusaineistojen tallentaminen
Tutkimusaineistojen tallentaminen on koko datapolitiikan avain. Tietomäärä kasvaa koko ajan ja datan
tallentamisen kustannukset muodostavat huomattavan osa tutkimuskuluista. Tallentamiseen tulisi käyttää
mahdollisuuksien mukaan kansallisten ja kansainvälisten palveluntarjoajien antamat mahdollisuudet, kuten
CSC:n
IDA-palvelu,
Kansallisarkisto,
Suomen
yhteiskuntatieteellinen
tietoarkisto
sekä
ESFRI-
infrastruktuurit. Isoilla tutkimushankkeilla, joiden infrastruktuurit ovat kansallisella tai Euroopan tiekartalla,
on jo toimivat tai rakenteilla olevat järjestelmät sekä rahoitus tutkimusaineistojen säilytykselle ja
hallinnoinnille.
Oulun yliopisto on mukana 12:ssa Suomen Akatemian infrastruktuurien tiekarttahankkeessa. Oulun
yliopiston koordinoimat infrastruktuurihankkeet ovat EISCAT ja EISCAT 3D, INFRAFRONTIER - Euroopan
geenimuunneltujen hiirten analysoinnin, säilyttämisen ja jakelun tutkimusinfrastruktuuri, MAX IV laboratorio sekä eurooppalainen röntgen-vapaaeletroni-laser (XFEL).
Oulun yliopisto on mukana seuraavissa infrastruktuurihankkeissa:
12
Avoin paikkatiedon tutkimusinfrastruktuuri oGIIR, BBMRI -biopankki-infrastruktuuri, Biokeskus Suomi,
CLARIN, EPOS, Euro-BioImaging (EuBI), Instruct, Suomen hila- ja pilvilaskennan infrastruktuuri (FGCI),
Mittag-Leffler Instituutti. Näitä rahoitetaan Suomen Akatemian infrastruktuurirahoituksella, ns. FIRIrahoituksella ja tutkijoiden kannattaa pyrkiä käyttämään näiden tarjoamia tallennuspalveluja mahdollisuuksien
mukaan.
Tämän ns. big datan lisäksi yliopistoilla on paljon tutkimusaineistoja, jotka eivät aihepiiriltään tai kooltaan
sovi näiden suurten tiekarttapalveluiden piiriin. Tällaisten aineistojen tallentamiseen sopivat kansalliset
arkistot, joita ovat mm. IDA, Yhteiskuntatieteellinen tietoarkisto Tampereella, Kansallisarkisto,
Kansalliskirjasto ja luonnontieteelliset museot. Usein tutkimusaineistot täytyy tallentaa instituutin omiin
järjestelmiin, jolloin on ratkaistava rahoitukseen ja priorisointiin liittyvät kysymykset.
Instituuttien
datapolitiikassa tulisi olla ohjeet siitä, miten tutkimusaineistojen ’arvo’ arvioidaan. Arvon määrittämisen
kriteerejä voivat olla esim. aineiston potentiaalinen käyttäjäkunta, tekninen laatu, tieteellinen arvo, avoimuus
ja aineiston laajuus. On myös ohjeistettava, miten tallentamisen vastuu ja kustannukset jakautuvat omistajan
eli yliopiston, tutkimusryhmän johtajan ja rahoittajan välille.
Usein ongelmana on, miten rahoitetaan olemassa olevien kokoelmien ja analogisten aineistojen, kuten
äänitteiden saattaminen säilytettävään ja hallinnoitavaan tilaan. Vastuu näistä on omistajalla eli yliopistolla/
tutkimuslaitoksella. Yliopisto voi järjestää asiantuntija-arvion ja sillä perusteella priorisoida rahoituksen
säilytettäville aineistoille.
Tutkimusaineistojen avaaminen
Tutkimusaineistojen avaaminen on vaativin tutkimusaineistojen hallinnoinnin taso. Tutkijoiden täytyy
’kuratoida’ eli hoitaa aineistonsa niin, että niissä on riittävät metatiedot, niiden omistus ja oikeudet ovat
tiedossa sekä dokumentoituna. Lisäksi aineiston on oltava käyttökelpoisessa muodossa. Suuret
tiederahoittajat kuten EU:n ohjelmat edellyttävät tutkimusaineistojen avaamista, mutta heiltä voi myös anoa
rahoitusta avaamisen kustannusten kattamiseksi. Kansalliset tiedehallinnon toimijat ja useat yliopistot ovat
rakentaneet ’data management – tai kuratointi-keskuksia’, joissa dataa parannetaan ja metatietoja
analysoidaan niin, että data on käyttökelpoisessa ja tallennettavassa muodossa. Tässä työssä ICT-palveluilla,
arkistoilla ja kirjastoilla on keskeinen rooli.
Tiedotus ja koulutus
OKM:n
ATT–hanke
on
aloittanut
Avoimen
tieteen
osaajakoulutuksen,
joka
koostuu
viidestä
kokonaisuudesta: Avoimen tieteen huomiointi tutkimuksen suunnittelussa, Tutkimusaineiston avaaminen,
Avatun tutkimusaineiston hyödyntäminen, Tutkimustuotosten avoin julkaiseminen ja Tutkimusprosessin
avaaminen. Koulutuksesta on talven 2015–2016 aikana kaksi toteutusta.
13
Lisäksi ATT-hankkeessa on meneillään mm. Tuuli-projekti, jonka tavoitteena on kehittää ja ottaa käyttöön
Suomen
tutkimusorganisaatioille
yhteinen
työkalu
datanhallintasuunnitelmien
laadintaan
(https://wiki.helsinki.fi/display/Tuuli/Tuuli-projekti ).
4. Nykytila-analyysi ja palvelut
4.1. Oulun yliopiston tutkimusaineistot – mitä ja kenelle: Nykytilan analyysi esimerkein
Seuraavassa on poimittu eri tieteenaloilta esimerkkejä siitä, miten tutkijat tällä hetkellä hoitavat
tutkimusaineistojensa hallinnointia, tallentamista ja mahdollista avoimuutta.
DNA-sekvenssiaineistot
Organismien
genomeja
koskevien
(http://www.ncbi.nlm.nih.gov/)
tutkimusten
ylläpitämään
DNA-sekvenssiaineistoja
GenBank-,
Dryad-
tallennetaan
(http://datadryad.org/)
tai
NCBI:n
BOLD
datapankkeihin http://www.boldsystems.org/. Tallennus tapahtuu tavallisesti tutkimustulosten julkaisemisen
yhteydessä. Tutkimusartikkelien julkaiseminen yleensä edellyttää aineistojen julkaisemista. Tallennuksen
jälkeen aineistot ovat sieltä avoimesti saatavilla heti
https://www.ncbi.nlm.nih.gov/genbank/ tai pienen
viiveen jälkeen .
Isoja sekvenssidatoja on tallennettuna myös CSC:n (https://www.csc.fi/) palvelimille. Lisäksi bakteerien
sekvenssidataa on tallennettuna European Nucleotide Archive (http://www.ebi.ac.uk/ena) tietopankissa ja
monia eri aineistoja jaossa ResearchGate - järjestelmän (http://www.researchgate.net/) kautta. Muita
tutkimuksessa käytettäviä aineistoja on talletettuna taulukkolaskentaohjelmissa sekä tietokoneilla että
yliopiston varmistetuilla levyasemilla.
Yleensä
DNA-sekvenssipohjaisissa julkaistuissa
tutkimuksissa
aineisto
päätyy ulkomailla
sijaitsevaan
tietokantaan ja on sitä kautta vapaasti käytettävissä. DNA-sekvenssitiedon lisäksi kansainvälinen
tutkimusyhteisö ENCODE ylläpitää laajaa tietokantaa ihmisen genomiikan toiminnallisista elementeistä
(https://genome.ucsc.edu/ENCODE/).
Konenäön tutkimuskeskus(CMV)
CMV:n
aineistot
sijaitsevat
pääasiassa
Oulun
yliopiston
tietotekniikan,
sähkötekniikan
ja
tietoliikennetekniikan osastojen hallinnoimassa keskitetyssä verkko- ja levypalvelinjärjestelmässä. Järjestelmä
tarjoaa käyttäjähallinnan ja pääsyn tallennettuihin tietoihin sekä laskenta- ja varmuuskopiointipalvelun
(kuvaus: http://www.oulu.fi/tietotekniikka/eenet). CMV:n tutkijoiden tallentaman datan määrä on tällä
hetkellä suuruusluokaltaan useita kymmeniä teratavuja (TB) ja se kasvaa koko ajan.
Ryhmän sisällä jokaisella tutkimusryhmän jäsenellä on pääsy yhteiseen verkkohakemistoon, jonne aineistot
tallennetaan. Lähtökohtaisesti kaikilla ryhmän jäsenillä on pääsy kaikkiin tietoihin ja kullakin käyttäjällä on
vastuu oman aineistonsa sisällöstä, mutta tarvittaessa eri käyttäjien oikeuksia aineiston eri osiin voidaan
14
rajoittaa. Käyttäjäoikeuksia hallinnoivat osaston ylläpitohenkilökunta sekä tutkimusryhmien ja projektien
vastuuhenkilöt. Julkisesti jaettava aineisto on nykyisin saatavilla tutkimusryhmän virallisten verkkosivujen
kautta, jotka löytyvät osoitteesta http://www.cse.oulu.fi/CMV/Downloads.
CMV on myös osa Oulu BioImaging (OBI) –verkostoa, jossa tutkimusryhmän tehtävänä on tarjota kuvaanalyysipalveluja eri osapuolille. Tehtävää varten on toteutettu yliopiston infrastruktuurirahoituksella
OMERO web-palvelu (http://cse-pc66.oulu.fi/omero), jonka kautta ulkopuolisten käyttäjien on mahdollista
tallentaa biokuvantamisdataa CMV:n järjestelmään.
Kokoelma-aineistot
Oulun yliopiston Biodiversiteetti -yksikköön kuuluvat Eläin- ja Kasvimuseot kartuttavat ja ylläpitävät
luonnontieteellisiä kokoelmia, jotka koostuvat lähinnä eläin- ja kasvinäytteistä sekä niihin liittyvistä
havaintoaineistoista.
Eläinmuseoiden
kokoelmien
tietoja
on
tallennettu
viimevuosina
liittyen
digitointihankkeisiin. Kokoelmat sijaitsevat eläin- ja kasvimuseoiden kokoelmatiloissa. Kasviaineistoja on
tallennettu
valtakunnalliseen
Luonnontieteellisen
keskusmuseon
ylläpitämään
tietokantaan
jo
vuosikymmeniä. Muita kokoelmia on digitoitu infrastruktuurihankkeissa. Uudet digitoidut aineistot ovat
kokoelman hallintaohjemassa sekä varmuustallennettuna yliopiston palvelimella. Digitoitujen aineistojen
jakaminen tapahtuu vapaasti kansainvälisen Global Biodiversity Facilityn (GBIF) kautta. Kasvitieteellisellä
puutarhalla on lisäksi oma kokoelmatietokanta. Kokoelmien hallinta kehittyy valtakunnallisten FinBIF ja
Lajitietokeskus-hankkeiden myötä ja tallennuksessa siirrytään kohti valtakunnallisesti integroituja
järjestelmiä.
Ekologiset havainto- koe- ja seuranta-aineistot
Ekologisissa tutkimuksissa kerättyjen aineistojen tallennuksessa ja säilyttämisessä on huomattavaa vaihtelua.
Tutkijoilla on hallussaan ja tutkimusyksiköissä talletettuna vanhoja, kuitenkin mahdollisesti arvokkaita
aineistoja, kortistoina, havaintoasiakirjoina ja taulukkolaskentaohjelmiin tallennettuna. Aineistoja on
talletettuna biodiversiteettiyksikössä, kenttäasemilla ja tutkimusryhmillä.
Lisäksi aineistoja tallennettu
Metsähallituksen, ympäristöhallinnon ja sektoritutkimuslaitosten tietokantoihin. Aineistoja on tallennettuna
myös kansainvälisiin tietopankkeihin (esim. European Vegetation Archive). Kansainvälisten tietopankkien
avoin käyttö on määritelty datapolitiikkaohjeissa ja sopimuksissa. Ekologian alan julkaisusarjat enenevässä
määrin edellyttävät koe- tai havaintoaineistojen julkaisemista esimerkiksi Dryad-datapankissa. Ekologisten
aineistojen tallennuksen kehittämiskohteena on häviämisvaarassa olevien arvokkaiden aineistojen digitointi.
Tätä on tehty mm. akatemiahankkeiden yhteydessä.
Learning and Educational Technology Research Unit Let
Raakadataa ja pienehköjä aineistoja (mm. kyselyt, haastattelut) säilytetään yliopiston/tiedekunnan tarjoamilla
jaetuilla verkkolevyillä, joilla ne myös jatkokäsitellään (mm. Excel- ja SPSS tiedostot, liitteroinnit).
15
Datamäärältään suurien aineistojen, erityisesti massiivisten videoaineistojen, jatkosäilytys joudutaan
miettimään tapauskohtaisesti ja esim. supistamaan ja heikentämään datan tarkkuutta sekä hävittämään
alkuperäinen data. Edelleen suhteellisen suuret datamäärät tallennetaan tämän jälkeen yksittäisille ulkoisille
kovalevyille, jotka hankitaan tapauskohtaisesti ja joita aineiston kanssa työskentelevät tutkijat kierrättävät
keskenään. Käytössä on analyysiohjelmia, mm. NVivo & Observer XT Noldus.
Oppimisympäristö LeaForum
LeaForumissa säilytettävä data on tallennettu lokaalille palvelimelle, joka ei ole yleisen verkon/tietohallinnon
piirissä. Datan määrä tällä hetkellä on noin 50 teratavua. Data ei ole nauhavarmennettua, mutta
levyvarmennus on käytössä. Tutkimusdataan pääsy on tällä hetkellä ainoastaan laboratorion toiminnasta
vastaavan henkilön kautta. Tutkimusdata pääasiallisesti siirretään ulkoisilla kiintolevyillä tietoturvasyistä.
Pohjois-Suomen syntymäkohortti
Pohjois-Suomen hyvinvointi- ja terveystutkimusohjelma (www.oulu.fi/nfbc) on pitkittäistutkimusta edustava
väestötason tietoaineisto. Tutkimusohjelman tavoitteena on selvittää miten sikiöaikaisen ja varhaislapsuuden
tekijät vaikuttavat yksilön riskiin pitkäaikaisiin sairauksiin. Aineisto koostuu Pohjois-Suomessa Oulun ja Lapin
lääneissä vuonna 1966 syntyneistä lapsista (N=12058, NFBC1966) ja vuonna 1985/86 syntyneistä lapsista
(N=9432, NFBC1986), sekä heidän vanhemmistaan. Molemmista kohorteista on aineistoa kerätty raskauden
ajasta lähtien ja viimeisin seurantapiste NFBC1966 kohortin osalta on 46-vuotistutkimus vuosina 2012–
2014. Tietoaineisto kattaa sekä laajat kyselytiedot että kliiniset tutkimukset. Niiden lisäksi molemmista
kohorteista on tehty koko genomin kattava analyysi perinnöllisten riskitekijöiden kartoittamiseksi ja
aineistoa on täydennetty lisäksi erilaisilla kansallisilla rekistereillä.
Kohorttiaineistojen ylläpidosta ja aineiston käytön koordinoinnista vastaa keskitetysti Pohjois-Suomen
syntymäkohorttitutkimuksen projektikeskus (Lääketieteellinen tiedekunta, Oulun yliopisto). Aineistoa
säilytetään yliopiston palvelimilla. Lääketieteellisessä tiedekunnassa on lisäksi lukuisia pienempiä väestötason
aineistoja kuten ikääntyvien tutkimukseen kerätyt aineiston vuosina 1935 ja 1945 syntyneistä tai eri
sairauksien
tutkimiseen
kerättyjä
potilas-kontrolli-aineistoja.
Näiden
aineistojen
säilytyksestä
ja
hallinnoinnista vastaavat tutkimusryhmät/tutkijat.
Yksilöistä kerätty data muodostaa ns. arkaluonteisen tietoaineiston, jonka käyttöä ohjaavat mm.
henkilötietolaki sekä tutkittavien tutkimukselle antama suostumus. Pohjois-Suomen syntymäkohortin
aineiston kuvaus on nähtävillä yliopiston verkkosivuilla ja tutkijat voivat hakea aineistoa käyttöönsä
projektikeskuksesta.
Tutkimuslupakäytännöllä varmistetaan aineiston käytön tarkoituksellisuus ja
tutkittavien tietosuoja. Tehtyä tutkimusta seurataan ja tilastoidaan osana käyttölupaprosessia (julkaisut,
väitöskirjat). Tietoaineiston hallintaa ja käyttöön saatavuutta pyritään kehittämään ja parantamaan
esimerkiksi sähköisen lupahakemuksen käyttöönotto, tutkimusaineiston poiminnan ja käyttöympäristön
automatisointi. Aineiston hallinnoinnin ja käytön kuluja katetaan osin palvelumaksuilla, jotka vuonna 2015
16
ovat: rekisteröityminen 50€, käyttölupahakemuksen käsittely 250€ (julkaisulupahakemus 100€), aineiston
poiminta ja yhdistäminen 250€ ja aineiston käyttö Oulun yliopiston ulkopuolelta sopimuskulut (Data
transfer agreement, DTA) 500€.
Saamelainen kulttuuriarkisto
Saamelainen kulttuuriarkisto toimii Oulun yliopiston Giellagas-instituutissa ja on hallinnollisesti osa Oulun
yliopiston keskusarkistoa. Giellagas-instituutti alkoi kehittämään arkistoa 2009.
Arkiston kokoelmat ovat sekä analogisessa että digitaalisessa muodossa. Analogimateriaalia säilytetään
Oulun nauhoitearkiston nauhamakasiinissa (HU136). Varsinainen arkistotila ja digitointihuone sijaitsevat
Giellagas-instituutin yhteydessä (HU324, HU330). Digitaalinen aineisto on kopioituna useille paikallisille
tallenteille (kovalevyt, osittain CD- ja DVD-levyt). Vuoden 2015 aikana koko materiaali tallennetaan LTOnauhoille.
Kokoelma jakautuu seuraaviin osiin: Saamen kieltä ja kulttuuri koskevat äänitteet, videomateriaalit,
valokuvat, kirjalliset dokumentit ja Giellagas-instituutin julkaisut ja opinnäytteet. Arkiston omaa kokoelmaa
täydentävät muiden arkistojen saamenkieliset aineistot. Kokoelman erityisosia ovat Puhutun saamen kielen
korpus (työ aloitettu 2014 yhteistyönä Fin Clarin Kielipankin kanssa) ja saame vieraana kielenä korpus (työ
aloitettu 2015) sekä Áillohaš-kokoelma.
Arkiston oma kokoelma on luetteloitu ja kuvailtu paikalliseen tietokantaan. Arkisto on liittymässä vuoden
2015 aikana myös Oulun yliopiston kirjaston ylläpitämään Oula-tietokantaan, joka tarjoaa näkyvyyden Finnajärjestelmässä sekä Arkistolaitoksen Arkistojen portti-portaaliin. Kokoelmatiedot löytyvät Saamelaisen
kulttuuriarkiston kotisivuilta (http://www.oulu.fi/giellagasinstituutti/saamelainen_kulttuuriarkisto ).
Suomen kielen tutkimusaineistot
Oulun nauhoitearkistossa (ONA) säilytetään opiskelijoiden ja henkilökunnan nauhoittamia tallenteita.
Kokoelmissa on yhteensä yli 7 000 tuntia erilaisia nauhoitteita, joista osa on kopioitu Suomen kielen
nauhoitearkistosta (SKNA). SKNA sisältää nauhoitteiden lisäksi sanasto- ja nimistökokoelmat sekä
korpukset.
Oulun nauhoitearkiston materiaali on kokonaan digitoitu ja tullaan siirtämään osaksi Kielipankin LAT-alustaa
(Language Archiving Technology) vuoden 2015 aikana. Osia aineistosta on myös litteroitu, lisäksi ICLFIkorpus (International Corpus of Learner Finnish) on morfologisesti koodattu sekä lemmatisoitu. Oulun
nauhoitearkisto on kokonaisuudessaan tallennettu useille ulkoisille kiintolevyille sekä tietokoneille
varmuuskopioina.
ONA tullaan siirtämään CSC:n LAT-alustan ohella myös Oulun yliopiston sisäisille verkkolevyille
varmuussäilytykseen. Muuta materiaalia säilytetään suomen kielen oppiaineen arkistotiloissa luetteloituna.
ICLFI-korpus on varmuuskopioitu Kielipankin KORP-palvelun lisäksi yliopiston sisäisille säilytysasemille.
Kielipankki-palvelukokonaisuuden tarjoaa FIN-CLARIN ja kielipankin teknisestä ylläpidosta vastaa CSC
17
yhteistyössä Helsingin yliopiston kanssa. Aineistojen ylläpitäminen vaatii jatkuvaa päivittämistä, suomen
kielen asiantuntemusta sekä perehtymistä teknisiin välineisiin. Aineistojen ylläpito sisältyy yhden lehtorin
työsuunnitelmaan.
Kasvatustieteiden tutkimusaineistot
Aineistot ovat yleensä oman tutkimusryhmän jäsenten ja mahdollisesti yhteistyökumppanien käytettävissä, ja
aineistojen käytöstä sovitaan tutkimusprojektien vetäjien kanssa. Aineiston säilytysmuodot vaihtelevat.
Aineistoja säilytetään mm. tutkijoiden omilla koneilla, verkkolevyillä, ulkoisilla kovalevyillä, muistitikuilla ja
paperisina. Aineistot säilytetään lukollisissa tiloissa. Kasvatustieteiden tiedekunnassa on paljon arkaluonteista
aineistoa ja mm. elämänkerta-aineistoja, lasten havainnointeja, haastatteluaineistoja ja videoaineistoja, joissa
osallistujien anonyymiyden säilyttäminen ei ole mahdollista. Aineistojen luonteen vuoksi suuri osa
aineistoista on sellaisia, että niiden avaaminen avoimeen käyttöön ei ole mahdollista. Tutkimusetiikka
edellyttää, että tutkimusten osallistujien on voitava itse päättää, haluavatko he itseään koskevan aineiston
tulevan avoimeen käyttöön. Kasvatustieteellisen ja psykologisen aineiston kohdalla on myös huomioitava,
että mikäli osallistujilla ei ole mahdollisuutta kieltää itseään koskevan aineiston avointa käyttöä, osallistujien
löytäminen tutkimuksiin saattaa jatkossa muodostua ongelmaksi. Tiedekunnan tutkijat toivovat ohjeistusta
mm. siitä, miten tutkijat voisivat ohjeistaa tutkimusten kohteena olleita henkilöitä päättämään, miten
haluavat aineistojen olevan avoimia.
4.2. Tietohallinnon palvelut tutkijoille
Levytila
Tietohallinto tarjoaa tutkijoiden käyttöön seuraavat levytilat: Kotihakemisto (K), yhteiset levyjaot (S),
tutkimuksen levytila ja Lehmus-laskentapalvelin. Henkilökunnan yhdistetyn Linux/Windows-kotihakemiston
oletuskoko on 5 GB. Kotihakemistosta otetaan joka yö varmuuskopio, jonka säilytysaika on 1 vuosi.
Kotihakemistoon voi tilata lisätilaa tarvittaessa. Tietohallinto tarjoaa ulkopuolisella rahoituksella toimiville
tutkimusryhmille suurien aineistojen tallennuksia varten erillistä levytilaa hintaan 600 € / 1 TB / vuosi.
Laskenta- ja tietokantapalvelut sekä virtuaalipalvelimet
Tutkijoilla on käytettävissään laaja valikoima ohjelmistoja ja laskentaresursseja tieteelliseen laskentaan sekä
ohjelmointitehtäviin. Tarjolla olevat tietokantapalvelut (oracle, mysql, microsoft sql) soveltuvat mm.
taulukkomuotoisen tutkimusdatan käsittelyyn. Lisäksi tutkijat voivat hyödyntää virtuaalipalvelimia esim.
tilanteissa, joissa tutkimusaineiston käsittely vaatii erillisen käyttöliittymän rakentamista.
Avointa tiedettä tukevat palvelut
18
Avointa tiedettä tukevat tietohallinnon palvelut soveltuvat lähinnä digitaalisten aineistojen säilytykseen ja
jakamiseen. Laajempien aineistojen jakamiseen voi käyttää www-palvelua. Wiki tarjoaa helppokäyttöisen
alustan pienemmille aineistoille. Tutkijoiden väliseen yhteistyöhön ja tiedon jakamiseen soveltuvat edellisten
lisäksi myös Oulun yliopiston intranet-palvelun, Notion extranetit. Pian käyttöön otettava o365 ja
mahdollisesti myös Google apps tarjoavat rajattomasti ilmaista tallennustilaa, mutta erilaiset tietoturvaan
sekä aineistojen vapaaseen jakamiseen liittyvät kysymykset voivat rajoittaa kyseisten palveluiden käyttöä
tutkimustyössä. Kuvassa 1 on kuvattuna tietohallinnon tarjoamat palvelut.
Kuva 1. Tietohallinnon avointa tiedettä tukevat palvelut.
19
Tieteen tietotekniikan keskuksen CSC:n palvelut
CSC tarjoaa tutkijoiden käyttöön mm. tietokantapalveluja tutkimustiedon hallintaa varten, avointen
aineistojen julkaisualustan, tutkimuksen tietoaineistojen hakupalvelun ja tutkimusaineiston säilytyspalveluja
(Taulukko 1). Tarjolla on myös opastusta palvelujen käyttäjille. Lisäksi CSC on mukana mm. seuraavien
palveluiden toteutuksessa: PAS, Tuuli ja Tutkimusinfrastruktuurien tietopankki.
Taulukko 1 CSC:n Avointa tiedettä tukevat palvelut. Lähde: http://avointiede.fi/palvelut
Mistä aineistoja löytyy?
Miten aineistoja
hallinnoidaan?
Missä aineistot avataan?
Tutkimusaineistojen turvallinen
Olemassa olevien
tutkimusaiheistojen hakeminen tallennus IDA-tutkimusdatan Omien aineistojen kuvailu Etsin-
Etsin-hakupalvelusta
säilytyspalveluun
Avoimien aiheistojen
hyödyntäminen AVAA-
Kielipankin kielentutkimuksen
julkaisualustan sovellusten ja palvelut kieliaineistoille.
rajapintajakelun kautta
hakupalvelussa
Avointen aineistojen jakelu
AVAA-julkaisualustalla.
Aineistojen lataus Ailapalveluportaalista
Kehitteillä:
Tutkimusinfrastruktuurien
Julkaisuarkistopalvelut Doria ja
tietopankki sekä
Theseus mahdollistavat
datanhallintasuunnitelmatyökalu rinnakkaisjulkaisun
Tuuli
FINTO-sanasto- ja
ontologiapalvelu
Pilotoitavana: Tutkimusten
Suunnitteilla:
tulosten pitkäaikaissaatavuuden Rinnakkaisjulkaisupalvelut ja
takaava PAS-palvelu
avoimen julkaisemisen pilotti
4.3. Kirjaston palvelut tutkijoille
Kirjaston tieteenalakohtaisissa tiedonhakuoppaissa (http://libguides.oulu.fi) on tutkimusvälilehdellä lyhyesti
esiteltynä ja linkitettynä tärkeimmät tutkimusdataan liittyvät oppaat ja palvelut. Lisäksi kirjastossa ollaan
työstämässä avoimen tieteen opasta, joka sisältää ohjeistusta niin avoimen julkaisemisen kuin datankin
osalta.
UNIOGS:in tiedonhankintakurssilla (920003J, Information skills for doctoral students, 1 op) asiaa on lyhyesti
esitelty tohtoriopiskelijoille. Lisäksi kirjasto kouluttaa jatkuvasti tutkijoita erilaisissa tiedon hankintaan ja
julkaisemiseen liittyvissä kysymyksissä.
20
5. Työryhmän tavoitteet ja toimenpide-ehdotukset
Oulun yliopisto pitää hyvinä ja esimerkillisinä UK:n Concordat on Open Research Data periaatteita ja ottaa
ne oman datapolitiikkansa perustaksi. Oulun yliopisto opastaa tutkijoita tutkimusaineistoja hallinnoivien
palvelujen käyttäjiksi ja suuntaa omia ja kannustaa tutkijoita hankkimaan
lisäresursseja avoimuuden
edistämiseen. Tutkimusneuvosto ja tutkimuksen johtoryhmä ovat toimintaa koordinoivat elimet. Kaikkiin
tiedekuntiin ja painoalayksiköihin nimetään tutkimusaineistoista vastaava henkilö. Tutkimuksen tukipalvelut,
kirjasto, arkisto ja tietohallinto opastavat tutkijoita ja järjestävät tarvittavaa koulutusta.
Principle #1
Open access to research data is an enabler of high quality research, a facilitator of innovation and
safeguards good research practice
Tutkimusaineistojen avaaminen edistää korkeatasoista tutkimusta, helpottaa innovaatiotoimintaa ja turvaa
hyviä tutkimuskäytäntöjä.
Principle #2
Good data management is fundamental to all stages of the research process and should be established at
the outset.
Hyvä datanhallinta on välttämätöntä tutkimusprosessien kaikilla tasoilla ja se tulisi varmistaa prosessin alusta
lähtien.
Principle #3
Data must be curated so that they are accessible, discoverable and useable.
Data täytyy hoitaa (kuratoida) niin, että sitä voi päästä käyttämään, se on löydettävissä ja käyttökelpoista.
Principle #4
Open access to research data carries a significant cost, which should be respected by all parties
Tutkimusaineistojen avaaminen tuo huomattavia kustannuksia, mikä täytyy kaikkien osapuolien ottaa
huomioon.
Principle #5
There are sound reasons why the openness of research data may need to be restricted but any restrictions
must be justified and justifiable
On olemassa selkeitä perusteita, miksi tutkimusaineistojen avaamista on tarpeen rajoittaa, mutta näiden
perusteiden täytyy olla oikeutettuja ja toteennäytettävissä.
21
Principle #6
The right of the creators of research data to reasonable first use is recognised.
Tutkimusaineiston perustajien oikeudet sen ensisijaiseen käyttöön täytyy tunnustaa.
Principle #7
Use of others’ data should always conform to legal, ethical and regulatory frameworks including appropriate
acknowledgement.
Muiden tutkijoiden aineistojen käytössä täytyy aina noudattaa asianmukaisia lakeja, eettisiä ohjeita ja
säännöksiä ja ilmoittaa aineiston lähde sitä käytettäessä.
Principle #8
Data supporting publications should be accessible by the publication date and should be in a citeable form.
Julkaisuissa käytetyt aineistot tulisi olla saatavissa julkaisuhetkellä sellaisessa muodossa, että niihin voi viitata.
Tähän Oulun yliopisto esittää varauksen, että tutkijan täytyy saada päättää, ettei dataa avata välittömästi
mikäli siitä on suunnitteilla useita julkaisuja ja aineiston avaaminen vaikeuttaa tätä. Tässäkin tapauksessa
käytetyt aineistot tulisi rekisteröidä niin, että ne saavat pysyvän tunnisteen, jolla niihin voidaan viitata. Lisäksi
aineisto on voitava antaa pyynnöstä julkaisufoorumin tarkasteltavaksi.
Principle #9
Support for the development of appropriate data skills is recognised as a responsibility for all stakeholders.
Kaikkien asianosaisten vastuulla on tukea tutkimusaineistojen tallentamisessa ja avaamisessa tarvittavien
datan käsittelytaitojen kehittämistä.
Principle #10
Regular reviews of progress towards open access to research data should be undertaken.
Tutkimusaineistojen avaamisen edistymistä tulee arvioida säännöllisesti. Tämä arviointi tulee ottaa Oulun
yliopiston laatukäsikirjan osaksi.
Tutkimusyksiköiden tulee määrittää tavoitetila ja toimenpiteet, miten he aikovat toteuttaa
-tutkimusaineistojen rekisteröinnin
-tutkimusaineistojen tallentamisen
-tutkimusaineistojen avaamisen.
Yksikön tutkimusaineistot ja niiden hallinnointi käsitellään tulosneuvotteluissa.
Tutkimusaineistojen rekisteröinti
22
Oulun yliopisto suosittelee, että tutkimusryhmät rekisteröivät aineistonsa. Tutkimusryhmien pitäisi tehdä
priorisointi, mitä rekisteröidään ja ottaa huomioon aineiston arvo ja käyttökelpoisuus. Etusija tulisi antaa
aineistoille, jotka ovat aktiivisesti käytössä. Tutkimusryhmä päättää itsenäisesti ajankohdasta, milloin he
haluavat rekisteröidä tutkimusaineistonsa.
Tutkijoille tulisi jakaa tietoa palveluista, joihin tutkimusaineistoja voi rekisteröidä. Suositellaan CSC:n ETSIN
– palvelun käyttöä.
Tutkimusaineistojen tallentaminen
Oulun
yliopiston
tutkijoilla
ja
tutkimusryhmillä
on
vastuu
tutkimusaineistojen
tallentamisesta.
Tallennuspalveluja tarjoavia toimijoita ovat mm. Oulun yliopiston tietohallinto, Yhteiskuntatieteellinen
tietoarkisto, valtakunnalliset arkistot ja museot, CSC sekä kansainväliset ESFRI-infrastruktuuripalvelut.
Näistä palveluntarjoajista pitäisi jakaa tietoa tutkijoille. Niillä tieteenaloilla, joilla on vakiintuneita
tallennusjärjestelmiä, käytetään niitä. Tiedekuntien tutkimusaineistoista vastaavat henkilöt ohjeistavat uusien
aineistojen tallennuksessa.
Tutkimusaineistojen avaaminen
Oulun yliopisto edellyttää, että tutkimusryhmät päättävät tutkimusaineistojen avaamisesta ottaen huomioon
rahoittajatahon
ohjeistukset.
Yliopistotasolla
tulisi
rakentaa
hallinnointimalli
sekä
keskitetyt
ja
tiedekuntatason palvelujärjestelmät. Näihin palvelujärjestelmiin tulisi liittää neuvonta sopimus- ja
tekijäoikeuksista. Työryhmä näki suositeltavana käyttää mahdollisimman paljon valtakunnallisia, esim. CSC:n
sekä kansainvälisiä ESFRI-infrastruktuurihankkeiden palveluja.
Tutkimusaineistojen avaaminen on vaativin tutkimusaineistojen hallinnoinnin taso. Tutkijoiden täytyy
’kuratoida’ eli hoitaa aineistonsa niin, että niissä on riittävät metatiedot, niiden omistus ja oikeudet ovat
tiedossa sekä dokumentoidut. Lisäksi aineiston on oltava käyttökelpoisessa muodossa. Tässä tutkijoita
täytyy opastaa aineistoihin liittyvistä omistus- ja käyttöoikeuksista. Rahoitusta on mahdollisuuksien mukaan
haettava kansallisilta ja kansainvälisiltä tutkimuksen rahoitusinstrumenteilta.
Tiedotus ja koulutus
Koulutusta on saatavissa valtakunnallisessa ATT-hankkeessa.
Jokaisessa tiedekunnassa tulee olla
tutkimusaineistoista vastaava henkilö, joka osallistuu koulutukseen. Yliopiston sisällä järjestetään jatkuvasti
omaa koulutusta. Tässä Oulun yliopiston kirjasto, tietohallinto, tutkimuksen tukipalvelut ja tutkijakoulu
UniOGS ovat keskeisiä toimijoita.
Tavoitetila 2017:
-Tutkimusaineistojen rekisteröinti ja metatietojen tallennukseen liittyvät prosessit määritelty
-Tutkimusaineistojen tallennus ja hallinnointi otettu osaksi tulosneuvotteluja
23
-Tutkimusaineistojen avaaminen: perusteet määritelty ja edellytykset luotu
-Julkaisujen rinnakkaistallentaminen järjestetty
-Tutkijoiden ohjeistus ja koulutus suunniteltu ja toteutus menossa.