Oulun yliopiston tutkimusrehtorille Oulun yliopiston avoin tiede ja tutkimus – ATT-politiikkaa ja toimintaohjetta valmistelevan työryhmän loppuraportti Opetus- ja kulttuuriministeriö edellyttää yliopistoilta datapolitiikkaa ja toimenpideohjelmaa. Tutkimusneuvosto käsitteli asiaa kokouksessaan 26.2.2015 ja päätti esittää työryhmän perustamista valmistelemaan Oulun yliopiston ATT-politiikkaa ja toimintaohjetta yhteistyössä tutkimusneuvoston kanssa. Työryhmän tulisi ottaa huomioon kansainväliset ja kansalliset ohjeet ja ratkaisut. Tutkimusneuvoston esityksen mukaisesti tutkimusrehtori on nimittänyt 13.3.2015 työryhmään seuraavat jäsenet: Sinikka Eskelinen (pj), Mirka Hintsanen, Kari Keinänen, Riitta Keiski, Päivi Kytömäki, Minna Männikkö ja Risto Virtanen. Työryhmää täydennettiin elokuussa 2015, kun Päivi Kytömäki jäi pois yliopiston palveluksesta ja hänen tilalleen tuli Aila Louhelainen. Työryhmä esitti tutkimusneuvostolle väliraportin kesäkuussa ja esittelee loppuraportin 26.10.2015. Työryhmä on kokoontunut seitsemän kertaa. Työryhmä on tehnyt yliopistojen aineistojen hallinnan nykytila-analyysin esimerkkien avulla ja laatinut ehdotuksen Oulun yliopiston datapolitiikan periaatteista ja ensisijaisista toimenpiteistä sekä esittänyt yliopiston tavoitetilan 2017. Oulussa 15. lokakuuta 2015 Sinikka Eskelinen, pj johtaja Mirka Hintsanen professori 2 Kari Keinänen johtaja Riitta Keiski professori Aila Louhelainen informaatikko Minna Männikkö johtaja Risto Virtanen yli-intendentti Jakelu: rehtori, vararehtorit, yliopiston johtoryhmän jäsenet, tutkimusneuvoston jäsenet, yliopistopalvelujen vastuualuepäälliköt, kirjaston johtaja 3 Oulun yliopiston Avoin tiede ja tutkimus – ATT – politiikkaa ja toiminta-ohjetta valmistelevan työryhmän loppuraportti tutkimusneuvostolle 26.10.2015 ATT – työryhmän jäsenet: Sinikka Eskelinen (pj), Mirka Hintsanen, Kari Keinänen, Riitta Keiski, Päivi Kytömäki, Aila Louhelainen, Minna Männikkö, Risto Virtanen, sihteeri Aija Ryyppö YHTEENVETO Opetus- ja kulttuuriministeriö edellyttää yliopistoilta datapolitiikkaa ja toimenpideohjelmaa. Tutkimusneuvosto käsitteli asiaa kokouksessaan 26.2.2015 ja päätti esittää työryhmän perustamista valmistelemaan Oulun yliopiston ATT-politiikkaa ja toimintaohjetta yhteistyössä tutkimusneuvoston kanssa. Työryhmän tulisi ottaa huomioon kansainväliset ja kansalliset ohjeet ja ratkaisut. Tutkimusneuvoston esityksen mukaisesti tutkimusrehtori on nimittänyt 13.3.2015 työryhmään seuraavat jäsenet: Sinikka Eskelinen (pj), Mirka Hintsanen, Kari Keinänen, Riitta Keiski, Päivi Kytömäki, Minna Männikkö, Risto Virtanen. Työryhmää täydennettiin elokuussa 2015, kun Päivi Kytömäki jäi pois yliopiston palveluksesta ja hänen tilalleen tuli Aila Louhelainen. Työryhmä esitti tutkimusneuvostolle väliraportin kesäkuussa ja esittää loppuraportin 26.10.2015. Työryhmä on kokoontunut seitsemän kertaa. Työryhmä on tehnyt yliopistojen aineistojen hallinnan nykytila-analyysin esimerkkien avulla ja laatinut ehdotuksen Oulun yliopiston datapolitiikan periaatteista ja ensisijaisista toimenpiteistä sekä esittänyt yliopiston tavoitetilan 2017. Oulun yliopisto pitää hyvinä ja esimerkillisinä UK:n Concordat on Open Research Data periaatteita, jotka on laadittu Ison Britannian eri rahoittajien, yliopistojen ja tutkimusinstituuttien muodostaman Open Research Data Forum – konsortion toimesta. Oulun yliopisto on päättänyt ottaa ne oman datapolitiikkansa perustaksi. Lyhyesti - Tutkimusaineistojen avaaminen edistää korkeatasoista tutkimusta, helpottaa innovaatiotoimintaa ja turvaa hyviä tutkimuskäytäntöjä. - Hyvä datanhallinta on välttämätöntä tutkimusprosessien kaikilla tasoilla ja se tulisi varmistaa prosessin alusta lähtien. - Dataa täytyy hoitaa (kuratoida) niin, että sitä voi päästä käyttämään, se on löydettävissä ja käyttökelpoista. - Tutkimusaineistojen avaaminen tuo huomattavia kustannuksia, mikä täytyy kaikkien osapuolien ottaa huomioon. - On olemassa selkeitä perusteita, miksi tutkimusaineistojen avaamista on tarpeen rajoittaa, mutta näiden perusteiden täytyy olla oikeutettuja ja toteennäytettävissä. - Tutkimusaineiston perustajien oikeudet sen ensisijaiseen käyttöön täytyy tunnustaa. - Muiden tutkijoiden aineistojen käytössä täytyy aina noudattaa asianmukaisia lakeja, eettisiä ohjeita ja säännöksiä sekä ilmoittaa aineiston lähde sitä käytettäessä. - Julkaisuissa käytetyt aineistot tulisi olla saatavissa julkaisuhetkellä sellaisessa muodossa, että niihin voi viitata. Tähän Oulun yliopisto esittää varauksen, että tutkijan täytyy saada päättää, ettei dataa avata välittömästi mikäli siitä on suunnitteilla useita julkaisuja ja aineiston avaaminen vaikeuttaa tätä. Tässäkin tapauksessa käytetyt aineistot tulisi rekisteröidä niin, että ne saavat pysyvän tunnisteen, jolla niihin voidaan viitata. Lisäksi aineisto on voitava antaa pyynnöstä julkaisufoorumin tarkasteltavaksi. - Kaikkien asianosaisten vastuulla on tukea tutkimusaineistojen tallentamisessa ja avaamisessa tarvittavien datan käsittelytaitojen kehittämistä. - Tutkimusaineistojen avaamisen edistymistä tulee arvioida säännöllisesti. Tämä arviointi tulee ottaa Oulun yliopiston laatukäsikirjan osaksi. Tutkimusneuvosto ja tutkimuksen johtoryhmä ovat avointa dataa ja tutkimusaineistojen hallinnointia koskevien toimintojen koordinoivat elimet. Kaikkiin tiedekuntiin ja ydinpalveluyksiköihin nimetään tutkimusaineistoista vastaava henkilö. Oulun yliopisto ohjaa tutkijoita tutkimusaineistoja hallinnoivien 4 palvelujen käyttäjiksi ja suuntaa omia ja kannustaa tutkijoita hankkimaan lisäresursseja avoimuuden edistämiseen. Tutkimuksen tukipalvelut, kirjasto, arkisto ja tietohallinto opastavat tutkijoita ja järjestävät tarvittavaa koulutusta. Tutkimusyksiköiden tulee määrittää tavoitetila ja toimenpiteet, miten he aikovat toteuttaa - tutkimusaineistojen rekisteröinnin - tutkimusaineistojen tallentamisen - tutkimusaineistojen avaamisen. Yksikön tutkimusaineistot ja niiden hallinnointi käsitellään tulosneuvotteluissa. Oulun yliopisto edellyttää, että tutkimusryhmät päättävät tutkimusaineistojen avaamisesta ottaen huomioon rahoittajatahon ohjeistukset. Yliopistotasolla tulisi rakentaa hallinnointimalli sekä keskitetyt ja tiedekuntatason palvelujärjestelmät. Näihin palvelujärjestelmiin tulisi liittää neuvonta sopimus- ja tekijäoikeuksista. Oulun yliopisto suosittelee käytettäväksi mahdollisimman paljon valtakunnallisia, esim. CSC:n sekä kansainvälisten ESFRI-infrastruktuurihankkeiden palveluja. Tavoitetila 2017: - Tutkimusaineistojen rekisteröinti ja metatietojen tallennukseen liittyvät prosessit määritelty - Tutkimusaineistojen tallennus ja hallinnointi otettu osaksi tulosneuvotteluja - Tutkimusaineistojen avaamisen perusteet on määritelty ja edellytykset luotu - Julkaisujen rinnakkaistallentaminen järjestetty - Tutkijoiden ohjeistus ja koulutus suunniteltu ja toteutus menossa. 5 1. Johdanto Tiedon hankinta ja tulkinta ovat keskeisiä tutkimuksen toimintatapoja. Tutkijat keräävät aineistoja erilaisissa muodoissa, fysikaalisina aineistoina, nauhoitteina, mittaustietoina, valokuvina jne. Digitalisaation aikakaudella on tullut entistä helpommaksi tallentaa ja jakaa tietoja ja aineistoja toisille tutkijoille ja suurelle yleisölle. Uuden tekniikan avaamat mahdollisuudet ovat synnyttäneet pohdintaa siitä, miten saataisiin paremmin talletetuksi ja avatuksi uudelleen käyttöön. tutkimusaineistot Poliittisten päättäjien ja suuren yleisön taholta on kasvanut vaatimus julkisella rahoituksella hankitun tiedon ja aineistojen avaamiseksi kansainvälisen tutkijayhteisön ja tiedon hyödyntäjien saataville. Suuret tiederahoittajat USA:ssa, Euroopassa ja monissa muissa maissa ovat jo tehneet rahoituksen saamisen yhdeksi ehdoksi tutkimusdatan tallettamisen julkisiin arkistoihin ja niiden mahdollisimman laajan avaamisen tutkijayhteisön käyttöön. Samanaikainen pyrkimys turvata ihmisten yksityisyys ja mahdollisuus tutkimustulosten kaupalliseen hyödyntämiseen on luonut tarpeen datapolitiikan ohjeistuksesta, miten nämä näennäisesti vastakkaiset pyrkimykset sovitetaan yhteen. Suomessa tätä työtä ohjaa Opetus- ja kulttuuriministeriön Avoimen tieteen ja tutkimuksen ATT-hanke. Oulun yliopiston ATT- ohjeistus on osa tätä pyrkimystä sovittaa yhteen tieteen avoimuuden vaatimukset ja tutkijan oikeudet sekä tavoite turvata yksilön yksityisyyden suoja kaikissa tilanteissa. Tutkimusaineistojen avaamiselle on asetettu suuria toiveita siitä, miten avoimuus synnyttäisi uusia innovatiivisia tutkimusaloja, edistäisi taloudellista kasvua ja parantaisi tutkijoiden sekä tieteen julkista kuvaa. Tutkimusaineistojen avaamisella tavoitellaan myös huomattavia kustannussäästöjä, kun samaa dataa voidaan tarkastella useasta näkökulmasta ja yhdistellä erilaisia tietoaineistoja uusien oivallusten perustaksi. Avoimet tutkimusaineistot toimivat myös tutkimuksen laadun takaajana. Muut tutkijat voivat tarkastella julkaisuissa esitettyjä tietoja ja todentaa johtopäätösten oikeellisuuden. Tutkimusaineistojen tallentaminen julkisiin arkistoihin ja niiden avaaminen asettaa tutkimusinstituutioille ja hallinnolle uusia vaatimuksia. Suurin haaste on valtavan datan määrän tallentaminen ja saattaminen tutkijoiden käyttöön hallitusti, niin että se säilyy ja myös oman tutkijayhteisön ulkopuoliset tutkijat voivat sitä käyttää. Datan tervehdyttäminen, kuratointi (data curating), on kallista ja aikaa vievää, ja sen kustannusten kattaminen oikeudenmukaisesti on kansainvälisten sekä kansallisten tiedehallinnon päättäjien lähiajan tärkeimpiä tehtäviä. Kustannusten kohdentaminen ja tutkijoiden motivointi datan avaamiseen liittyvät kiinteästi toisiinsa. Kansainväliset rahoittajat hyväksyvät datan avaamisen ja kuratoinnin kulut rahoituskustannuksiin ja samalla vaativat, että tulokset ovat avoimesti saatavissa. Positiivisten kannustimien löytäminen tutkijoiden motivoimiseksi on yliopistotason datapolitiikan tärkeitä tehtäviä. Avoimuus toteutuu vain yksittäisten tutkijoiden innostuksen ja motivaation kautta. On luotava mekanismit, miten tutkijat voivat ansioitua tutkimusaineistojen avaamisesta ja nostettava esiin, miten tutkijat ja instituutit voivat 6 profiloitua ja saada tunnettavuutta avoimien aineistojen avulla. Tässä tarvitaan tutkijayhteisön kulttuurin muutosta. 2. Datapolitiikkaa Yliopisto – Universitas on tutkijoiden yhteisö, jossa tutkimusta tekevät oppineet keräävät tietoa, jäsentävät sitä, luovat uusia kokonaisuuksia ja tarjoavat tuloksensa muiden tutkijoiden arvioitavaksi sitten kun katsovat ajan olevan sopiva. Samanaikaisesti kansainväliset ja kansalliset rahoittajat ovat esittäneet yhä tiukemmin vaatimuksen tutkijoiden tutkimusaineistojen ja tutkimustulosten avaamisesta sekä järjestämisestä muiden tutkijoiden ja päättäjien käytettäväksi. Tutkijoita sitovat erilaiset lupamenettelyt ja rahoittajien vaatimukset. Samanaikaisesti tutkijoiden tulisi saada toteuttaa akateemista vapaata tutkimusta. Kaiken tämän varmistamiseksi tarvitaan tiedepolitiikkaa sekä datapolitiikkaa. Kansainväliset, kansalliset ja institutionaaliset tutkimusorganisaatiot ovat laatineet periaatteita ja ohjeistusta tutkimusaineistojen avaamiseksi. Seuraavassa esitellään lyhyesti Suomen opetus- ja kulttuuriministeriön ATT-hankkeen, Ison Britannian tutkimusrahoittajien ja Helsingin yliopiston suositukset. Myös Jyväskylän yliopisto on hyväksynyt oman datapolitiikkansa ja antanut ohjeistuksen sen edistämiseksi. 2.1. OKM:n Avoin tiede ja tutkimus ATT - hanke http://avointiede.fi/ Avoin tiede ja tutkimus -hanke on OKM:n vuonna 2014 käynnistämä hanke tiedon saatavuuden ja avoimen tieteen edistämiseksi. Tavoitteena on, että vuoteen 2017 mennessä Suomi nousee yhdeksi johtavista maista tieteen ja tutkimuksen avoimuudessa ja että avoimen tieteen mahdollisuudet hyödynnetään laajasti yhteiskunnassa. www.avointiede.fi ATT-hanke pohjautuu laajapohjaiseen ministeriöiden, korkeakoulujen, tutkimuslaitosten ja tutkimusrahoittajien yhteistyöhön. Hankkeen toteutuksesta vastaavat strategiaryhmä sekä asiantuntijaryhmä. Asiantuntijaryhmä edistää käytännössä avoimen tieteen ja tutkimuksen palvelujen tuottajien ja käyttäjien vuoropuhelua, ohjaa tarvittavien työryhmien työtä sekä kokonaisarkkitehtuurityötä ja järjestää tarvittavia työpajoja ja täsmäselvityksiä. Täsmäselvityksiä on tehty ja meneillään useammissa työryhmissä (http://avointiede.fi/työryhmät) mm. julkaisujen avoimen saatavuuden edistämisestä, tietomalleista, oikeuksien hallinnasta sekä vaikuttavuudesta. Hankkeen alla on meneillään myös projekteja, kuten yhtenäisen Tuuli-aineistonhallintasuunnitelmatyökalun kehittäminen. OKM rahoittaa ATT-hanketta useilla miljoonilla euroilla. Sen puitteissa toimii useita työryhmiä, mm. tutkimusaineistojen pitkäaikaissäilytystä pohtiva työryhmä. ATT-hankkeessa on laadittu avoimen tieteen käsikirja, jossa on laajasti ohjeita sekä tutkijoille, tutkimushallinnolle, arkistojen ylläpitäjille ja myös kirjastoille. ATT-hanke ei ole yliopistoja velvoittava, mutta OKM seuraa tarkasti, miten yliopistot edistävät ja rakentavat valmiuksia toteuttaa tutkimusaineistojen avaamista (http://avointiede.fi/www-kasikirja). 7 Käsikirjassa ja ATT-verkkosivuilla on runsaasti tietoa CSC:n, Kansalliskirjaston ja muiden palvelun tarjoajien järjestelmistä ja ohjeita, miten tutkimusaineistoja voi tallentaa ja hallinnoida sekä avata muiden tutkijoiden käyttöön. 2.2. Concordat On Open Research Data by RCUK The Concordat on Open Research Data has been developed under the auspices of the Open Research Data Forum by a multi-stakeholder working group, which includes RCUK, JISC, the Wellcome Trust and Universities UK. The concordat aims to help to ensure that the research data gathered and generated by members of the UK research community is made openly available for use by others wherever possible in a manner consistent with relevant legal, ethical and regulatory frameworks and norms. The concordat aims to establish a set of expectations of good practice with the intention of establishing open research data as the desired position for publicly-funded research over the long-term. It recognises the different responsibilities of researchers, their employers, and funders of research, however, it is not the intention of the concordat to mandate, codify or require specific activities. http://www.rcuk.ac.uk/research/opendata/ Principle #1 Open access to research data is an enabler of high quality research, a facilitator of innovation and safeguards good research practice Principle #2 Good data management is fundamental to all stages of the research process and should be established at the outset. Principle #3 Data must be curated so that they are accessible, discoverable and useable. Principle #4 Open access to research data carries a significant cost, which should be respected by all parties Principle #5 There are sound reasons why the openness of research data may need to be restricted but any restrictions must be justified and justifiable Principle #6 The right of the creators of research data to reasonable first use is recognised. Principle #7 Use of others’ data should always conform to legal, ethical and regulatory frameworks including appropriate acknowledgement. Principle #8 Data supporting publications should be accessible by the publication date and should be in a citeable form. 8 Principle #9 Support for the development of appropriate data skills is recognised as a responsibility for all stakeholders. Principle #10 Regular reviews of progress towards open access to research data should be undertaken. 2.3. Helsingin yliopiston datapolitiikan periaatteet Helsingin yliopiston tutkimusdatapolitiikka[1] 1. Helsingin yliopistossa opetetaan ja noudatetaan hyvää aineistonhallintatapaa. Jokainen yliopistoyhteisön jäsen on vastuussa hyvän aineistonhallintatavan noudattamisesta. 2. Jokaisen yliopistolaisen on noudatettava tutkimuseettisiä ohjeita tutkimusaineistojen ja -datan hallinnassa ja avaamisessa sekä huolehdittava luottamuksellisten tietojen suojaamisesta, tietoturvasta ja tietosuojasta lainsäädännön, hyvän tieteellisen käytännön sekä yliopiston antamien ohjeiden ja määräysten mukaisesti. 3. Helsingin yliopisto sisällyttää tutkimusaineisto-osaamisen tutkijoiden perehdytykseen sekä ottaa tämän osaamisen huomioon akateemisessa ansioitumisessa. Tiedekunnat ja laitokset sekä vastuulliset tutkijat vastaavat opiskelijoiden ja tutkimushenkilöstön perehdyttämisestä hyvään aineistonhallintatapaan. 4. Helsingin yliopisto tarjoaa koulutusta ja tukea aineistonhallintasuunnitelmien laatimiseen sekä datanhallintaan tutkimuksen elinkaaren ajan. Koulutusta tarjotaan sekä opintojen osana että henkilöstökoulutuksena. 5. Helsingin yliopisto tarjoaa tutkijoille ja tutkimusryhmille tutkimusdatainfrastruktuurin, joka käsittää datan hallintaa, käyttöä, löytyvyyttä ja jakamista tukevia työvälineitä, palveluita sekä tallennus-, laskenta- ja käsittelykapasiteettia. Datainfrastruktuuri rakennetaan ja sitä kehitetään yhteistyössä kansallisten ja kansainvälisten toimijoiden kanssa, ottaen huomioon myös näiden tarjoamat palvelut ja infrastruktuurit. 6. Helsingin yliopisto tarjoaa tukea tutkimusaineistoihin liittyvien oikeudellisten kysymysten tunnistamiseen ja ratkaisemiseen. Vastuulliset tutkijat vastaavat siitä, että tutkimuksessa syntyvien aineistojen omistus- ja käyttöoikeuksia koskevat sopimukset tehdään mahdollisimman varhaisessa vaiheessa, soveltuvin osin ennen tutkimushankkeen alkua. 7. Rahoitushakemuksiin liitettävissä aineistonhallintasuunnitelmissa on otettava huomioon aineiston ja datan kerääminen, käsittely, omistajuus ja käyttöoikeudet, (pitkäaikais)säilytys, uudelleenkäyttö ja julkaiseminen, suunnitelmallinen tuhoaminen sekä erityisesti niiden vaatimat resurssitarpeet. Tutkimusaineistojen metadatassa on mainittava tutkimusdatan omistaja ja oikeudelliset rajoitukset tutkimusaineistojen käytölle. Henkilötietojen ja muiden arkaluontoisten aineistojen käsittely ja säilyttäminen on otettava huomioon aineistonhallintasuunnitelmassa. 8. Helsingin yliopiston piirissä tuotettu, julkaistuihin tutkimustuloksiin liitetty tutkimusdata on lähtökohtaisesti yhteiskäyttöistä ja avointa. Aineiston löydettävyydestä ja viitattavuudesta on huolehdittava. Aineistojen käytön yhteydessä tutkimusaineistojen tekijät on mainittava hyvän tavan mukaisesti ja Helsingin yliopisto on mainittava tutkimusaineistojen lähteenä. Elinkeinoelämän ja yhteiskunnan toimijoiden käyttöön jalostetuista datakokonaisuuksista voidaan periä korvaus. 9 [1] Tutkimusdatapolitiikka koskee tutkimushankkeissa tuotettavia, käytettäviä ja muokattavia digitaalisia tutkimusaineistoja eli tutkimusdataa. Tutkimusdatapolitiikan ulkopuolelle on rajattu fyysiset aineistot, joihin tutkimusdata perustuu (esim. paperiaineistot) sekä biologisen tutkimusmateriaalin käyttö. Tutkimustoiminnassa syntyvien asiakirjojen ja aineistojen säilytystä ohjaavat asiakirjojen säilytysohje eli arkistonmuodostussuunnitelma (2013) ja yliopistojen yhteistyönä laadittu tutkimusaineistojen säilytyskriteeristö (Tutkimustoiminta. Asiakirjat, aineistot, dokumentointi. Helsinki 1997). Biologisen materiaalin käyttöä tutkimuksessa ohjaa erillinen lainsäädäntö sekä lupakäytännöt. © 2015 Helsingin yliopisto, lisensoitu Creative Commons Nimeä 4.0 Kansainvälinen -käyttöluvalla. Ison Britannian ja Helsingin yliopiston teksteissä on näkökulmaero: Concordat antaa enemmän velvoitteita instituutioille ja Helsingin yliopiston ohjeistaa enemmän tutkijoita avoimen tiedon toteuttamiseen. 3. Tutkimusaineistojen avaamisen reunaehtoja 3.1. Tutkimukseen tarvittavat luvat, oikeudet ja sopimukset Luvat Usein tutkimusaineistojen hankkimiseen tarvitaan viranomaislupa ja lupahakemuksessa edellytetään myös kuvausta aineiston tallettamisesta, saatavuudesta sekä hävittämisestä. Tutkimus on luvanvaraista kun -ihmistieteissä tutkitaan potilaita tai ala-ikäisiä lapsia ja nuoria - käytetään koe-eläimiä - käytetään geenimuunneltuja organismeja - tutkimuksia tehdään luonnonsuojelualueilla tai ne koskevat uhanalaisia tai rauhoitettuja lajeja. Eettiset toimikunnat, geenitekniikan laitos ja ympäristöhallinto käsittelevät luvanvaraiset tutkimuskysymykset. Aikuisten ihmisten haastatteluihin ei yleensä tarvita lupaa, mutta usein luodaan henkilörekisteri, jolloin on noudatettava henkilörekisterilakia. Haastatteluihin voi liittyä tekijänoikeuksia, joita voi olla sekä haastateltavalla että haastattelijalla. Haastattelujen käytöstä on aina sovittava. Haastateltavalta on saatava riittävän laajat käyttöoikeudet, mutta henkilötietolain näkökulmasta laajan suostumuksen saaminen voi olla ongelmallista. Oikeudet Aineistojen omistusoikeus on erilainen riippuen siitä, millaisesta aineistosta puhutaan. Fyysiset materiaalit, mm. biologiset materiaalit kuuluvat yliopistolle (vasta-aineet, hiiret, kivet, kemikaalit jne.), mutta valokuvat ylittävät usein teoskynnyksen, jolloin omistus on niiden ottajalla. Samaan kategoriaan kuuluvat esim. 10 piirustukset ja itsetehdyt kartat. Tietokoneohjelmien ja tietokantojen (suojattu tekijänoikeudella) oikeudet kuuluvat tekijälle, jollei oikeuksia ole erikseen siirretty yliopistolle. Tekijänoikeudella suojatun aineiston (esim. haastattelut, valokuvat, tietokoneohjelmat ja tietokannat) omistus kuuluu lähtökohtaisesti niiden tekijälle/tekijöille, ja heidän pitäisi tehdä vapaaehtoinen oikeuksiensiirto yliopistolle, jotta aineistoa voidaan käyttää jatkossakin yliopiston tutkimuksiin. On tärkeää selvittää, miten tämä hoidetaan. Jos yliopistolle siirretään kaikki oikeudet aineistoihin, on huolehdittava siitä, että tutkija voi paikkaa vaihtaessaan hyödyntää omia aineistojaan myös myöhemmässä tutkimuksessa. Kerättyihin aineistoihin voi liittyä myös kolmansien osapuolten oikeuksia, esim. tekijänoikeuksia. Oikeudenhaltijoita pitää saada riittävän laajat käyttöoikeudet tutkimusaineistojen käyttöön. Yliopisto voi arkistona digitoida aineistoja, vaikka niihin liittyisi tekijänoikeuksia, mutta jos näitä tekijänoikeuden alaisia digitoituja aineistoja halutaan levittää muiden käytettäväksi, ei sitä voida tehdä ilman oikeudenhaltijoiden lupaa. On selvitettävä, miten luvat hankitaan. Esimerkiksi yliopisto voi neuvotella tekijänoikeusjärjestöjen kanssa sopimuslisenssin. Toisaalta aineiston säilyttäjältä edellytetään teknisiä valmiuksia erotella, kenen käytettäväksi aineistot tulevat, jotta oikeudenhaltijat ovat valmiita hyväksymään sopimuslisenssin. Teossuojasta ja aineistojen keräämiseen ja hallintaan liittyvistä sopimuksista saa tietoa esim. Yhteiskuntatieteellisen tietoarkiston sivuilta http://www.fsd.uta.fi/aineistonhallinta/fi/sopimukset-ja- oikeudet.html Monissa yrityksissä työsopimuksessa tekijänoikeudet siirretään työnantajalle, mutta yliopistoissa tällainen sopimus ei ole yleisesti käytössä. Pitää siis tehdä erilliset siirrot projekti/ tietokanta/ tietokoneohjelmakohtaisesti. Esim. Tekes-rahoitteisissa projekteissa tehdään oikeuksien siirto yliopistolle (allekirjoitettu sopimus) projektin alkaessa, koska rahoittaja vaatii, että kaikkien tulosten omistusoikeus pitää olla yliopistolla (joka voi sitten siirtää oikeuksia esim. yritysosapuolille). 3.2. Tutkimusaineistojen hallinnointi Tutkimusaineistojen hallinnointia tulisi lähestyä kolmella tasolla 1. Tutkimusaineistojen rekisteröinti 2. Tutkimusaineistojen tallentaminen 3. Tutkimusaineistojen avaaminen. Nämä toimenpiteet ovat kytkeytyneenä toisiinsa ja tutkijoiden on ratkaistava, mihin he tutkimuksessaan pyrkivät ja asetettava tavoitteet sen mukaisesti. Toisaalta yliopistoilla ja ulkopuolisilla rahoittajilla on oma näkemyksensä siitä, miten tutkimuksessa syntyneitä aineistoja käytetään. Seuraavassa käsitellään kolmea edellämainittua toimenpidettä erikseen. Tutkimusaineistojen rekisteröinti Tämä toimenpide on sekä sisällöllisesti että teknisesti helpoin suorittaa eikä vielä velvoita tutkijaa luovuttamaan aineistojaan kenenkään ulkopuolisen tahon käyttöön. Rekisteröinnistä ei myöskään aiheudu 11 huomattavia kuluja. Toisaalta yliopistolla pitäisi olla kokonaiskuva siitä, mitä tutkimusaineistoja yliopistolla on, kuka ne omistaa ja mitkä ovat niiden käyttäjäoikeudet. Yliopistot ovat lähestyneet tätä ongelmaa eri tavoin. Yliopistot voivat laatia omia järjestelmiä, portaaleja, joihin tutkijat rekisteröivät tutkimusaineistonsa (aihe, laajuus, vastuutaho, rahoittaja, avoimuus ja saatavuus). Tällainen on mm. Helsingin yliopiston, Aalto-yliopiston ja Lapin yliopiston käyttämä Tuhat-tietokanta. Etsin (etsin.avointiede.fi) on CSC:n ylläpitämä tutkimusaineistojen hakupalvelu. Palvelussa tutkija voi kuvailla tuottamansa aineiston ja saada sille pysyvän tunnisteen, jolla aineistoon voi viitata. Etsin kerää tutkimusaineistojen metatietoja myös sovituista ulkopuolisista lähteistä. Kertyneistä kuvailutiedoista muodostuu kansallinen tutkimusaineistojen luettelo. Tätä luetteloa voi kuka vain selata ja tehdä siihen hakuja. Etsimeen ei tallenneta itse aineistoa, mutta kuvailija voi halutessaan tarjota linkin siihen. Tutkimusaineiston tiedot saa Etsimeen useaa kautta: 1. Tutkija syöttää itse aineistoa kuvailevat tiedot Etsin-palvelussa. Tutkimusorganisaatio voi ohjeistaa tutkijoitaan toimimaan näin. Organisaatiotason toimijalle voidaan myöntää ylläpito-oikeudet organisaatioon liitettyihin aineistoihin. 2. Tutkija voi tallentaa aineistojensa tiedot tutkimusorganisaation omaan palveluun. Tällainen voi olla esimerkiksi tutkimustietojärjestelmä, josta kuvailutiedot voidaan haravoida Etsimeen. Organisaatiota kehotetaan ehdottamaan niiden toiminnassa syntyvien kuvailutietojen haravointia Etsimeen takaamaan aineistojen löydettävyyden. 3. Tutkija voi tallentaa aineistonsa tieteenalakohtaiseen tai yleiseen tietoarkistoon, josta kuvailutiedot haravoidaan Etsimeen. Tällöin aineisto säilyy arkistossa, mutta on löydettävissä Etsimestä. Näin toimitaan jo muun muassa Yhteiskuntatieteellisen tietoarkiston ja Kielipankin kanssa. Tutkimusaineistojen tallentaminen Tutkimusaineistojen tallentaminen on koko datapolitiikan avain. Tietomäärä kasvaa koko ajan ja datan tallentamisen kustannukset muodostavat huomattavan osa tutkimuskuluista. Tallentamiseen tulisi käyttää mahdollisuuksien mukaan kansallisten ja kansainvälisten palveluntarjoajien antamat mahdollisuudet, kuten CSC:n IDA-palvelu, Kansallisarkisto, Suomen yhteiskuntatieteellinen tietoarkisto sekä ESFRI- infrastruktuurit. Isoilla tutkimushankkeilla, joiden infrastruktuurit ovat kansallisella tai Euroopan tiekartalla, on jo toimivat tai rakenteilla olevat järjestelmät sekä rahoitus tutkimusaineistojen säilytykselle ja hallinnoinnille. Oulun yliopisto on mukana 12:ssa Suomen Akatemian infrastruktuurien tiekarttahankkeessa. Oulun yliopiston koordinoimat infrastruktuurihankkeet ovat EISCAT ja EISCAT 3D, INFRAFRONTIER - Euroopan geenimuunneltujen hiirten analysoinnin, säilyttämisen ja jakelun tutkimusinfrastruktuuri, MAX IV laboratorio sekä eurooppalainen röntgen-vapaaeletroni-laser (XFEL). Oulun yliopisto on mukana seuraavissa infrastruktuurihankkeissa: 12 Avoin paikkatiedon tutkimusinfrastruktuuri oGIIR, BBMRI -biopankki-infrastruktuuri, Biokeskus Suomi, CLARIN, EPOS, Euro-BioImaging (EuBI), Instruct, Suomen hila- ja pilvilaskennan infrastruktuuri (FGCI), Mittag-Leffler Instituutti. Näitä rahoitetaan Suomen Akatemian infrastruktuurirahoituksella, ns. FIRIrahoituksella ja tutkijoiden kannattaa pyrkiä käyttämään näiden tarjoamia tallennuspalveluja mahdollisuuksien mukaan. Tämän ns. big datan lisäksi yliopistoilla on paljon tutkimusaineistoja, jotka eivät aihepiiriltään tai kooltaan sovi näiden suurten tiekarttapalveluiden piiriin. Tällaisten aineistojen tallentamiseen sopivat kansalliset arkistot, joita ovat mm. IDA, Yhteiskuntatieteellinen tietoarkisto Tampereella, Kansallisarkisto, Kansalliskirjasto ja luonnontieteelliset museot. Usein tutkimusaineistot täytyy tallentaa instituutin omiin järjestelmiin, jolloin on ratkaistava rahoitukseen ja priorisointiin liittyvät kysymykset. Instituuttien datapolitiikassa tulisi olla ohjeet siitä, miten tutkimusaineistojen ’arvo’ arvioidaan. Arvon määrittämisen kriteerejä voivat olla esim. aineiston potentiaalinen käyttäjäkunta, tekninen laatu, tieteellinen arvo, avoimuus ja aineiston laajuus. On myös ohjeistettava, miten tallentamisen vastuu ja kustannukset jakautuvat omistajan eli yliopiston, tutkimusryhmän johtajan ja rahoittajan välille. Usein ongelmana on, miten rahoitetaan olemassa olevien kokoelmien ja analogisten aineistojen, kuten äänitteiden saattaminen säilytettävään ja hallinnoitavaan tilaan. Vastuu näistä on omistajalla eli yliopistolla/ tutkimuslaitoksella. Yliopisto voi järjestää asiantuntija-arvion ja sillä perusteella priorisoida rahoituksen säilytettäville aineistoille. Tutkimusaineistojen avaaminen Tutkimusaineistojen avaaminen on vaativin tutkimusaineistojen hallinnoinnin taso. Tutkijoiden täytyy ’kuratoida’ eli hoitaa aineistonsa niin, että niissä on riittävät metatiedot, niiden omistus ja oikeudet ovat tiedossa sekä dokumentoituna. Lisäksi aineiston on oltava käyttökelpoisessa muodossa. Suuret tiederahoittajat kuten EU:n ohjelmat edellyttävät tutkimusaineistojen avaamista, mutta heiltä voi myös anoa rahoitusta avaamisen kustannusten kattamiseksi. Kansalliset tiedehallinnon toimijat ja useat yliopistot ovat rakentaneet ’data management – tai kuratointi-keskuksia’, joissa dataa parannetaan ja metatietoja analysoidaan niin, että data on käyttökelpoisessa ja tallennettavassa muodossa. Tässä työssä ICT-palveluilla, arkistoilla ja kirjastoilla on keskeinen rooli. Tiedotus ja koulutus OKM:n ATT–hanke on aloittanut Avoimen tieteen osaajakoulutuksen, joka koostuu viidestä kokonaisuudesta: Avoimen tieteen huomiointi tutkimuksen suunnittelussa, Tutkimusaineiston avaaminen, Avatun tutkimusaineiston hyödyntäminen, Tutkimustuotosten avoin julkaiseminen ja Tutkimusprosessin avaaminen. Koulutuksesta on talven 2015–2016 aikana kaksi toteutusta. 13 Lisäksi ATT-hankkeessa on meneillään mm. Tuuli-projekti, jonka tavoitteena on kehittää ja ottaa käyttöön Suomen tutkimusorganisaatioille yhteinen työkalu datanhallintasuunnitelmien laadintaan (https://wiki.helsinki.fi/display/Tuuli/Tuuli-projekti ). 4. Nykytila-analyysi ja palvelut 4.1. Oulun yliopiston tutkimusaineistot – mitä ja kenelle: Nykytilan analyysi esimerkein Seuraavassa on poimittu eri tieteenaloilta esimerkkejä siitä, miten tutkijat tällä hetkellä hoitavat tutkimusaineistojensa hallinnointia, tallentamista ja mahdollista avoimuutta. DNA-sekvenssiaineistot Organismien genomeja koskevien (http://www.ncbi.nlm.nih.gov/) tutkimusten ylläpitämään DNA-sekvenssiaineistoja GenBank-, Dryad- tallennetaan (http://datadryad.org/) tai NCBI:n BOLD datapankkeihin http://www.boldsystems.org/. Tallennus tapahtuu tavallisesti tutkimustulosten julkaisemisen yhteydessä. Tutkimusartikkelien julkaiseminen yleensä edellyttää aineistojen julkaisemista. Tallennuksen jälkeen aineistot ovat sieltä avoimesti saatavilla heti https://www.ncbi.nlm.nih.gov/genbank/ tai pienen viiveen jälkeen . Isoja sekvenssidatoja on tallennettuna myös CSC:n (https://www.csc.fi/) palvelimille. Lisäksi bakteerien sekvenssidataa on tallennettuna European Nucleotide Archive (http://www.ebi.ac.uk/ena) tietopankissa ja monia eri aineistoja jaossa ResearchGate - järjestelmän (http://www.researchgate.net/) kautta. Muita tutkimuksessa käytettäviä aineistoja on talletettuna taulukkolaskentaohjelmissa sekä tietokoneilla että yliopiston varmistetuilla levyasemilla. Yleensä DNA-sekvenssipohjaisissa julkaistuissa tutkimuksissa aineisto päätyy ulkomailla sijaitsevaan tietokantaan ja on sitä kautta vapaasti käytettävissä. DNA-sekvenssitiedon lisäksi kansainvälinen tutkimusyhteisö ENCODE ylläpitää laajaa tietokantaa ihmisen genomiikan toiminnallisista elementeistä (https://genome.ucsc.edu/ENCODE/). Konenäön tutkimuskeskus(CMV) CMV:n aineistot sijaitsevat pääasiassa Oulun yliopiston tietotekniikan, sähkötekniikan ja tietoliikennetekniikan osastojen hallinnoimassa keskitetyssä verkko- ja levypalvelinjärjestelmässä. Järjestelmä tarjoaa käyttäjähallinnan ja pääsyn tallennettuihin tietoihin sekä laskenta- ja varmuuskopiointipalvelun (kuvaus: http://www.oulu.fi/tietotekniikka/eenet). CMV:n tutkijoiden tallentaman datan määrä on tällä hetkellä suuruusluokaltaan useita kymmeniä teratavuja (TB) ja se kasvaa koko ajan. Ryhmän sisällä jokaisella tutkimusryhmän jäsenellä on pääsy yhteiseen verkkohakemistoon, jonne aineistot tallennetaan. Lähtökohtaisesti kaikilla ryhmän jäsenillä on pääsy kaikkiin tietoihin ja kullakin käyttäjällä on vastuu oman aineistonsa sisällöstä, mutta tarvittaessa eri käyttäjien oikeuksia aineiston eri osiin voidaan 14 rajoittaa. Käyttäjäoikeuksia hallinnoivat osaston ylläpitohenkilökunta sekä tutkimusryhmien ja projektien vastuuhenkilöt. Julkisesti jaettava aineisto on nykyisin saatavilla tutkimusryhmän virallisten verkkosivujen kautta, jotka löytyvät osoitteesta http://www.cse.oulu.fi/CMV/Downloads. CMV on myös osa Oulu BioImaging (OBI) –verkostoa, jossa tutkimusryhmän tehtävänä on tarjota kuvaanalyysipalveluja eri osapuolille. Tehtävää varten on toteutettu yliopiston infrastruktuurirahoituksella OMERO web-palvelu (http://cse-pc66.oulu.fi/omero), jonka kautta ulkopuolisten käyttäjien on mahdollista tallentaa biokuvantamisdataa CMV:n järjestelmään. Kokoelma-aineistot Oulun yliopiston Biodiversiteetti -yksikköön kuuluvat Eläin- ja Kasvimuseot kartuttavat ja ylläpitävät luonnontieteellisiä kokoelmia, jotka koostuvat lähinnä eläin- ja kasvinäytteistä sekä niihin liittyvistä havaintoaineistoista. Eläinmuseoiden kokoelmien tietoja on tallennettu viimevuosina liittyen digitointihankkeisiin. Kokoelmat sijaitsevat eläin- ja kasvimuseoiden kokoelmatiloissa. Kasviaineistoja on tallennettu valtakunnalliseen Luonnontieteellisen keskusmuseon ylläpitämään tietokantaan jo vuosikymmeniä. Muita kokoelmia on digitoitu infrastruktuurihankkeissa. Uudet digitoidut aineistot ovat kokoelman hallintaohjemassa sekä varmuustallennettuna yliopiston palvelimella. Digitoitujen aineistojen jakaminen tapahtuu vapaasti kansainvälisen Global Biodiversity Facilityn (GBIF) kautta. Kasvitieteellisellä puutarhalla on lisäksi oma kokoelmatietokanta. Kokoelmien hallinta kehittyy valtakunnallisten FinBIF ja Lajitietokeskus-hankkeiden myötä ja tallennuksessa siirrytään kohti valtakunnallisesti integroituja järjestelmiä. Ekologiset havainto- koe- ja seuranta-aineistot Ekologisissa tutkimuksissa kerättyjen aineistojen tallennuksessa ja säilyttämisessä on huomattavaa vaihtelua. Tutkijoilla on hallussaan ja tutkimusyksiköissä talletettuna vanhoja, kuitenkin mahdollisesti arvokkaita aineistoja, kortistoina, havaintoasiakirjoina ja taulukkolaskentaohjelmiin tallennettuna. Aineistoja on talletettuna biodiversiteettiyksikössä, kenttäasemilla ja tutkimusryhmillä. Lisäksi aineistoja tallennettu Metsähallituksen, ympäristöhallinnon ja sektoritutkimuslaitosten tietokantoihin. Aineistoja on tallennettuna myös kansainvälisiin tietopankkeihin (esim. European Vegetation Archive). Kansainvälisten tietopankkien avoin käyttö on määritelty datapolitiikkaohjeissa ja sopimuksissa. Ekologian alan julkaisusarjat enenevässä määrin edellyttävät koe- tai havaintoaineistojen julkaisemista esimerkiksi Dryad-datapankissa. Ekologisten aineistojen tallennuksen kehittämiskohteena on häviämisvaarassa olevien arvokkaiden aineistojen digitointi. Tätä on tehty mm. akatemiahankkeiden yhteydessä. Learning and Educational Technology Research Unit Let Raakadataa ja pienehköjä aineistoja (mm. kyselyt, haastattelut) säilytetään yliopiston/tiedekunnan tarjoamilla jaetuilla verkkolevyillä, joilla ne myös jatkokäsitellään (mm. Excel- ja SPSS tiedostot, liitteroinnit). 15 Datamäärältään suurien aineistojen, erityisesti massiivisten videoaineistojen, jatkosäilytys joudutaan miettimään tapauskohtaisesti ja esim. supistamaan ja heikentämään datan tarkkuutta sekä hävittämään alkuperäinen data. Edelleen suhteellisen suuret datamäärät tallennetaan tämän jälkeen yksittäisille ulkoisille kovalevyille, jotka hankitaan tapauskohtaisesti ja joita aineiston kanssa työskentelevät tutkijat kierrättävät keskenään. Käytössä on analyysiohjelmia, mm. NVivo & Observer XT Noldus. Oppimisympäristö LeaForum LeaForumissa säilytettävä data on tallennettu lokaalille palvelimelle, joka ei ole yleisen verkon/tietohallinnon piirissä. Datan määrä tällä hetkellä on noin 50 teratavua. Data ei ole nauhavarmennettua, mutta levyvarmennus on käytössä. Tutkimusdataan pääsy on tällä hetkellä ainoastaan laboratorion toiminnasta vastaavan henkilön kautta. Tutkimusdata pääasiallisesti siirretään ulkoisilla kiintolevyillä tietoturvasyistä. Pohjois-Suomen syntymäkohortti Pohjois-Suomen hyvinvointi- ja terveystutkimusohjelma (www.oulu.fi/nfbc) on pitkittäistutkimusta edustava väestötason tietoaineisto. Tutkimusohjelman tavoitteena on selvittää miten sikiöaikaisen ja varhaislapsuuden tekijät vaikuttavat yksilön riskiin pitkäaikaisiin sairauksiin. Aineisto koostuu Pohjois-Suomessa Oulun ja Lapin lääneissä vuonna 1966 syntyneistä lapsista (N=12058, NFBC1966) ja vuonna 1985/86 syntyneistä lapsista (N=9432, NFBC1986), sekä heidän vanhemmistaan. Molemmista kohorteista on aineistoa kerätty raskauden ajasta lähtien ja viimeisin seurantapiste NFBC1966 kohortin osalta on 46-vuotistutkimus vuosina 2012– 2014. Tietoaineisto kattaa sekä laajat kyselytiedot että kliiniset tutkimukset. Niiden lisäksi molemmista kohorteista on tehty koko genomin kattava analyysi perinnöllisten riskitekijöiden kartoittamiseksi ja aineistoa on täydennetty lisäksi erilaisilla kansallisilla rekistereillä. Kohorttiaineistojen ylläpidosta ja aineiston käytön koordinoinnista vastaa keskitetysti Pohjois-Suomen syntymäkohorttitutkimuksen projektikeskus (Lääketieteellinen tiedekunta, Oulun yliopisto). Aineistoa säilytetään yliopiston palvelimilla. Lääketieteellisessä tiedekunnassa on lisäksi lukuisia pienempiä väestötason aineistoja kuten ikääntyvien tutkimukseen kerätyt aineiston vuosina 1935 ja 1945 syntyneistä tai eri sairauksien tutkimiseen kerättyjä potilas-kontrolli-aineistoja. Näiden aineistojen säilytyksestä ja hallinnoinnista vastaavat tutkimusryhmät/tutkijat. Yksilöistä kerätty data muodostaa ns. arkaluonteisen tietoaineiston, jonka käyttöä ohjaavat mm. henkilötietolaki sekä tutkittavien tutkimukselle antama suostumus. Pohjois-Suomen syntymäkohortin aineiston kuvaus on nähtävillä yliopiston verkkosivuilla ja tutkijat voivat hakea aineistoa käyttöönsä projektikeskuksesta. Tutkimuslupakäytännöllä varmistetaan aineiston käytön tarkoituksellisuus ja tutkittavien tietosuoja. Tehtyä tutkimusta seurataan ja tilastoidaan osana käyttölupaprosessia (julkaisut, väitöskirjat). Tietoaineiston hallintaa ja käyttöön saatavuutta pyritään kehittämään ja parantamaan esimerkiksi sähköisen lupahakemuksen käyttöönotto, tutkimusaineiston poiminnan ja käyttöympäristön automatisointi. Aineiston hallinnoinnin ja käytön kuluja katetaan osin palvelumaksuilla, jotka vuonna 2015 16 ovat: rekisteröityminen 50€, käyttölupahakemuksen käsittely 250€ (julkaisulupahakemus 100€), aineiston poiminta ja yhdistäminen 250€ ja aineiston käyttö Oulun yliopiston ulkopuolelta sopimuskulut (Data transfer agreement, DTA) 500€. Saamelainen kulttuuriarkisto Saamelainen kulttuuriarkisto toimii Oulun yliopiston Giellagas-instituutissa ja on hallinnollisesti osa Oulun yliopiston keskusarkistoa. Giellagas-instituutti alkoi kehittämään arkistoa 2009. Arkiston kokoelmat ovat sekä analogisessa että digitaalisessa muodossa. Analogimateriaalia säilytetään Oulun nauhoitearkiston nauhamakasiinissa (HU136). Varsinainen arkistotila ja digitointihuone sijaitsevat Giellagas-instituutin yhteydessä (HU324, HU330). Digitaalinen aineisto on kopioituna useille paikallisille tallenteille (kovalevyt, osittain CD- ja DVD-levyt). Vuoden 2015 aikana koko materiaali tallennetaan LTOnauhoille. Kokoelma jakautuu seuraaviin osiin: Saamen kieltä ja kulttuuri koskevat äänitteet, videomateriaalit, valokuvat, kirjalliset dokumentit ja Giellagas-instituutin julkaisut ja opinnäytteet. Arkiston omaa kokoelmaa täydentävät muiden arkistojen saamenkieliset aineistot. Kokoelman erityisosia ovat Puhutun saamen kielen korpus (työ aloitettu 2014 yhteistyönä Fin Clarin Kielipankin kanssa) ja saame vieraana kielenä korpus (työ aloitettu 2015) sekä Áillohaš-kokoelma. Arkiston oma kokoelma on luetteloitu ja kuvailtu paikalliseen tietokantaan. Arkisto on liittymässä vuoden 2015 aikana myös Oulun yliopiston kirjaston ylläpitämään Oula-tietokantaan, joka tarjoaa näkyvyyden Finnajärjestelmässä sekä Arkistolaitoksen Arkistojen portti-portaaliin. Kokoelmatiedot löytyvät Saamelaisen kulttuuriarkiston kotisivuilta (http://www.oulu.fi/giellagasinstituutti/saamelainen_kulttuuriarkisto ). Suomen kielen tutkimusaineistot Oulun nauhoitearkistossa (ONA) säilytetään opiskelijoiden ja henkilökunnan nauhoittamia tallenteita. Kokoelmissa on yhteensä yli 7 000 tuntia erilaisia nauhoitteita, joista osa on kopioitu Suomen kielen nauhoitearkistosta (SKNA). SKNA sisältää nauhoitteiden lisäksi sanasto- ja nimistökokoelmat sekä korpukset. Oulun nauhoitearkiston materiaali on kokonaan digitoitu ja tullaan siirtämään osaksi Kielipankin LAT-alustaa (Language Archiving Technology) vuoden 2015 aikana. Osia aineistosta on myös litteroitu, lisäksi ICLFIkorpus (International Corpus of Learner Finnish) on morfologisesti koodattu sekä lemmatisoitu. Oulun nauhoitearkisto on kokonaisuudessaan tallennettu useille ulkoisille kiintolevyille sekä tietokoneille varmuuskopioina. ONA tullaan siirtämään CSC:n LAT-alustan ohella myös Oulun yliopiston sisäisille verkkolevyille varmuussäilytykseen. Muuta materiaalia säilytetään suomen kielen oppiaineen arkistotiloissa luetteloituna. ICLFI-korpus on varmuuskopioitu Kielipankin KORP-palvelun lisäksi yliopiston sisäisille säilytysasemille. Kielipankki-palvelukokonaisuuden tarjoaa FIN-CLARIN ja kielipankin teknisestä ylläpidosta vastaa CSC 17 yhteistyössä Helsingin yliopiston kanssa. Aineistojen ylläpitäminen vaatii jatkuvaa päivittämistä, suomen kielen asiantuntemusta sekä perehtymistä teknisiin välineisiin. Aineistojen ylläpito sisältyy yhden lehtorin työsuunnitelmaan. Kasvatustieteiden tutkimusaineistot Aineistot ovat yleensä oman tutkimusryhmän jäsenten ja mahdollisesti yhteistyökumppanien käytettävissä, ja aineistojen käytöstä sovitaan tutkimusprojektien vetäjien kanssa. Aineiston säilytysmuodot vaihtelevat. Aineistoja säilytetään mm. tutkijoiden omilla koneilla, verkkolevyillä, ulkoisilla kovalevyillä, muistitikuilla ja paperisina. Aineistot säilytetään lukollisissa tiloissa. Kasvatustieteiden tiedekunnassa on paljon arkaluonteista aineistoa ja mm. elämänkerta-aineistoja, lasten havainnointeja, haastatteluaineistoja ja videoaineistoja, joissa osallistujien anonyymiyden säilyttäminen ei ole mahdollista. Aineistojen luonteen vuoksi suuri osa aineistoista on sellaisia, että niiden avaaminen avoimeen käyttöön ei ole mahdollista. Tutkimusetiikka edellyttää, että tutkimusten osallistujien on voitava itse päättää, haluavatko he itseään koskevan aineiston tulevan avoimeen käyttöön. Kasvatustieteellisen ja psykologisen aineiston kohdalla on myös huomioitava, että mikäli osallistujilla ei ole mahdollisuutta kieltää itseään koskevan aineiston avointa käyttöä, osallistujien löytäminen tutkimuksiin saattaa jatkossa muodostua ongelmaksi. Tiedekunnan tutkijat toivovat ohjeistusta mm. siitä, miten tutkijat voisivat ohjeistaa tutkimusten kohteena olleita henkilöitä päättämään, miten haluavat aineistojen olevan avoimia. 4.2. Tietohallinnon palvelut tutkijoille Levytila Tietohallinto tarjoaa tutkijoiden käyttöön seuraavat levytilat: Kotihakemisto (K), yhteiset levyjaot (S), tutkimuksen levytila ja Lehmus-laskentapalvelin. Henkilökunnan yhdistetyn Linux/Windows-kotihakemiston oletuskoko on 5 GB. Kotihakemistosta otetaan joka yö varmuuskopio, jonka säilytysaika on 1 vuosi. Kotihakemistoon voi tilata lisätilaa tarvittaessa. Tietohallinto tarjoaa ulkopuolisella rahoituksella toimiville tutkimusryhmille suurien aineistojen tallennuksia varten erillistä levytilaa hintaan 600 € / 1 TB / vuosi. Laskenta- ja tietokantapalvelut sekä virtuaalipalvelimet Tutkijoilla on käytettävissään laaja valikoima ohjelmistoja ja laskentaresursseja tieteelliseen laskentaan sekä ohjelmointitehtäviin. Tarjolla olevat tietokantapalvelut (oracle, mysql, microsoft sql) soveltuvat mm. taulukkomuotoisen tutkimusdatan käsittelyyn. Lisäksi tutkijat voivat hyödyntää virtuaalipalvelimia esim. tilanteissa, joissa tutkimusaineiston käsittely vaatii erillisen käyttöliittymän rakentamista. Avointa tiedettä tukevat palvelut 18 Avointa tiedettä tukevat tietohallinnon palvelut soveltuvat lähinnä digitaalisten aineistojen säilytykseen ja jakamiseen. Laajempien aineistojen jakamiseen voi käyttää www-palvelua. Wiki tarjoaa helppokäyttöisen alustan pienemmille aineistoille. Tutkijoiden väliseen yhteistyöhön ja tiedon jakamiseen soveltuvat edellisten lisäksi myös Oulun yliopiston intranet-palvelun, Notion extranetit. Pian käyttöön otettava o365 ja mahdollisesti myös Google apps tarjoavat rajattomasti ilmaista tallennustilaa, mutta erilaiset tietoturvaan sekä aineistojen vapaaseen jakamiseen liittyvät kysymykset voivat rajoittaa kyseisten palveluiden käyttöä tutkimustyössä. Kuvassa 1 on kuvattuna tietohallinnon tarjoamat palvelut. Kuva 1. Tietohallinnon avointa tiedettä tukevat palvelut. 19 Tieteen tietotekniikan keskuksen CSC:n palvelut CSC tarjoaa tutkijoiden käyttöön mm. tietokantapalveluja tutkimustiedon hallintaa varten, avointen aineistojen julkaisualustan, tutkimuksen tietoaineistojen hakupalvelun ja tutkimusaineiston säilytyspalveluja (Taulukko 1). Tarjolla on myös opastusta palvelujen käyttäjille. Lisäksi CSC on mukana mm. seuraavien palveluiden toteutuksessa: PAS, Tuuli ja Tutkimusinfrastruktuurien tietopankki. Taulukko 1 CSC:n Avointa tiedettä tukevat palvelut. Lähde: http://avointiede.fi/palvelut Mistä aineistoja löytyy? Miten aineistoja hallinnoidaan? Missä aineistot avataan? Tutkimusaineistojen turvallinen Olemassa olevien tutkimusaiheistojen hakeminen tallennus IDA-tutkimusdatan Omien aineistojen kuvailu Etsin- Etsin-hakupalvelusta säilytyspalveluun Avoimien aiheistojen hyödyntäminen AVAA- Kielipankin kielentutkimuksen julkaisualustan sovellusten ja palvelut kieliaineistoille. rajapintajakelun kautta hakupalvelussa Avointen aineistojen jakelu AVAA-julkaisualustalla. Aineistojen lataus Ailapalveluportaalista Kehitteillä: Tutkimusinfrastruktuurien Julkaisuarkistopalvelut Doria ja tietopankki sekä Theseus mahdollistavat datanhallintasuunnitelmatyökalu rinnakkaisjulkaisun Tuuli FINTO-sanasto- ja ontologiapalvelu Pilotoitavana: Tutkimusten Suunnitteilla: tulosten pitkäaikaissaatavuuden Rinnakkaisjulkaisupalvelut ja takaava PAS-palvelu avoimen julkaisemisen pilotti 4.3. Kirjaston palvelut tutkijoille Kirjaston tieteenalakohtaisissa tiedonhakuoppaissa (http://libguides.oulu.fi) on tutkimusvälilehdellä lyhyesti esiteltynä ja linkitettynä tärkeimmät tutkimusdataan liittyvät oppaat ja palvelut. Lisäksi kirjastossa ollaan työstämässä avoimen tieteen opasta, joka sisältää ohjeistusta niin avoimen julkaisemisen kuin datankin osalta. UNIOGS:in tiedonhankintakurssilla (920003J, Information skills for doctoral students, 1 op) asiaa on lyhyesti esitelty tohtoriopiskelijoille. Lisäksi kirjasto kouluttaa jatkuvasti tutkijoita erilaisissa tiedon hankintaan ja julkaisemiseen liittyvissä kysymyksissä. 20 5. Työryhmän tavoitteet ja toimenpide-ehdotukset Oulun yliopisto pitää hyvinä ja esimerkillisinä UK:n Concordat on Open Research Data periaatteita ja ottaa ne oman datapolitiikkansa perustaksi. Oulun yliopisto opastaa tutkijoita tutkimusaineistoja hallinnoivien palvelujen käyttäjiksi ja suuntaa omia ja kannustaa tutkijoita hankkimaan lisäresursseja avoimuuden edistämiseen. Tutkimusneuvosto ja tutkimuksen johtoryhmä ovat toimintaa koordinoivat elimet. Kaikkiin tiedekuntiin ja painoalayksiköihin nimetään tutkimusaineistoista vastaava henkilö. Tutkimuksen tukipalvelut, kirjasto, arkisto ja tietohallinto opastavat tutkijoita ja järjestävät tarvittavaa koulutusta. Principle #1 Open access to research data is an enabler of high quality research, a facilitator of innovation and safeguards good research practice Tutkimusaineistojen avaaminen edistää korkeatasoista tutkimusta, helpottaa innovaatiotoimintaa ja turvaa hyviä tutkimuskäytäntöjä. Principle #2 Good data management is fundamental to all stages of the research process and should be established at the outset. Hyvä datanhallinta on välttämätöntä tutkimusprosessien kaikilla tasoilla ja se tulisi varmistaa prosessin alusta lähtien. Principle #3 Data must be curated so that they are accessible, discoverable and useable. Data täytyy hoitaa (kuratoida) niin, että sitä voi päästä käyttämään, se on löydettävissä ja käyttökelpoista. Principle #4 Open access to research data carries a significant cost, which should be respected by all parties Tutkimusaineistojen avaaminen tuo huomattavia kustannuksia, mikä täytyy kaikkien osapuolien ottaa huomioon. Principle #5 There are sound reasons why the openness of research data may need to be restricted but any restrictions must be justified and justifiable On olemassa selkeitä perusteita, miksi tutkimusaineistojen avaamista on tarpeen rajoittaa, mutta näiden perusteiden täytyy olla oikeutettuja ja toteennäytettävissä. 21 Principle #6 The right of the creators of research data to reasonable first use is recognised. Tutkimusaineiston perustajien oikeudet sen ensisijaiseen käyttöön täytyy tunnustaa. Principle #7 Use of others’ data should always conform to legal, ethical and regulatory frameworks including appropriate acknowledgement. Muiden tutkijoiden aineistojen käytössä täytyy aina noudattaa asianmukaisia lakeja, eettisiä ohjeita ja säännöksiä ja ilmoittaa aineiston lähde sitä käytettäessä. Principle #8 Data supporting publications should be accessible by the publication date and should be in a citeable form. Julkaisuissa käytetyt aineistot tulisi olla saatavissa julkaisuhetkellä sellaisessa muodossa, että niihin voi viitata. Tähän Oulun yliopisto esittää varauksen, että tutkijan täytyy saada päättää, ettei dataa avata välittömästi mikäli siitä on suunnitteilla useita julkaisuja ja aineiston avaaminen vaikeuttaa tätä. Tässäkin tapauksessa käytetyt aineistot tulisi rekisteröidä niin, että ne saavat pysyvän tunnisteen, jolla niihin voidaan viitata. Lisäksi aineisto on voitava antaa pyynnöstä julkaisufoorumin tarkasteltavaksi. Principle #9 Support for the development of appropriate data skills is recognised as a responsibility for all stakeholders. Kaikkien asianosaisten vastuulla on tukea tutkimusaineistojen tallentamisessa ja avaamisessa tarvittavien datan käsittelytaitojen kehittämistä. Principle #10 Regular reviews of progress towards open access to research data should be undertaken. Tutkimusaineistojen avaamisen edistymistä tulee arvioida säännöllisesti. Tämä arviointi tulee ottaa Oulun yliopiston laatukäsikirjan osaksi. Tutkimusyksiköiden tulee määrittää tavoitetila ja toimenpiteet, miten he aikovat toteuttaa -tutkimusaineistojen rekisteröinnin -tutkimusaineistojen tallentamisen -tutkimusaineistojen avaamisen. Yksikön tutkimusaineistot ja niiden hallinnointi käsitellään tulosneuvotteluissa. Tutkimusaineistojen rekisteröinti 22 Oulun yliopisto suosittelee, että tutkimusryhmät rekisteröivät aineistonsa. Tutkimusryhmien pitäisi tehdä priorisointi, mitä rekisteröidään ja ottaa huomioon aineiston arvo ja käyttökelpoisuus. Etusija tulisi antaa aineistoille, jotka ovat aktiivisesti käytössä. Tutkimusryhmä päättää itsenäisesti ajankohdasta, milloin he haluavat rekisteröidä tutkimusaineistonsa. Tutkijoille tulisi jakaa tietoa palveluista, joihin tutkimusaineistoja voi rekisteröidä. Suositellaan CSC:n ETSIN – palvelun käyttöä. Tutkimusaineistojen tallentaminen Oulun yliopiston tutkijoilla ja tutkimusryhmillä on vastuu tutkimusaineistojen tallentamisesta. Tallennuspalveluja tarjoavia toimijoita ovat mm. Oulun yliopiston tietohallinto, Yhteiskuntatieteellinen tietoarkisto, valtakunnalliset arkistot ja museot, CSC sekä kansainväliset ESFRI-infrastruktuuripalvelut. Näistä palveluntarjoajista pitäisi jakaa tietoa tutkijoille. Niillä tieteenaloilla, joilla on vakiintuneita tallennusjärjestelmiä, käytetään niitä. Tiedekuntien tutkimusaineistoista vastaavat henkilöt ohjeistavat uusien aineistojen tallennuksessa. Tutkimusaineistojen avaaminen Oulun yliopisto edellyttää, että tutkimusryhmät päättävät tutkimusaineistojen avaamisesta ottaen huomioon rahoittajatahon ohjeistukset. Yliopistotasolla tulisi rakentaa hallinnointimalli sekä keskitetyt ja tiedekuntatason palvelujärjestelmät. Näihin palvelujärjestelmiin tulisi liittää neuvonta sopimus- ja tekijäoikeuksista. Työryhmä näki suositeltavana käyttää mahdollisimman paljon valtakunnallisia, esim. CSC:n sekä kansainvälisiä ESFRI-infrastruktuurihankkeiden palveluja. Tutkimusaineistojen avaaminen on vaativin tutkimusaineistojen hallinnoinnin taso. Tutkijoiden täytyy ’kuratoida’ eli hoitaa aineistonsa niin, että niissä on riittävät metatiedot, niiden omistus ja oikeudet ovat tiedossa sekä dokumentoidut. Lisäksi aineiston on oltava käyttökelpoisessa muodossa. Tässä tutkijoita täytyy opastaa aineistoihin liittyvistä omistus- ja käyttöoikeuksista. Rahoitusta on mahdollisuuksien mukaan haettava kansallisilta ja kansainvälisiltä tutkimuksen rahoitusinstrumenteilta. Tiedotus ja koulutus Koulutusta on saatavissa valtakunnallisessa ATT-hankkeessa. Jokaisessa tiedekunnassa tulee olla tutkimusaineistoista vastaava henkilö, joka osallistuu koulutukseen. Yliopiston sisällä järjestetään jatkuvasti omaa koulutusta. Tässä Oulun yliopiston kirjasto, tietohallinto, tutkimuksen tukipalvelut ja tutkijakoulu UniOGS ovat keskeisiä toimijoita. Tavoitetila 2017: -Tutkimusaineistojen rekisteröinti ja metatietojen tallennukseen liittyvät prosessit määritelty -Tutkimusaineistojen tallennus ja hallinnointi otettu osaksi tulosneuvotteluja 23 -Tutkimusaineistojen avaaminen: perusteet määritelty ja edellytykset luotu -Julkaisujen rinnakkaistallentaminen järjestetty -Tutkijoiden ohjeistus ja koulutus suunniteltu ja toteutus menossa.
© Copyright 2024