Åpen tilgang til forskningsdata
Universitetsbiblioteket kan gi råd og veiledning om håndtering og tilgjengeliggjøring av forskningsdata
Hovedinnhold
Forskningsdata er en sentral del av verdiskapingen ved universitetene. Å fremme åpen tilgang til forskningsdata er en strategi for å utnytte potensialet fullt ut og derved maksimere effekten av forskningsaktiviteter i et digitalt samfunn.
HVORFOR bør du gjøre dataene dine tilgjengelige?
Universitetet i Bergen har som mål at data som er et resultat av de ansattes forskningsaktivitet, skal klargjøres og tilgjengeliggjøres for gjenbruk, i tråd med FAIR-prinsippene (Politikk for åpen vitenskap ved Universitetet i Bergen).
Åpen tilgang til forskningsdata er med på å øke påvirkningen og transparens av forskningsaktiviteter. Det sikrer at det fulle potensialet i et forskningsprosjekt blir utnyttet og kan legge grunnlag for videre forskning, med passende kreditering av dataskaperne. Derfor er god datahåndtering og åpen tilgang til forskningsdata blitt et krav fra finansiører, som Norwegian Research Council og Europakommisjonen.
Det er også vanlig at forlag og tidsskrift krever at forskeren gjør datasettene som ligger til grunn for resultatene i publikasjonen tilgjengelige, og derved sikre reproduserbar forskning.
"Universitetet i Bergen har som mål at data som er et resultat av de ansattes forskningsaktivitet, skal klargjøres og tilgjengeliggjøres for gjenbruk, i tråd med FAIR-prinsippene."
Fra Politikk for åpen vitenskap ved Universitetet i Bergen
"Bedre tilgjengeliggjøring og mer gjenbruk av forskningsdata kan bidra til vitenskapelige fremskritt ved at hver enkelt forsker får et større datagrunnlag å bygge på, til økt etterprøvbarhet og bedre kvalitetssikring av tidligere forskningsfunn, og til å unngå at samme type datainnsamling må finansieres flere ganger"
Fra Nasjonal strategi for tilgjengeliggjøring og deling av forskningsdata
Åpen tilgang til forskningsdata øker synlighet og påvirkning
Det er mange fordeler med åpen tilgang til forskningsdata, både for forskere, finansiører og samfunnet øvrig.
• Artikler som lenker til forskningsdata siteres oftere
• Sammenkobling av data og publikasjoner øker forskernes synlighet
• Data som ikke er direkte lenket til en publikasjon kan gjøres tilgjengelige og siterbare
• Data- eller analyseverktøy kan inspirere til ny forskning og skape muligheter for samarbeid
• Åpenhet støtter forskningsintegritet og reproduserbarhet
• Tilgjengelige resultater tillater involvering av borgere og samfunn
• Færre ressurser blir brukt på duplisering av resultater, og dermed større effektivitet for finansiører
• Å bygge på resultater kan føre til akselerasjon av forskningsprosessen og tilrettelegge for raskere innovasjon
Les mer her:
Piwowar et al., 2013: Data reuse and the open data citation advantage
Colavizza et al., 2020: The citation advantage of linking publications to research data
McKiernan et al., 2016: How open science helps researchers succeed
Allen et al., 2019: Open science challenges, benefits and tips in early career and beyond
Burgelman et al., 2019: Open Science, Open Data, and Open Scholarship: European Policies to Make Science Fit for the Twenty-First Century
Krav til åpen tilgang til forskningsdata
Relevante retningslinjer, dokumenter og lenker.
National strategy on access and sharing of research data (2017)
- Forskningsdata skal være så åpne som mulig, og så lukkede som nødvendig.
- Forskningsdata bør håndteres og tilrettelegges slik at verdiene i dataene kan utnyttes best mulig.
- Beslutninger om arkivering og tilrettelegging av forskningsdata må tas i forskerfellesskapene.
University of Bergen Policy for Open Science (2020)
- Forskningsdata bør håndteres og tilgjengeliggjøres slik at verdiene i dataene kan utnyttes best mulig.
- Alle forskningsprosjekter som ledes fra UiB skal ha en datahåndteringsplan.
- Studenter og ph.d.-kandidater oppfordres til å gjøre forskningsdataene sine tilgjengelige ved innlevering av masteroppgaver og ph.d.-arbeid.
- UiBs fagmiljøer skal bidra til å utvikle gode løsninger for arkivering og tilgjengeliggjøring av forskningsdata på sine fagfelt.
Norwegian Research Council (2017)
- Forskningsdata skal lagres/arkiveres på en sikker måte
- Forskningsdata skal gjøres tilgjengelig for videre bruk
- Forskningsdata bør gjøres tilgjengelig på et tidlig tidspunkt
- Forskningsdata skal utstyres med standardiserte metadata
- Forskningsdata skal utstyres med lisenser for tilgang, gjenbruk og videredistribusjon
- Forskningsdata bør gjøres tilgjengelig til lavest mulig kostnad [helst uten kostnad]
- Håndtering av forskningsdata skal beskrives i en datahåndteringsplan [DMP må leveres i forbindelse med revidering av søknaden, i forbindelse med sluttrapportering bes om den endelige versjonen]
- Science Europe DMP guidelines anbefalt
Policy for Open Access to Research Data (2017)
Policy for Open Science (2020)
Fra 2023 vurderes åpen forskning i søknader
Horizon 2020 (2016)
- "Data Management Plans (DMPs) are a key element of good data management. A DMP describes the data management life cycle for the data to be collected, processed and/or generated by a Horizon 2020 project."
- The Open Research Data Pilot (ORDP) was extended to all thematic areas of Horizon 2020 in the 2017 Work Programme. Opting out is possible.
- The proposal is not expected to contain a fully developed DMP. However, good research data management as such should be addressed under the impact criterion, as relevant to the project.
- Once a project has had its funding approved and has started, you must submit a first version of your DMP (as a deliverable) within the first 6 months of the project. The Commission provides a DMP template in annex, the use of which is recommended but voluntary.
- The DMP should be updated as a minimum in time with the periodic evaluation/assessment of the project.
Guidelines on FAIR Data Management in Horizon 2020 (2016)
Guidelines to the Rules on Open Access to Scientific Publications and Open Access to Research Data in Horizon 2020 (2017)
European Research Council (ERC) Guidelines on Implementation of Open Access to Scientific Publications and Research Data (2017)
ERC Scientific Reporting Guidelines (2021, p. 7)
Frequently Asked Questions
Horizon Europe (2021)
- Open science practices are considered in the evaluation of proposals, under 'excellence' and under the 'quality and efficiency of implementation'.
- Mandatory open science practice: responsible management of research data in line with the FAIR principles of 'Findability', 'Accessibility', 'Interoperability' and 'Reusability', notably through the generalised use of data management plans, and open access to research data under the principle 'as open as possible, as closed as necessary'
- Beneficiaries must submit a DMP as a deliverable to the granting authority in accordance with the Grant Agreement (normally by month 6). An updated DMP deliverable must also be produced mid-project (for projects longer than twelve months) and at the end of the project (where relevant). Registration/publication of DMPs is encouraged as good practice.
- Data should be deposited in a trusted repository as soon as possible after data production and at the latest by the end of the project. Data underpinning a scientific publication should be deposited at the latest at the time of publication and in line with standard community practices.
Horizon Europe Open Science Fact Sheet (2021)
Horizon Europe Annotated Model Grant Agreement (2021)
Horizon Europe Programme Guide (2021, oppdatert 2023)
HVA er forskningsdata - og skal alle data være åpent tilgengelige?
I National strategy on access and sharing of research data, defineres offentlig finansiert forskningsdata som " data som er samlet inn eller frembrakt til bruk for eller som et resultat av offentlig finansiert forskning, og data som utgjør grunnlaget for publikasjoner som er et resultat av offentlig finansiert forskning, uavhengig av hvilken kilde dataene kommer fra".
Dette inkluderer både helt nye data og data generert gjennom analyse av eksisterende data (sekundære data). For å utnytte potensialet fullt ut, bør forskningsdata administreres og kurateres. For å akselerere forskningsprosessen og for å gjøre forskningsresultater reproduserbare, bør også forskningsprotokoller og analyseprogramvare / programkode opprettet i forskningsprosessen gjøres tilgjengelig. Hovedprinsippet med åpen tilgang til forskningsdata er at data skal være så åpne som mulig, men så lukkede som nødvendig. For eksempel kan ikke personlige og sensitive personopplysninger, eller data som vil være i konflikt med immaterielle rettigheter og kommersialisering, gjøres fullstendig tilgjengelig. Imidlertid kan det være mulig å gjøre noen sensitive personopplysninger tilgjengelige i anonymisert form eller for spesifikke brukere etter definerte tilgangskriterier og sikre teknisk tilgangskontroll.
HVORDAN kan du gjøre dine forskningsdata åpent tilgjengelige?
Datahåndteringsplan (DMP) er et verktøy som sørger for god datahåndteringspraksis gjennom hele forskningsdatas livssyklus, fra prosjektplanlegging og gjennom den aktive forskningsfasen til prosjektslutt. Arkivering av data, ledsaget av metadata og en passende lisens, er en strategi som er med på å øke effekten av forskningsresultater og fremme reproduserbar forskning. FAIR-prinsippene er et sett med retningslinjer som sikrer at forskningsdata kan gjenbrukes. Det er viktig at FAIR-data ikke tilsvarer ubegrenset tilgang til data ("Så åpen som mulig, så lukket som nødvendig"). I et prosjekt med personlige eller sensitive personopplysninger vil tiltak for å sikre dataene være en viktig del av datahåndteringsplanen. Universitetet i Bergen og mange finansiører krever at forskningsprosjekt har en datahåndteringsplan. Universitetsbiblioteket tilbyr jevnlig kurs i datahåndteringsplaner. For mer informasjon om kommende kurs, se høyremargen på siden, eller se i vår kalender.
Research data life cycle
Forskningsdataenes livssyklus beskriver prosessen fra planlegging, innsamling av data, til publisering og langsiktig bevaring, som kan gjenbrukes og legge grunnlag for nye forskningsprosjekter.
Knowledge clip: The research data lifecycle
FAIR data: Findable, Accessible, Interoperable, Reusable
FAIR-prinsippene er et sett med retningslinjer for å sikre at forskningsdataene er av god kvalitet og skal kunne gjenbrukes.
"UiB skal i nasjonale og internasjonale nettverk og samarbeid fremme åpen tilgang til forskningsdata og FAIR-prinsippene." Fra Politikk for åpen vitenskap ved Universitetet i Bergen
FAIR-prinsippene står for:
- Findable – gjenfinnbar. Dette krever metadata ("data om data"), lesbare for mennesker og maskiner, og persistente identifikatorer.
- Accessible – tilgjengelig. Kriterier for å sikre tilgang til et funnet datasett. Metadata må hentes ved hjelp av en standardisert protokoll som tillater at autorisasjonsprosedyrer var nødvendige. Det er viktigere at metadata må være tilgjengelig selv om selve dataene ikke lenger er tilgjengelige.
- Interoperable - data skal kunne åpnes, forstås, kombineres, gjenbrukes og bearbeides uten begrensinger, både nå og i fremtiden.
- Reuseable - gjenbrukbar
Datahåndtering i den aktive forskningsfasen
God datahåndtering i den aktive fasen av et forskningsprosjekt letter din fremtidige forskning, letter samarbeid, muliggjør avanserte analysemetoder og er en forutsetning for arkivering av data av høy kvalitet. Noen aspekter å vurdere:
Datalagring og sikkerhetskopiering
- IT-avdelingen gir informasjon om lokal datalagring ved UiB. Trenger du mer langringskapasitet, enten aktiv lagring eller langtidslagring (cold storage) på Billy, sjekk prisliste fra IT-avdelingen. Hvis du trenger personlig veiledning, kan du kontakte UiBhjelp.
- Vurder om informasjon bør beskyttes. UiBs lagringsguide forklarer klassifisering av informasjon som begrenset/ fortrolig/ strengt fortrolig. Veilederen fra UiO gir flere eksempler og du kan finne mer informasjon om klassifisering av informasjon fra UNIT.
- Sensitive data fra UiB kan lagres i SAFE. Se også informasjonen om personopplysninger og sensitive data.
- Aktiv lagring av store datamengder (TB-rekkevidde) leveres av Sigma2, som har to søknadsrunder per år. NIRD-tjenesteplattformen tillater on-site analyser.
- Informasjon om high-performance computing (HPC) ved UiB tilbys av gruppen for vitenskapelige beregninger. Norwegian Research Infrastructure Services ("Metacenter") tilbyr regelmessing trening.
- Fildeling i kollaborasjonsprosjekter: FileSender er en nasjonal tjeneste for deling av større filer.
Filhåndtering
- Bruk korte og deskriptive filnavn som er maskin-lesbart og ta hensyn til automatisk sortering. Organiser/indekser dataene dine på en måte som lar deg og andre enkelt søke etter bestemte filer, også etter lengre tid.
- Lag dokumentasjon og metadata som sikkerstiller at dataene er forståelig og kan reproduseres.
Data dokumentasjon og metadata ressurs: CESSDA Data Management expert guide, RDMkit, The Turing Way - Velg ikke-proprietære filformat som vil sikre langvarig tilgang.
- Tenk på merknaden i datafilene og maskinlesbarheten. Lagre for eksempel ryddige data med hver variabel som en kolonne, hver observasjon som en rad og hver observasjonsenhet som en tabell.
- Hvis du skriver programvarekode, bør du vurdere versjonskontroll med Git. Universitetet i Bergen har sin egen Gitlab.
Metadatastandarder
- Gjør deg kjent med metadatastandardene i forskningsmiljøet ditt / i arkivet du vil publisere dataene dine allerede tidlig i prosessen, og sørg for å skaffe deg nødvendige poster. Se dataarkivering for mer informasjon.
Prosjekt med persondata eller sensitive data
Hvis prosjektet inneholder personopplysninger eller sensitive data, må det tas spesifikke tiltak for å sikre dataene. Å beskrive disse tiltakene er en viktig del av datahåndteringsplanen.
Særlige kategorier av personopplysninger (sensitive personopplysninger) beskriver en kategori av personopplysninger som inneholder informasjon om rase eller etnisk opprinnelse, politisk tro, religion, filosofisk tro, fagforeningsmedlemskap, genetisk og biometrisk informasjon, helseinformasjon eller seksuell informasjon.
Retningslinjer og juridisk informasjon knyttet til arbeid med sensitive eller persondata finner du i UiB sine infosider om forskningsetikk.
Alle forskningsprosjekter ved UiB som inneholder personlige eller sensitive data skal registreres og følges opp i RETTE. RETTE inneholder egenutfylt prosjektinformasjon fra forskere og studenter, forskningsprosjekter som er vurdert av Sikt personverntjenester, og helseforskningsprosjekter med forskingsetisk godkjenning fra REK.
Se i tillegg UiBs infosider om forskningsetikk og IT-avdelingens nettsider om IT for forskning
Ansatte som får kjennskap til brudd på personopplysningssikkerheten har plikt til melde avviket til relevant personell. Ved UiB kan dette gjøres via UiBhjelp (se også UiB regelsamlingen).
Lagring av persondata i den aktive forskningsfasen
IT-avdelingen ved Universitetet i Bergen har utviklet en løsning for sikker behandling av sensitive personopplysninger i forskning: SAFE. Andre sikre lagringsalternativer er TSD og HUNT Cloud.
Arkivering av sensitive og persondata
Langtidsbevaring av personlige (sensitive) data kan i visse tilfeller være hensiktsmessig. Noen sensitive data kan arkiveres i arkiver med teknisk tilgangskontroll for kun å tillate datatilgang for bestemte brukere etter definerte tilgangskriterier. I andre tilfeller kan anonymisering av sensitive data tillate deponering i et åpent depot. Det er viktigere at hvis forskningsdata samles inn med informert samtykke, må dataarkiveringsplaner inkluderes allerede i samtykkeskjemaene.
Ressurser
UiB sine infosider om forskningsetikk
Forskningsrutiner for prosjekter som behandler persondata
UiB regelsamlingen: Rettslig grunnlag for behandling av personoppsyninger for vitenskapelig forskningsformål
CESSDA Data Management Expert Guide inneholder et avsnitt om juridiske og etiske hensyn ved å gjøre persondata åpent tilgjengelige.
The UK Data Service har nyttig informasjon om anonymisering av både kvalitative og kvantitative data.
ELIXIR RDMkit har en sider om sensitive data og planlegging, innsamling, prosessering, analyse, bevaring og gjenbruk av menneskelige forskningsdata.
PhD on Track om personopplysninger.
Sikt: Vanlige spørsmål om personvern og meldeskjema
DANS Guidebook: Making Qualitative Data Reusable
Fagspesifikk hjelp
Noen infrastrukturer gir spesifikke støttetjenester for forskningsdata og spørsmål knyttet til datahåndtering:
- ELIXIR for livsvitenskap. Se også ELIXIR RDMkit.
- CLARINO Bergen Center for språkvitenskap
- Bjerknes Climate Data Centre for klimaforskning
- Sikt Forskningsdata for samfunnsvitenskapelig forskning. Se også CESSDA data management expert guide.
- NMDC for marin forskning
NB! Hvis du føler at infrastrukturen din mangler, kan du kontakte oss.
HVOR kan du gjøre forskningsdata åpent tilgjengelige?
Publisering av forskningsdata og tilhørende metadata i et forskningsarkiv sikrer langtidsbevaring og gjenbrukbarhet. Forskningsdata bør gjøres tilgjengelig senest ved publisering av den vitenskapelige artikkelen.
Valg av dataarkiv
For å gjøre forskningsdataene dine synlege og tilgjengelige, bør du velge et fagspesifikt arkiv. re3data.org er det største og mest omfattende registeret over tilgjengelige dataarkiv. Registeret er kuratert og alle oppførte datalagre oppfyller definerte kvalitetskriterier. fairsharing.org er et annet, kuratert register over forskningsdataarkiv.
Institusjonelle arkiver er et godt alternativ til fagspesifikke arkiver. Forskere ved UiB kan arkivere forskningsdata i DataverseNO og få veiledning under arkiveringsprosessen.
Har du store mengder data, kan NIRD Research Data Archive (Sigma2) være et alternativ.
Hvis det ikke finnes et fagspesifikt eller institusjonelt arkiv som passer for dine data, kan generelle arkiv, som f. eks. Zenodo være et godt alternativ.
Selv om forskningsdata bør gjøres tilgjengelige så tidlig som mulig, kan det noen ganger være hensiktsmessig med en embargo på datautgivelsen. Embargo-perioder og korrekturtilgang støttes av de fleste arkiver.
Arkivering av personlige eller sensitive data
Langtidsbevaring av sensitive data kan være hensiktsmessig i visse tilfeller. Noen sensitive data kan arkiveres i lukkede arkiv (for eksempel hos Sikt) med teknisk tilgangskontroll for bestemte brukere etter definerte kriterier.
I andre tilfeller kan anonymisering av sensitive data tillate deponering i et åpent arkiv. Dersom forskningsdata samles inn med informert samtykke, må planer for arkivering etter prosjektslutt inkluderes allerede i samtykkeskjemaene. Du finner mer informasjon om persondata i forskningsdataens livssyklus og arkiveringsalternativer under RDMkit:human data.
Persistente filformat: sikre langvarig tilgang
Forskningsdata bør arkiveres i åpne, ikke-proprietære formater for å sikre langvarig tilgang til filene. For mer informasjon om arkivverdige format, se DataverseNO sin arkiveringsguide.
Metadata: beskriv dataene dine
Metadata er strukturert informasjon som beskriver, forklarer, lokaliserer og gjør det lettere å hente og gjenbruke data. For å gjøre dataene dine gjenbrukbare og tilgjengelige for andre i fremtiden, må du opprette og arkivere nøyaktige metadata sammen med dataene dine.
Hvis du arkiverer dataene dine i et fagspesifikt eller institusjonelt arkiv, definerer arkivet oftest metadatastandarden.
Mer om metadatastandarder:
Digital Curation Centre
fairsharing.org
Datalisenser: tillat gjenbruk av data
Gjenbruk av data med kreditering av dataskaperne krever lisens. For forskningsdata er det vanlig å bruke Creative Commons -lisenser. Generelt bør det velges en mest mulig åpen lisens på forskningsdata for å sikre gjenbruk av dataene. Vær oppmerksom på at krav om kreditering (CC-BY) kan føre til attribution stacking.
For åpne programvarelisenser er choosealicense.com og Open Source Initiative nyttige ressurser.
Siterbar kode
For å sikre langsiktig bevaring og tillate sitering, anbefales det å publisere programkode som ble generert under et forskningsprosjekt. Mange forskere bruker Git, et system for distribuert versjonskontroll, for å administrere programkoden. Github og Gitlab (beta) legger til rette for komfortabel publisering av kode i det generelle forskningsarkiv Zenodo, som tillater også versjonering.
Det er viktig å dokumentere programkode for gjenbruk. Se CodeRefinery siden for mer informasjon og en sjekkliste.