Menu English

Publiceren Datasets

in DataverseNL

Het publiceren van onderzoeksgegevens is het vindbaar, citeerbaar en (her)bruikbaar maken van de (meta)data onder een licentie die duidelijk maakt wat er mag en kan met de gegevens.

DataverseNL

Na afloop van jouw onderzoeksproject kun je je dataset in DataverseNL publiceren. Dit kan direct na afloop van het onderzoeksproject of na een embargo periode. In DataverseNL worden alleen geanonimiseerde datasets gedeponeerd. Om verder te bepalen of jouw dataset geschikt is voor publicatie kun je dit eenvoudige beslisschema van RDNL gebruiken.

Je moet ook kijken welke randvoorwaarden nodig zijn, zoals het bestandsformaat, metadata en datadocumentatie. Datasets die worden gepubliceerd bij DataverseNL moeten namelijk voorzien worden van metadata en beschrijvende data van het onderzoek en in een voorkeursformaat zijn opgeslagen. Op die manier zijn de onderzoeksgegevens begrijpelijk en bruikbaar voor anderen.

Richtlijnen voor publiceren van onderzoeksdata in DataverseNL (PDF)

Het publiceren van een dataset bij DataverseNL doe je altijd samen met een datasteward.

Eigenschappen van de dataset

Voorkeursformaten

Voorkeursformaten zijn de bestandsformaten waarvan verwacht wordt dat deze op langere termijn de beste garanties bieden voor hergebruik, toegankelijkheid en duurzaamheid. DANS heeft hiervoor een lijst opgesteld met formaten die zonder meer door DANS, en dus ook DataverseNL, worden geaccepteerd. Verder hanteert DANS bestandsformaten die naast de voorkeur bestandsformaten veel worden gebruikt.

Algemene richtlijn is dat de meest geschikte bestandsformaten open specificaties hebben en onafhankelijk zijn van specifieke software, ontwikkelaars of leveranciers. In de praktijk zal het echter niet altijd mogelijk zijn om formaten te gebruiken die voldoen aan deze kenmerken. 

Lijst met voorkeursformaten

Metadata

Metadata zijn data over data. Het zijn de kenmerken of eigenschappen van een dataset, voorbeelden zijn de auteur, taal, tijdsperiode van dataverzameling en onderwerp. Deze gegevens kunnen door computers en zoeksystemen gelezen worden. Hierdoor zijn datasets makkelijk te linken met andere archieven en automatisch te doorzoeken wat de bekendheid van de onderzoeksgegevens vergroot.

Er zijn verschillende metadata-standaarden in omloop. De meest gebruikte en bekendste is Dublin Core Metadata Initiative (DCMI). Deze wordt ook gebruikt bij DataverseNL. Zodra je je dataset gaat deponeren in DataverseNL zal je gevraagd worden deze gegevens te verstrekken. Een datasteward zal je hierbij ondersteunen. 

 DOI

Een andere metadata-element is de Digital Object Identifier (DOI) die automatisch wordt toegekend aan het bestand bij publiceren in DataverseNL. Hierdoor blijft de dataset permanent bereikbaar. Als onderzoeker kan je dan met behulp van een persistente URL verwijzen naar de dataset. Ook anderen kunnen zo naar jouw data verwijzen, zodat je als onderzoeker de credits krijgt voor je onderzoeksproject. Op deze manier is je onderzoeksproject op een duurzame manier vindbaar volgens de FAIR-principes.  

Documentatie - beschrijven van data

Om je onderzoeksgegevens bruikbaar te houden voor de toekomst is het verstandig om je onderzoeksgegevens goed te documenteren in bijvoorbeeld een labjournaal of codeboek. Op deze manier kan een ander de inhoud en context van je onderzoeksgegevens begrijpen en zijn je onderzoeksgegevens bruikbaar voor verificatie of hergebruik.

In je documentatie neem je informatie op over het verzamelen van de gegevens, de gegevensinvoer, de gegevensopslag en de verwerking van de onderzoeksgegevens. Denk hierbij ook aan:

  • Context en methodologie van het onderzoeksproject
  • De (instellingen van) gebruikte apparatuur of instrumenten
  • De relatie tussen bestanden in een dataset of database
  • De inhoud en structuur van individuele bestanden (variabelen e.d.)

Toegang en licenties

Hoewel metadata open access worden bij data publicatie, geldt dat niet per se voor de bijbehorende onderzoeksgegevens. De toegang tot die gegevens kan om goede redenen beperkt zijn, hierbij geldt 'Open wanneer het kan en gesloten wanneer het moet’. 

DataverseNL hanteert de volgende toegangscategorieën: 

  • Open: toegankelijk voor iedereen (kan na embargo periode)
  • Open: voor geregistreerde gebruikers
  • Restrictie: pas na toestemming kunnen gebruikers data inzien en downloaden

Creative Commons licenties

Naast de toegangscategorie moet je ook nadenken wat iemand anders met jouw onderzoeksgegevens mag doen. Bij publicatie in DataverseNL moet een Creative Commons ( CC ) licentie worden meegegeven zodat helder is op welke manier het materiaal mag worden gebruikt. 

Standaard krijgt een dataset in DataverseNL de CC0 licentie. Dit houdt in dat een ander de dataset zonder restricties kan gebruiken of er mee verder kan gaan. Wij adviseren de CC BY licentie, dit betekent dat iemand alleen verplicht is om de naam van de oorspronkelijke auteur te noemen bij hergebruik van de data. Een andere CC licentie is ook mogelijk. Op de website van Creative Commons lees je welke licenties er allemaal zijn.

Bekijk welke licenties er zijn