Zum Hauptinhalt springen

Publikation von Forschungs­daten

Der FID GEO stellt Informationen zur Publikation von Forschungsdaten für die geowissenschaftliche Fachcommunity bereit und bietet Beratung zu diesem Thema an. Gleichzeitig bieten wir den Service, ihre Forschungsdaten aus dem Bereich Geowissenschaften zu veröffentlichen. Dieser Service beschränkt sich nicht nur auf die Publikation von Daten, die Grundlage einer Textpublikation in einem Fachjournal sind. Wenn Sie andere Daten veröffentlichen möchten, beraten wir Sie gern auch dazu.

Grundlegendes


„Forschungsdaten bezeichnen (digitale) Daten, die je nach Fachkontext Gegenstand eines Forschungsprozesses sind, während eines Forschungsprozesses entstehen oder sein Ergebnis sind.“ (Kindling et al. 2013).

Forschungsdaten werden unter Anwendung verschiedener Methoden – abhängig von der Forschungsfrage – erzeugt, z. B. durch Quellenforschungen, Experimente, Messungen, Beschreibungen, Erhebungen oder Befragungen und bilden die Grundlage wissenschaftlicher Ergebnisse. Daraus ergibt sich ein disziplin- und projektspezifisches Verständnis von Forschungsdaten mit divergierenden Anforderungen für die Aufbereitung und Verwaltung.

Da Forschungsdaten notwendig sind, um die darauf aufbauenden Forschungsergebnisse verifizieren zu können, ist deren Erhalt ein anerkannter Bestandteil der guten wissenschaftlichen Praxis (siehe z. B. DFG-Leitlinien zum Umgang mit Forschungsdaten).

Zu Forschungsdaten zählen u.a. Messdaten, Laborwerte, audiovisuelle Informationen, Texte, Surveydaten, Objekte aus Sammlungen oder Proben, die in der wissenschaftlichen Arbeit entstehen, entwickelt oder ausgewertet werden. Auch Software und Simulationen oder Abbildungen gehören dazu.

Publikation von Forschungsdaten eröffnet Chancen und Potentiale für die Forschenden ebenso wie für die Wissenschaft insgesamt:

Chancen für die Forschenden
  • Ihre Forschungstätigkeit wird sichtbarer. Publikationen, deren zugehörige Daten offen verfügbar sind, werden signifikant häufiger zitiert (Piwowar und Visions 2013).
  • Die Publikation von Forschungsdaten wird zunehmend als wissenschaftliche Leistung anerkannt.
  • Sie stärken die Qualität und die Vertrauenswürdigkeit ihrer Forschungen, indem Sie anderen die Möglichkeit zur Verifizierung geben.
  • Sie entsprechen damit den aktuellen Anforderungen von Seiten der Forschungsförderung (siehe unten).
  • Sicherung der eigenen Forschungsinvestitionen durch Einrichtung von Sperrfristen ist möglich.
Chancen für die Wissenschaft
  • Datenpublikation eröffnet neue Forschungspotentiale, und zwar für Re-analysen mit neuen Forschungsfragen und –methoden oder für Kombinationen von Daten verschiedener Quellen.
  • Datenpublikation reduziert redundante Datenproduktion in der Wissenschaft, was Zeit und Geld spart.
 

Konkrete Aufforderungen zur Datenpublikation

Eines der wichtigsten internationales Bekenntnisse zu Open Science wurde von den Wissenschaftsministern der G8-Staaten 2013 unterzeichnet: “…to the greatest extent and with the fewest constraints possible, publicly funded scientific research data should be open […] whilst acknowledging the legitimate concerns of private partners.” [G8 Science Ministers 2013] Ebenso unterstützt das Bundesforschungsministerium Initiativen zum Forschungsdatenmanagement und mit diesen auch die Publikation von Forschungsdaten.

Die geowissenschaftliche Community engagiert sich international unter der Führung von AGU,  Earth Science Information Partners (ESIP) und Research Data Alliance (RDA) im Projekt Enabling FAIR Data für offene und FAIR Forschungsdaten und propagiert die Publikation von Forschungsdaten u.a. im Enabling FAIR Data Commitment Statement.

Unter den Forschungsförderern fordern beispielweise die EU (Pilot on open research data in Programm HORIZON2020) und die DFG (Leitlinien zum Umgang mit Forschungsdaten) dazu auf, Forschungsdaten offen zur Verfügung zu stellen.

Die Registry of Research Data Repositories re3data bietet einen globalen Überblick über Data Repositorien. Um Daten-Repositorien in re3data zu finden, die A) das Hochladen von Daten von Wissenschaftlern weltweit ermöglichen, und B) die hohen, vom Projekt Enabling FAIR Data festgelegten Standards einhalten, verwenden Sie Repository Finder, ein Tool, mit dem die re3data-Datenbank entsprechend gefiltert wird. Alternativ können Sie auch unserer Empfehlung von drei Data Repositorien folgen:

GFZ Data Services

GFZ Data Services ist der Kooperationspartner für die Datenpublikation über den FID GEO. Das Deutsche GeoForschungsZentrum GFZ, der Betreiber von GFZ Data Services, vergibt seit 2004 Digital Object Identifiers (DOI) an Datensätze. Diese Datensätze werden durch GFZ Data Services archiviert und publiziert und decken die gesamte Breite der geowissenschaftlichen Disziplinen ab.

Datensätze werden von den Autoren elektronisch hochgeladen und über ein elektronisches Formular (Metadaten-Editor) beschrieben. Dieser Metadaten-Editor besitzt Erläuterungen und Hilfsangebote, aber erfahrungsgemäß fällt es leicht, die entsprechenden Felder im Editor auszufüllen. Es ist auch ein „Quick Start Guide for Data Publications“ verlinkt.

Als Besonderheit bietet GFZ Data Services die Möglichkeit, die Forschungsdaten von ganzen Projekten oder alle Datensätze einer bestimmten Institution auf Websites auszugeben, die das „look and feel“ des jeweiligen Projekts oder der jeweiligen Institution haben.

GFZ Data Services unterstützt Institutionen dabei Metadaten vom GFZ Repositorium zu harvesten, um die Daten in eigene Systeme, z.B. eine Universitätsbibliographie, einzupflegen.

PANGAEA

Pangaea ist eine Open Access Datenbank, die georeferenzierte Daten aus den Erd- und Lebenswissenschaften archiviert, publiziert und zugänglich macht. Langzeitverfügbarkeit der Inhalte wird garantiert über die Betreiber-Institutionen von Pangaea, das Alfred-Wegener-Institut Helmholtz-Zentrum für Polar- und Meeresforschung und MARUM – Zentrum für Marine Umweltwissenschaften der Universität Bremen.

Datensätze werden von den Autoren elektronisch hochgeladen und über ein elektronisches Formular beschrieben. Daten- und Metadaten-Upload beginnen mit einer Anmeldung und werden über ein sog. Ticket System durchgeführt, das hier näher beschrieben wird. Es werden auch ausführliche Hinweise zum Daten-Upload, zum Workflow und zu möglichen Kostenbeteiligungen zur Verfügung gestellt.

EarthChem Library

Die EarthChem Library ist ein Datenrepositorium, das geowissenschaftliche Daten und andere digitale Objekte archiviert, publiziert und zugänglich macht. Detaillierte Hinweise für das Einreichen von Forschungsdaten geben die EarthChem Library Submission Guidelines. Der öffentliche Zugang zu eingereichten Datensätzen kann bis zu maximal 2 Jahren eingeschränkt, dh. mit einem Embargo versehen werden.

Der Zugang zu Daten in der EarthChem Library ist offen (Open Access) unter den Bedingungen der Creative Commons license BY-NC-SA 3.0. Die EarthChem Library sichert Langzeitverfügbarkeit ihres Inhalts durch die Zusammenarbeit mit dem Columbia University Libraries Digital Program. Datensätez in der Library werden mit einem Digital Object Identifier (DOI) ausgestattet. Die EarthChem Library ist Teil von IEDA, ein publication agent des DataCite Consortiums.

Daten zu veröffentlichen bedeutet, diese zugänglich und zitierbar zu machen. Dafür ist es wichtig, einen dauerhaft gültigen, elektronischen „Wegweiser“ zu erstellen, der die Daten im Internet immer auffindbar macht, auch wenn sich z.B. die Webadresse (URL) ändert, unter der der Datensatz zugänglich ist. Beim wissenschaftlichen Publizieren hat sich die DOI (digital object identifier) als elektronischer „Wegweiser“ etabliert. Mehr zu DOI und wie Sie eine DOI bekommen finden Sie weiter unten in „Häufig gestellte Fragen“.

Damit ihre Daten weltweit im Internet gefunden werden können, müssen die Daten eine Beschreibung bekommen, die für Suchmaschinen lesbar ist. Diese Beschreibung wird durch Metadaten vorgenommen. Mehr zu Metadaten und wie Sie konkret ihren Datensatz damit beschreiben finden Sie weiter unten in „Häufig gestellte Fragen“.

Damit andere Personen Ihre Daten beurteilen und nachnutzen können, müssen die Daten oft zusätzlich zu den maschinenlesbaren Metadaten eine Beschreibung bekommen, die Ihre Daten für andere erläutern.

Damit andere Personen wissen, in welcher Form die Nachnutzung ihrer Daten erlaubt ist, werden Ihre Daten mit einer elektronischen Lizenz versehen. Offene Lizenzen werden empfohlen, z.B. im Appell zur Nutzung Offener Lizenzen in der Wissenschaft der Allianz der Deutschen Wissenschaftsorganisationen, der auch von Forschungsförderern wie z.B. der DFG unterstützt wird. Als Lizenzen für offen zugängliche Forschungsdaten haben sich die Creative Commons Lizenzen etabliert. Dabei ist es möglich, verschiedene Optionen zu wählen: durch eine CC-BY Lizenz legen Sie zum Beispiel fest, dass andere Ihre Daten frei nutzen, verändern und sogar weitergeben dürfen und Sie dabei immer als Urheber der Daten zitieren müssen. Diese Lizenz wird von uns für die meisten Fälle empfohlen. Mehr zu elektronischen Lizenzen und unseren Empfehlungen finden Sie weiter unten in „Häufig gestellte Fragen“.

Die meisten Verlage der geowissenschaftlich relevanten Zeitschriften unterstützen die Publikation von Forschungsdaten. Sehr viele Verlage haben das „Statement of Commitment“ von COPDESS unterzeichnet, in dem sie sich verpflichten, Datenpublikationen zu unterstützen und Zitate von Datensätzen in den Referenzlisten der Fachartikel zu akzeptieren. Zu den Unterzeichnern gehören unter anderem Copernicus, Elsevier, Science, SpringerNature, Wiley sowie Gesellschaften wie die American Geophysical Union, die European Geosciences Union und die Geological Society of London.

Fachspezifische Datenrepositorien bieten Mehrwerte, die in der Regel von Verlagen nicht zur Verfügung gestellt werden.

Die Möglichkeit, elektronische Datensupplemente wissenschaftlichen Artikeln hinzuzufügen, gibt es bei den Verlagen seit über 10 Jahren. Dies war zu Beginn die einzige Möglichkeit, Forschungsdaten überhaupt zu veröffentlichen. Heute gibt es Datenrepositorien (= spezielle elektronische Archive nur für Forschungsdaten), und diese legen in der Regel großen Wert auf die Publikation nach anerkannten Standards, wie sie im Projekt Enabling FAIR Data entwickelt und umgesetzt werden: zum Beispiel wird bei fachspezifischen Datenrepositorien die Qualität der Metadaten (und der Daten) von Fachleuten geprüft. Datenrepositorien haben viel Erfahrung mit der Kuratierung und der Langzeitarchivierung der Daten.

Daher wird inzwischen auch von Seiten sehr vieler Verlage empfohlen, Forschungsdaten über fachspezifische Datenrepositorien zu veröffentlichen und diese mit den wissenschaftlichen Artikeln bei den Verlagen zu verlinken. Diese Empfehlung ist Teil des COPDESS „Statement of Commitment“, zu dessen Unterzeichnern unter anderem Copernicus, Elsevier, Science, SpringerNature, Wiley sowie Gesellschaften wie die American Geophysical Union, die European Geosciences Union und die Geological Society of London gehören.

Ja. Und was andere mit Ihren Daten machen dürfen, das bestimmen Sie selbst. Damit klar ist, in welcher Weise Ihre Daten nachgenutzt oder eben auch nicht genutzt werden dürfen, werden die Urheberrechte und Zugriffsrechte in einer Lizenz beschrieben, die mit den Daten fest verbunden ist. Wir empfehlen Ihnen eine geeignete Lizenz und beraten Sie zu dem Thema.

Ja, die Einrichtung von Sperrfristen ist möglich. Nachdem Ihre Daten in unserem System zur Publikation vorbereitet sind, sind die Daten innerhalb der Sperrfrist nicht öffentlich zugänglich. Aber es gibt schon jetzt Vorteile für Sie: über die öffentlich zugänglichen Metadaten Ihres Datensatzes ist die Publikation weltweit findbar und mit der vergebenen DOI können ihre Daten schon jetzt zitiert werden.

Forschungsdatenmanagement


Forschungsdatenmanagement umfasst kurz gesagt alle Methoden und Verfahren, die zur Sicherung der langfristigen Nutzbarkeit von Forschungsdaten angewendet werden. Die Publikation von Daten ist ein Teil des Datenmanagements.

Die Broschüre „Einstieg ins Forschungsdatenmanagement in den Geowissenschaften“ beschreibt die verschiedenen Aspekte des Forschungsdatenmanagements und bietet viele weiterführende Weblinks.

Beratung


Wir beraten Wissenschaftlerinnen und Wissenschaftlern sowie Informationsabteilungen der Forschungseinrichtungen zur Publikation von Forschungsdaten. Auch Herausgeber von Zeitschriften stehen vor neuen Aufgaben, wenn Forschende wünschen, dass die Forschungsdaten Ihrer Textpublikation elektronisch publiziert werden. Einen Katalog für „Häufig gestellte Fragen“ rund um das Thema Daten Publikationen, der Ihnen erste Antworten auf Ihre Fragen gibt, haben wir zusammengestellt. Wenn Sie mehr wissen möchten und weitere Fragen haben, kontaktieren Sie uns bitte.

Wir publizieren Ihre Daten


Wenn Sie Daten über den FID GEO publizieren möchten, kontaktieren Sie uns bitte. Wir besprechen mit Ihnen die nötigen Schritte. Die Datenpublikation über den FID GEO wird zusammen mit Spezialisten von GFZ Data Services am Deutschen GeoForschungsZentrum GFZ in Potsdam durchgeführt, die mit geowissenschaftlichen Daten vertraut sind. GFZ Data Services betreut das Datenrepositorium des GFZ und veröffentlicht seit 2004 Datensätze mit DOIs.