Forschungsdaten

Veröffentlichung in einem Software-Repositorium, siehe http://software.ac.uk/resources/guides/choosing-repository-your-software-project
Am häufigsten wird aktuell Github als Repositorium genutzt. Bei Github und auch Zenodo ist außerdem die Verbindung von DOIs mit Software-Versionen möglich, was den Indentifizierungsprozess und die Zitation erleichtert.
Veröffentlichung in einem Software-Journal, siehe http://software.ac.uk/resources/guides/which-journals-should-i-publish-my-software
Kurze Programme mit nur wenigen Zeilen können den Forschungsdaten als Textdokument beigelegt werden.

Es gibt einige legitime Gründe, den Zugang der Öffentlichkeit zu Ihren Forschungsdaten zu beschränken:

Sie beabsichtigen, ein Patent anzumelden.
Ihre Forschungsdaten enthalten vertrauliche, persönlich sensible Daten (zum Beispiel Umfragen und Interviews), die nicht anonymisiert werden können und/oder Sie haben kein schriftliches Einverständnis der Betroffenen für eine Veröffentlichung.
Ihre Forschung wird von einem kommerziellen Sponsor gefördert, der einer Veröffentlichung nicht zugestimmt hat.

Je nach Speicherort (Repositorium, Data Journal …) und individuellem Vorhaben können unterschiedliche Lizenzmodelle zur Auswahl stehen. Die meist verwendeten Lizenzmodelle im Forschungsdatenbereich sind momentan die Creative-Commons und die Open-Data-Commons.
Für eine konkrete Empfehlung wenden Sie sich bitte an die Ansprechpartnerin für Rechtsfragen in der Universitätsbibliothek, Petra Heermann.

Wer Zugriff auf Ihre Daten erhält, können Sie durch Lizenzen selbst bestimmen. Grundsätzlich haben Sie die Möglichkeit, Ihre Forschungsdaten zeitlich verzögert zu publizieren (sogenannte Embargo-Frist) oder nur die Metadaten zu veröffentlichen. Bitte beachten Sie hierzu die spezifische Anforderungen und Policies Ihrer Forschungsförderer und Verleger.

Zitationspraktiken variieren je nach Fachbereich und Verleger. Informieren Sie sich daher bei Kollegen innerhalb Ihres Fachbereichs, bei Ihrem Verleger oder in einem fachspezifischen Ratgeber zum wissenschaftlichen Arbeiten, welche Form der Zitation zu wählen ist.
Hier ein Orientierungsbeispiel für eine Datenzitation (innerhalb einer Literaturliste) gemäß der Empfehlung von FORCE11:

Autor(en) (Publikationsjahr): Titel der Forschungsdaten. Datenrepositorium oder Archiv. Version. Weltweit persistenter Identifikator (vorzugsweise als Link)

Die Zitation von Software kann analog dazu erfolgen:

Autor(en) (Publikationsjahr): Titel der Software (Versionsangabe) [Form, zum Beispiel Computer Software] Quelle als URL und/oder DOI (Datum des Abrufs)

Weiterführende Informationen und Beispiele:

Im Literaturverwaltungsprogram Endnote (ab Version X5) sind Zitatvorlagen für Forschungsdaten (Dataset) und Software (Computer Programm) zu finden.
Falls die DOI der zu zitierenden Daten bekannt ist, kann sie auf Crosscite mit unterschiedlichen Zitierstilen direkt in eine vollständige Quellenangabe konvertiert werden (http://software.ac.uk/so-exactly-what-software-did-you-use).
https://ltl.lincoln.ac.nz/research/citing-data/

Forschungsdaten sollten auf geeignete Weise archiviert werden, damit gewährleistet ist, dass sie langfristig und nachvollziehbar der Forschung zur Verfügung stehen.
Die Generierung von Forschungsdaten ist arbeits-, zeit- und kostenintensiv. Eine Archivierung ist deswegen oft günstiger als die erneute Datenerhebung, vor allem weil manche Daten nicht mehr reproduzierbar sind (zum Beispiel Wetterdaten). Die Archivierung von Forschungsdaten wird von Drittmittelgebern und zum Teil auch von wissenschaftlichen Verlagen selbst zur Sicherung der guten wissenschaftlichen Praxis empfohlen oder sogar vorgeschrieben. Sie selbst haben ebenfalls Vorteile hieraus.

Am besten eignen sich offene, nicht proprietäre Formate für die Archivierung. Das Projekt RADAR bietet eine gute, konkrete Übersicht darüber.

Nachnutzung bedeutet, dass die publizierten Forschungsdaten (je nach Lizenzbedingungen in unterschiedlichem Umfang) zitiert und/oder für andere spätere wissenschaftliche Fragestellungen verwendet werden können.

Metadaten sind strukturierte, zusätzliche Daten, die übergreifende Informationen über eine Ressource (zum Beispiel ein Forschungsdatenset) beinhalten. Diese Informationen können eine inhaltliche, technische Beschreibung, den Entstehungskontext, Angaben zur Erhaltung, die Beziehungen der Objekte im Datenset und vieles mehr enthalten.
Aus den unterschiedlichen Fachanforderungen an Metadaten bilden sich zahlreiche Metadatenstandards (zum Beispiel „Ecological Metadata Language“ und „Gene Ontology“ für Biologie). Diese standardisierte und maschinenlesbare Beschreibung der Daten ermöglicht erst das Auffinden, Referenzieren und Nachnutzen der Forschungsdaten.

Persistente Identifikatoren sind eindeutige Namen für Publikationen jeglicher Art (Ergebnisse, Daten, Software). Diese Namen sind in Tabellen mit der Adresse Ihrer Publikation verknüpft. Wenn sich der Link zu Ihrer Publikation ändert, muss nur die Adresse geändert werden, auf die der Persistente Identifikator verweist, während der Persistente Identifikator selbst gleich bleiben kann. Dies geschieht in der Regel automatisch durch den Repositorybetreiber und somit unmerklich für Autoren und Nutzer. Das macht Suchen, Zitieren oder Verlinken von Publikation und zugehörigen Daten & Software auch langfristig möglich.
Beispiele für Persistente Identifikatoren sind Digital Object Identifier (DOI), Uniform Resource Name (URN), ePIC und Handle.
Weitere Informationen dazu finden Sie im Kapitel 13.2 des nestor Handbuchs „Eine kleine Enzykopädie der digitalen Langzeitarchivierung“.

Policies der Forschungsförderorganisationen und Verlage

Forschungsdaten

Welche professionellen Möglichkeiten gibt es, Forschungssoftware zu veröffentlichen?

Wann sollte ich meine Forschungsdaten lieber nicht veröffentlichen?

Unter welchen Lizenzbedingungen kann ich meine Daten veröffentlichen?

Bedeutet Forschungsdatenmanagement, dass jeder uneingeschränkten Zugriff auf meine Daten erhält und was kann ich unternehmen, wenn ich vor der Veröffentlichung meine Forschungsdaten zuerst auswerten und analysieren möchte?

Wie werden Forschungsdaten/Forschungssoftware zitiert?

Weshalb sollten Forschungsdaten archiviert werden?

Welche Dateiformate sind für Archivierung geeignet?

Was bedeutet Nachnutzung von Forschungsdaten?

Was sind Metadaten und Metadatenstandards? Wozu dienen sie?

Was sind persistente Identifikatoren?

Wie lauten die konkreten Anforderungen der Wissenschaftsförderer oder der Verlage an das langfristige Management und an die Zugänglichkeit von Forschungsdaten?