Nachhaltiges Datenmanagement

Der verantwortungsvolle Umgang mit Forschungsdaten ist Teil der guten wissenschaftlichen Praxis und für die Nachvollziehbarkeit der Forschung, den wissenschaftlichen Fortschritt und die Verbreitung wissenschaftlicher Erkenntnis unerlässlich. Um den FAIR Data Prinzipien des nachhaltigen Forschungs Datenmanagements (FDM) gerecht zu werden, fallen zu unterschiedlichen Zeitpunkten eines Forschungsprojekts unterschiedliche Aufgaben innerhalb des FDM an. Im Folgenden werden die Aufgaben den drei unterschiedlichen Phasen, vor (Planungsphase), während (Implementierungsphase) und nach (Abschlussphase) der Projektdurchführung zugeordnet.

Auffindbar

Die Auffindbarkeit (Findability) von Daten wird durch die Vergabe von persistenten Identifikatoren (PID), Beschreibung der Daten in standardisierten Metadaten und das Eintragen der Metadaten in öffentliche und durchsuchbare Repositorien gewährleistet.

Learn more

Zugänglich

Die (Meta-)Daten müssen zur Sicherstellung der Zugänglichkeit (Accessibility) über ihren Identifikator (PID) abrufbar sein. Hierfür muss ein offenes und standardisiertes Protokoll verwendet werden, das ggf. eine Authentifizierung für den Zugriff auf geschützte Daten erlaubt.

Learn more

Interoperabel

Die FAIR-Prinzipien gewährleisten die Interoperabilität (Interoperability) von Forschungsdaten durch die Nutzung von standardisierten Datenformaten und Vokabularen, die ebenfalls den FAIR-Prinzipien folgen. Forschungsdaten sollen zur Verbesserung der Interoperabilität mit anderen Daten verknüpft werden.

Learn more

Wiederverwendbar

Die Wiederverwendbarkeit (Reusability) von Forschungsdaten ist nicht nur aus der Perspektive der Reproduzierbarkeit von Forschung relevant; durch die Vergabe eindeutiger Lizenzen und die Einhaltung ethischer und rechtlicher Standards werden Forschungsergebnisse für weitere Forschungsvorhaben nutzbar.

Learn more

Planungsphase

In der Planungsphase eines Forschungsprojekts sollte unter anderem ein Datenmanagementplan (DMP) entstehen. Dabei können Tools wie der Research Data Management Organiser (RDMO) unterstützen. Für Projekte, die über Drittmittel finanziert werden sollen, ist es zudem wichtig, die Vorgaben der Fördergeber zum FDM genau zu kennen.

Dat­en­man­age­ment­plan

Fördergeber fordern zunehmend die Einreichung ausführlicher Datenmanagementpläne (DMP), gleichzeitig bieten sie die Möglichkeit, zusätzliche Gelder für deren Umsetzung zu beantragen. Ein DMP beschreibt, welche Forschungsdaten innerhalb eines Forschungsprojekts produziert, wie diese dokumentiert und archiviert werden und welche Nachnutzungsmöglichkeiten bestehen. Er stellt sowohl einen Leitfaden für den Projektverlauf als auch für den Verbleib der Daten nach Projektende dar. Eine Übersicht über die generellen FDM-Anforderungen einzelner Fördergeber finden Sie hier. Sollten Sie Fragen zur Erstellung eines DMPs haben oder sich ein Feedback zu einem DMP-Entwurf wünschen, wenden Sie sich an das Forschungsdatenmanagement-Team der UPB.

Ein DMP sollte folgende grundlegende Fragen beantworten:

  • Was ist das Ziel des Projekts? Welche Einrichtungen/Personen werden miteinbezogen?
  • Welche Forschungsdaten werden dafür verarbeitet (erhoben/verwendet/gespeichert/nachgenutzt etc.) und wie fließen diese Daten (Datenflussdiagramm)?
  • Welche (fachspezifischen) Standards werden angewendet/berücksichtigt (z. B. Datenformate, Metadaten, Ontologien)?
  • Welche Forschungsdaten werden dafür erhoben/nachgenutzt und wie?
  • Welche (fachspezifischen) Standards werden angewendet / berücksichtigt (z. B. Datenformate, Metadaten, Ontologien)?
  • Wie wird die Speicherung, Sicherung, Archivierung und ggf. Zugänglichmachung von Forschungsdaten organisiert? Mit welchen Datenvolumina ist zu rechnen?
  • Gibt es rechtliche, zeitliche oder andere Einschränkungen für die Zugänglichmachung von Forschungsdaten, die berücksichtigt werden müssen?
  • Wer übernimmt im gesamten Prozess welche Verantwortlichkeiten?
  • Wer entscheidet über Mittel und Zwecke der Datenverarbeitung?
  • Welche Kosten und Folgekosten fallen im Projekt an und wie werden sie abgedeckt?

Re­search Data Man­age­ment Or­gan­iser (RDMO)

Mit dem Research Data Management Organiser (RDMO) bieten wir Ihnen ein Tool, das Sie bei der Erstellung eines DMP unterstützen soll. Das Tool führt Sie durch alle Fragen, die für einen DMP zu beantworten sind und gibt dabei hilfreiche Hinweise zur Beantwortung. Es kann dafür verwendet werden, einen DMP für die Beantragung von Fördergeldern zu erstellen und im laufenden Forschungsprozess immer wieder Änderungen aufzunehmen (z.B. neue Datensätze anlegen). Momentan haben Sie auf der RDMO-Instanz der UPB Zugriff auf einen Fragenkatalog, der sich an den von der deutschen Forschungsgemeinschaft (DFG) empfohlenen Checkliste für einen angemessenen Umgang mit Forschungsdaten orientiert. Zukünftig sollen auch für einzelne Fördergeber spezifische Fragenkataloge mit aufgenommen werden. Bei Fragen oder für Feedback zu diesem Tool, melden Sie sich gerne beim Forschungsdatenmanagement-Team der UPB. 

An­for­der­ungen von Förderge­bern zum Forschungs­dat­en­man­age­ment (FDM)

Sind An­gaben zum FDM bei der Bean­tra­gung von Fördergeld­ern ver­p­f­lichtend?

Für Förderanträge an die Bundesministerien gibt es (noch) keine einheitlichen Anforderungen an das FDM. Einzelne Ausschreibungen können jedoch konkrete Vorgaben zum FDM beinhalten, beachten Sie daher die jeweiligen Förderrichtlinien.  

Wie im „Aktionsplan Forschungsdaten“ des BMBF festgehalten, sollen jedoch alle Zuwendungsempfänger verpflichtet werden, im Sinne der FAIR-Prinzipien ihre im Projekt erhobenen Daten systematisch, möglichst standardbasiert zu verarbeiten und aufzubewahren.

In welch­er Form müssen An­gaben zum FDM im Forschungsan­trag gemacht wer­den?

Die Bundesministerien erwarten zwar, dass Angaben zum FDM in Förderanträgen aufgenommen werden, jedoch gibt es bisher nur bei einzelnen Ausschreibungen konkrete Vorgaben, beachten Sie daher die jeweiligen Förderrichtlinien.  

Sollte es in Ihrer Ausschreibung keine konkreten Anforderungen zum FDM geben, empfehlen wir Ihnen, sich an den grundlegenden Fragen zur Erstellung eines DMPs zu orientieren oder unser RDMO zur schrittweisen Erstellung eines DMPs zu nutzen.

Muss jeder Ver­bund­part­ner ein ei­genes FDM-Konzept vor­le­gen?

Dazu gibt es keine allgemeinen Vorgaben. Konkrete Vorgaben können in den einzelnen Ausschreibungen genannt werden, beachten sie daher die jeweiligen Förderrichtlinien.

Gibt es För­der­mög­lich­keiten für Kos­ten, die durch FDM an­fal­len?

Ja, in begründeten Fällen (z.B. große Verbundvorhaben mit einem erhöhten FDM-Aufwand) können Mittel für FDM beantragt werden. Hierbei sind auch die jeweiligen Förderrichtlinien zu beachten.

Sind An­gaben zum FDM bei der Bean­tra­gung von Fördergeld­ern ver­p­f­lichtend?

In allen Förderprogrammen der DFG, in denen ein Arbeitsprogramm für ein Forschungsvorhaben beschrieben wird, sind Angaben zum FDM verpflichtend. Bitte beachten Sie die Website der DFG zum FDM für detaillierte Anforderungen in den einzelnen Förderprogrammen.

In welch­er Form müssen An­gaben zum FDM im Forschungsan­trag gemacht wer­den?

Grundlage für die Angaben zum fDM sind die Checkliste und fachspezifische Empfehlungen der DFG. Zur schrittweisen Erstellung eines DMPs nach Vorgaben der DFG können Sie auch unser RDMO nutzen.

Muss jeder Ver­bund­part­ner ein ei­genes FDM-Konzept vor­le­gen?

Nein, im Verbund kann ein gemeinschaftliches Konzept entwickelt werden.

Gibt es För­der­mög­lich­keiten für Kos­ten, die durch FDM an­fal­len?

Ja, in allen Förderprogrammen der DFG gibt es beantragbare Mittel für das FDM und die Nachnutzbarkeit sowie Verfügbarmachung der Daten. Für den Auf- und Ausbau von Forschungsdateninfrastrukturen oder von methodischen Ansätzen für den Umgang mit Forschungsdaten stehen spezifische Förderangebote der DFG zur Verfügung.

Sind An­gaben zum FDM bei der Bean­tra­gung von Fördergeld­ern ver­p­f­lichtend?

In allen Linien von Horizon Europe sind Angaben zum FDM verpflichtend. Innerhalb der ersten 6 Projektmonate muss ein DMPs eingereicht werden, der jeweils zur Projekthälfte und zu Projektende aktualisiert werden muss (siehe Annotated Model Grant Agreement). Um die Aktualisierungen des DMPs zu vereinfachen, empfehlen wir Ihnen die Nutzung des RDMO.

In welch­er Form müssen An­gaben zum FDM im Forschungsan­trag gemacht wer­den?

Es gibt keine festen Vorgaben wie der DMP auszusehen hat, zur Unterstützung gibt es jedoch sowohl für ERC-Grants (siehe Dokumentenübersicht des ERC für die aktuelle Version) als auch die übrigen Horizon Europe Förderlinien Templates (siehe Templates&forms bei den Reference Documents für die aktuelle Version). Außerdem gilt, dass die im Projekt generierten Daten in einem geeigneten Repositorium veröffentlicht werden müssen (Ausnahmen nur in Einzelfällen).

Muss jeder Ver­bund­part­ner ein ei­genes FDM-Konzept vor­le­gen?

In der Regel wird ein gemeinsames FDM-Konzept vorgelegt.

Gibt es För­der­mög­lich­keiten für Kos­ten, die durch FDM an­fal­len?

Ja, in allen Förderlinien von Horizon Europe gibt es beantragbare Mittel für das FDM und die Nachnutzbarkeit sowie Verfügbarmachung der Daten (z.B. Kosten für Open Access Publikationen der Daten).

Implementierungsphase

In der Implementierungsphase eines Forschungsprojektes geht es um die Datenerhebung und Speicherung. Um die einzelnen Schritte der Datenerhebung dauerhaft nachvollziehen zu können, ist deren Dokumentation essentiell. Hierbei kann die Nutzung eines elektronischen Laborbuches hilfreich sein. 

Daten­er­hebung

Bei der Datenerhebung – wie während der gesamten Projektlaufzeit – sollten Sie möglichst auf Open-Source-Programme zurückgreifen, die Daten in einem offenen, nicht an das Programm gebundenen Dateiformat speichern. Sollten Sie auf ein proprietäres System angewiesen sein, empfiehlt sich trotzdem der Export in offene Dateiformate, um Abhängigkeiten von einzelnen Programmen entgegenzuwirken. Auch sollten die Daten möglichst schon bei der Erhebung mit Metadaten beschrieben werden, um die Nachvollziehbarkeit ihres Entstehungskontextes sowohl innerhalb des Projektes als auch in Hinblick auf ihre evtl. spätere Veröffentlichung zu gewährleisten. In den verschiedenen Fachrichtungen haben sich eigene Standards von Metadaten entwickelt. Die Orientierung an diesen Standards kann zu einem besseren Austausch Ihrer Daten führen.

 

Elektron­is­che Labor­büch­er

In einem Laborbuch wird die Planung, Durchführung und Auswertung eines Laborversuchs dokumentiert. So bleibt die wissenschaftliche Tätigkeit für die Forschenden selbst, aber auch für Dritte nachvollziehbar, beispielsweise im Falle eines Personalwechsels oder Rechtstreits. Elektronische Laborbücher sind Programme, die zusätzlich zu einer reinen Notizbuchfunktion weitere Features bieten, die speziell auf die wissenschaftliche Arbeit zugeschnitten sind (z.B. teilweise automatische Vergabe von Metadaten). Es gibt eine Vielzahl an elektronischen Laborbüchern für verschiedene Fachbereiche, Orientierung bei der Auswahl kann der „ELN Finder“ von ZB MED und TU Darmstadt bieten.

Die Uni Paderborn wird zukünftig eine eigene Instanz des weit verbreiteten Open-Source-Laborbuchs eLabFTW anbieten. Auch wenn sich die eLabFTW-Instanz der UPB noch im Testbetrieb befindet, und wir Ihnen empfehlen, zu diesem Zeitpunkt noch keine sensiblen Daten hochzuladen, können Sie sich hier schon jetzt anmelden und einen Eindruck des Laborbuchs gewinnen.

Speicher­ung der Daten

Während des laufenden Forschungsvorhabens sollte darauf geachtet werden, dass die Speicherung der entstehenden Daten bestimmte Qualitätsstandards erfüllt. Beispielsweise muss sichergestellt sein, dass nur Forschende auf dei Daten zugreifen können, die dazu berechtigt sind. Außerdem müssen regelmäßige Sicherungen durchgeführt werden, um den Datenverlust im Falle physischer Zerstörung oder menschlicher Fehler möglichst gering zu halten.

Je nach Art der Daten bieten sich verschiedene Speichermöglichkeiten an, etwa der Netzwerkspeicher der Universität, die Online-Plattform GitLab, oder der Cloud-Speicherdienst Sciebo. 

Speich­er­mög­lich­keiten

Für nichtbinäre Daten (etwa reine Textdaten oder Programmcode) empfiehlt sich die Ablage in GitLab, denn hier werden Daten nicht nur gespeichert, sondern darüber hinaus versioniert. Jede Änderung in der Projektlaufzeit kann auf diese Weise nachvollzogen und ggf. rückgängig gemacht werden. Außerdem erlaubt GitLab das parallele Arbeiten an den Daten und bietet weitere Instrumente des Projektmanagements, wie etwa ein Ticketsystem. Da das ZIM eine eigene GitLab-Instanz betreibt, bleiben die Daten außerdem innerhalb der Universität. Mehr Informationen erhalten SIe auf dem HilfeWiki des ZIM.

Das ZIM betreibt einen Netzwerkspeicher, der Angestellten, Studierenden und Gästen der UPB zur Verfügung steht. Die Daten liegen dabei redundant auf mindestens drei verschiedenen Festplatten. Regelmäßige Snapshots des Netzwerkspeichers schützen die Daten vor versehentlichem Löschen und Überschreiben. Ein Backup erfolgt jede Nacht automatisch. Da er die Daten nicht verschlüsselt, muss bei Bedarf selbst für eine Verschlüsselung gesorgt werden.

Sciebo ist ein nichtkommerzieller Cloud-Speicherdienst, an dem 22 Hochschulen aus NRW teilnehmen. Er steht Angehörigen dieser Hochschulen für Forschung, Studium und Lehre zur Verfügung. Er eignet sich besonders für Daten, die auf GitLab nicht abgelegt werden können. Sciebo ermöglicht die die Synchronisation von Daten auf verschiedenen Geräten und das gemeinsame Arbeiten an Dokumenten. Besonders für große Datenmengen (bis 2 TB) empfiehlt sich in einem Forschungsprojekt das Anlegen einer Sciebo-Projektbox. Da Sciebo die Daten nicht verschlüsselt, muss bei Bedarf selbst für eine Verschlüsselung gesorgt werden. Mehr Informationen erhalten SIe auf dem HilfeWiki des ZIM.

Abschlussphase

Nach Projektabschluss müssen die im Projekt entstandenen Forschungsdaten – entsprechend der DFG-Leitlinie zur Sicherung guter wissenschaftlicher Praxis – für mindestens 10 Jahre archiviert werden. Dies geschieht z.B. durch die Ablage der Daten in geeignete Datenarchiven oder Repositorien. Wann immer möglich, sollen die Forschungsdaten für die weitere Nutzung frei zugänglich gemacht werden, dies ist auch in der Leitlinie zu Forschungsdaten der UPB verankert. Sowohl bei der Nutzung als auch bei der Veröffentlichung von Daten ist zu prüfen, ob diese dem Urheberrecht unterliegen. Durch die Vergabe von entsprechenden Lizenzen ist es möglich, auch urheberrechtlich geschützte Daten für andere Forschende zugänglich zu machen. Weiterführende Informationen rund um die Veröffentlichung und Archivierung von Forschungsdaten finden Sie auf der Informationsplattform forschungsdaten.info.  

Re­pos­it­ori­en

Repositorien sind Speicherorte für digitale Forschungsdaten. Je nach Repositorium können Daten hier für mehrere Jahre oder dauerhaft, unter Open-Access- oder Restricted-Access-Regelungen, fachspezifisch oder generisch archiviert werden. Ein Repositorium garantiert dabei nicht nur die reine Speicherung der Daten, sondern ermöglicht häufig durch die Verbindung mit Metadaten und der Nutzung von Suchfunktionen auch ihre bessere Auffindbarkeit. Aktuell stellt die UPB kein eigenes Repositorium zur Verfügung.

Als generisches Repositorium empfehlen wir den von der Europäischen Kommission finanzierten Dienst Zenodo. Zenodo archiviert ohne zusätzliche Kosten Datenmengen von bis 50 GB über einen Zeitraum, der über die geforderten 10 Jahre hinausgeht. Außerdem bietet Zenodo viele Vorteile für die Publikation der Daten wie etwa die die Verknüpfung mit Lizenzen und die automatische Vergabe eines Persistent Identifiers (PI). Ein PI, wie z.B. DOI,  ist ein auf Dauerhaftigkeit ausgelegter (digitaler) Identifikator, der einen Datensatz eindeutig bestimmt. Anders als URLs bleibt ein PI auch dann erhalten, wenn ein Datensatz an einen anderen Ort verschoben wird. Weitere Informationen zu PIs finden Sie hier.   

Wie finde ich ein geeignetes Re­pos­it­ori­um für meine Daten?

Einen Vergleich von verschiedenen generischen Repositorien bietet Ihnen The General Repository Comparison Chart.

Um sich unter der Vielzahl an fachlichen Repositorien einen Überblick zu verschaffen, bieten sich Repositorienregister an, die Repositorien auflisten und z.B. nach Disziplin filtern. Re3Data, ROAR und OPENDOAR registrieren Repositorien etwa international, während sich RIsources besonders für die Suche nach deutschen Repositorien eignet.  

In den meisten Fällen bieten auch die disziplinspezifischen Konsortien der nationalen Forschungsdaten Infrastruktur (nfdi) eine Übersicht an fachlichen Repositorien an.

  • Vorgaben: Gibt es bestimmte Vorgaben des Fördergebers oder meiner Fachdisziplin?
  • Datentypen: Welche Datentypen und Formate erhebe ich und sind diese im Repositorium zulässig?
  • Datenvolumen: Welches Datenvolumen benötige ich?
  • Speicherdauer: Bietet das Repositorium eine Speicherdauer von mindestens 10 Jahren?
  • Access-Regelungen: Wer soll nach Veröffentlichung welchen Zugriff auf meine Daten haben? Bietet das Repositorium die Möglichkeit den Zugriff zu restriktieren und meine Daten mit Lizenzen zu versehen?
  • Auffindbarkeit: Vergibt das Repositorium automatisch persisten identifier (z.B. DOIs), um die dauerhafte Auffindbarkeit meiner Daten zu gewährleisten?

Leitlini­en zum Umgang mit Forschungs­daten

Die Grundsätze der Universität Paderborn zum Umgang mit Forschungsdaten können der Leitlinie der UPB entnommen werden. Hier weist die Universität darauf hin, dass Forschungsdaten, Forschungsergebnisse und ggf. die eingesetzte Forschungssoftware öffentlich zugänglich durch die zuständigen Forschenden zu sichern sind. Des weiteren enthalten die Leitlinien Informationen zu Verantwortlichkeiten, Rechten und Pflichten im Umgang mit Forschungsdaten. Die Leitlinie kann auf den Webseiten des Forschungsdatenamanagements im Downloadbereich heruntergeladen werden.

Urhe­ber­recht

Einige Forschungsdaten sind urheberrechtlich geschützt. In diesem Fall dürfen andere Forschende sie nicht ohne Weiteres nutzen. Die Forschenden, die die Daten erzeugt haben, müssen ihrer Verwendung ausdrücklich zustimmen. Ob die Daten, die in einem Forschungsprojekt entstehen, urheberrechtlich geschützt sind, muss für den konkreten Einzelfall geprüft werden. Weiterführende Informationen zum Urheberrecht, können Sie folgenden Links entnehmen:

Im Zweifelsfall wird dringend empfohlen, die Rechtsberatung des Justiziariat (SG 4.5) der Uni Paderborn in Anspruch zu nehmen.

  • Messdaten, die rein maschinell erzeugt wurden, genießen in der Regel keinen Schutz. Erst ihre Anordnung, Einordnung oder Auswertung durch die Forschenden stellt eine schöpferische Leistung dar, die urheberrechtlich geschützt ist.
  • Metadaten, die aus (technisch ermittelbaren) Zahlenangaben bestehen (z. B. Breite, Höhe, Gewicht, Speicherbelegung) sind in der Regel nicht geschützt.
  • Metadaten, die Kurzbeschreibungen oder Abstracts enthalten, sind in der Regel geschützt.
  • Textbasierte Forschungsdaten (z. B. Bildbeschreibungen, Interviews) sind in der Regel geschützt.
  • Darstellungen und Abbildungen (z. B. Karten, Skizzen, Fotos) sind in der Regel geschützt.

Lizen­zen

Um anderen Forschenden die rechtssichere Nutzung urheberrechtlich geschützter Forschungsdaten zu erlauben, empfiehlt sich die Verwendung der sogenannten „CC-Lizenzen“ der Creative-Commons-Organisation. Wenn Sie Ihre Forschungsdaten unter einer CC-Lizenz veröffentlichen, machen Sie sie dadurch „frei zugänglich“. Das bedeutet aber nicht automatisch, dass andere Forschende sie ohne Einschränkungen und für jeden beliebigen Zweck nutzen dürfen. Es ist möglich, die weitere Nutzung gar nicht, wenig oder stark einzuschränken. Eine Übersicht der verschiedenen Lizenzen erhalten Sie auf der Webseite der Creative-Commons-Organisation.  Entscheidungshilfe bei der Wahl der geeigneten Lizenz bietet deren „License Chooser“.

Für Software bzw. Quellcode sind die CC-Lizenzen in der Regel ungeeignet. Um den in Ihrem Projekt entstehenden Code frei zugänglich zu machen, stehen zahlreiche bewährte Lizenzen zur Verfügung, die speziell für Software entwickelt wurden. Zu den gängigsten zählen die GNU General Public License 3, die Apache-Lizenz und die MIT-Lizenz. Bei der Wahl der richtigen Lizenz unterstützt Sie zum Beispiel die Webseite „choosealicence.com“.