Die Deutsche Gesellschaft für Psychologie (DGPs) hat als Fachgesellschaft neue Empfehlungen für Data Sharing entwickelt und verabschiedet, welche Offenheit, Transparenz und wissenschaftliche Integrität umfassend fördern. Die Kernbotschaft lautet, dass Rohdaten ein wesentlicher Bestandteil empirischer Publikationen sind und offen geteilt werden sollen. Die Empfehlungen enthalten auch praktische Ratschläge zur konkreten Implementierung dieser Werte, wie z.B. „Wann sollte Datenbereitstellern eine Koautorschaft bei einer Datennachnutzung angeboten werden?“ oder „Wie geht man mit den Datenschutzrechten der Studienteilnehmer um?“.
Im vergangenen Jahr hat sich die Diskussion in der psychologischen Forschung wegbewegt von der Frage „Haben wir eine Replikationskrise?“ hin zu „Ja, wir haben ein Problem und was können wir tun um dies zu beheben?“ und „Wie können wir die Änderungen implementieren?“. Wir brauchen sowohl Top-Down Veränderungen auf der Ebene der Institutionen, als auch Bottom-Up Ansätze wie lokale Open-Science-Initiativen. An dieser Stelle möchte ich eine große institutionelle Veränderung bezüglich offener Daten im Bereich der Psychologie vorstellen.
Drittmittelgeber fordern offene Daten
Die Deutsche Forschungsgemeinschaft (DFG), der größte öffentliche Geldgeber für Forschung in Deutschland, hat im September 2015 ihre Richtlinien zum Umgang mit Forschungsdaten aktualisiert. Die Kernbotschaft lautet: Öffentlich geförderte Forschung, inklusive der Rohdaten, gehört der Öffentlichkeit. Folglich sollten alle Forschungsdaten aus DFG-geförderten Projekten unverzüglich veröffentlicht werden, oder zumindest einige Monate nach der Beendigung des Forschungsprojekts (s. [1] und [2]). Darüber hinaus hat die DFG alle wissenschaftlichen Disziplinen aufgefordert, spezifische Empfehlungen zur Implementierung dieser Prinzipien zu entwickeln.
Die Deutsche Gesellschaft für Psychologie (DGPs) hat eine Arbeitsgruppe, bestehend aus Prof. Dr. Andrea Abele-Brehm (ehemalige Präsidentin DGPs), Prof. Dr. Mario Gollwitzer (Schriftführer DGPs) und Dr. Felix Schönbrodt eingerichtet, die ein Jahr lang an solchen Empfehlungen für den Bereich Psychologie gearbeitet hat. Ich möchte hier kurz über diese Empfehlungen und deren Entstehungsprozess berichten.
Der Entstehungsprozess unserer Empfehlungen
Bei der Entwicklung der Empfehlungen haben wir versucht, die Mitglieder der Fachgesellschaft möglichst breit mit einzubeziehen und die Weisheit vieler zu nutzen. Ein erster Entwurf (Februar 2016) wurde 6 Wochen in einem Internetforum diskutiert, in dem alle Mitglieder der DGPs kommentieren konnten. Aufbauend auf dieser Diskussion (und vielen weiteren persönlichen Gesprächen) wurde eine revidierte Version veröffentlicht und in einem Workshop mit einer kleineren Gruppe aus interessierten Mitglieder und einer Vertreterin der DFG diskutiert (Juli 2016). Außerdem hatten wir regelmäßigen Kontakt zu Mitgliedern des Fachkollegiums Psychologie in der DFG (die Mitglieder des Fachkollegiums haben zwischenzeitlich turnusgemäß teilweise gewechselt). Schließlich hatten die Vorsitzende aller Fachgruppen der DGPs und die Sprecher der Jungwissenschaftler/innen eine weitere Gelegenheit zu kommentieren. Am 17. September 2016 wurden die Empfehlungen offiziell von der Fachgesellschaft verabschiedet.
Ich denke dieser gründliche iterative Prozess war aus zwei Gründen sehr wichtig: Zum einen hat er die Qualität der Empfehlungen eindeutig verbessert, da wir viele hilfreiche Ideen und Kommentare von den Mitgliedern erhalten haben. Dadurch konnten einige Unstimmigkeiten beseitig und bestimmte Grenzfälle abgedeckt werden. Zum anderen war es wichtig, die Mitglieder mit ins Boot zu holen. Da diese neuen Empfehlungen zu offenen Daten die Art und Weise unserer täglichen wissenschaftlichen Arbeit in einigen Bereichen deutlich verändern werden, wollten wir von Anfang an möglichst viele Forscherinnen und Forscher ansprechen und vom Sinn und Nutzen von Open Science überzeugen. Natürlich sind nicht alle der über 4000 Mitglieder gleichermaßen überzeugt, doch das Thema hat nun beträchtliche Aufmerksamkeit in der Fachgesellschaft.
Ein Fokus der Entwicklung lag also auf Konsens und breiter Kommunikation. Gleichzeitig hatten wir aber das Ziel, starke und zukunftsweisende Empfehlungen zu entwickeln, die sich wirklich mit den gegenwärtigen Herausforderungen unseres Fachs auseinandersetzen und sich nicht mit dem kleinsten gemeinsamen Nenner zufriedengeben. Zu diesem Zweck mussten wir eine Balance zwischen verschiedenen Werten finden.
Eine Balance von Werten
Transparenz in der Forschung ↔ Datenschutz. Eine erste Besonderheit der Psychologie ist es, dass nicht Steine oder Elektronen untersucht werden, sondern Menschen, die Datenschutzrechte haben. Um es auf den Punkt zu bringen: Datenschutzrechte müssen respektiert werden und haben im Zweifelsfall Vorrang vor der Forschungstransparenz. Wenn Daten aber anonymisiert werden können, sollen offene Daten geteilt werden. Nicht-anonymisierbare Forschungsdaten können durch Scientific-Use-Files geteilt werden, bei denen der Zugang auf Wissenschaftler beschränkt ist. Wenn Daten aus datenschutzrechtlichen (oder anderen) Gründen nicht geteilt werden können, muss dies in der Publikation transparent gemacht werden. (Folglich sind die Empfehlungen kompatibel mit der Peer Reviewers‘ Openness Inititative). Die Empfehlungen enthalten klare Hinweise zu Datenschutz-Themen (auch wenn das Thema dort nicht abschließend behandelt werden konnte) und geben praktische Hinweise dazu, wie man beispielsweise die Einverständniserklärung so formuliert, dass die Forschungsdaten später auch tatsächlich geteilt werden können.
Wiederverwendung von Forschungsdaten ↔ Recht auf Erstnutzung. Eine zweite Balance betrifft die optimale Nachnutzung von Daten einerseits und das Recht der Erstnutzung durch die Originalautoren andererseits. Während der Entwicklung der Empfehlungen äußerten mehrere Diskussionsteilnehmer Angst vor „Forschungsparasiten“, die Daten von hart arbeitenden Wissenschaftlern „stehlen“. Ein weit verbreitetes Bauchgefühl ist: „Die Daten gehören mir“. Dem steht klar der Grundsatz gegenüber, dass Daten aus öffentlich geförderten Projekten auch öffentlich zugänglich sein sollten. Gleichzeitig brauchen wir aber auch Anreize, überhaupt erst Daten zu generieren. Wissenschaftler, die Daten erheben, haben natürlich ein Recht auf deren Erstnutzung und die Empfehlungen ermöglichen darüber hinaus eine Erweiterung dieses Rechts durch ein Embargo von 5 zusätzlichen Jahren (siehe unten). Letzten Endes müssen die Daten jedoch öffentlich werden. Wenn Daten standardmäßig offen sind, sollten Empfehlungen auch diskutieren und definieren wie die Wiederverwendung von Daten gehandhabt werden sollte. Unsere Empfehlungen machen Vorschläge, in welchen Fällen den Datenbereitstellern die Koautorschaft angeboten werden sollte und in welchen Fällen dies typischerweise nicht notwendig ist.
Verifizierung ↔ faire Behandlung der Originalautoren. Schließlich sollte Forschung reproduzierbar und verifizierbar sein, aber unter fairer Behandlung der Originalautoren. Die Empfehlungen besagen, dass bei jeder Veröffentlichung einer Reanalyse (dies bezieht auch Blogs und Präsentationen mit ein), die Originalautoren darüber informiert werden sollen. Diese können die Veröffentlichung nicht verhindern, aber haben die Chance darauf zu reagieren.
Zwei Arten der Datenveröffentlichung
Wir unterscheiden zwei Arten der Datenveröffentlichung:
Datenveröffentlichung Typ 1 bedeutet, dass alle Primärdaten offen geteilt werden sollten, die notwendig sind um diejenigen Ergebnisse zu reproduzieren, die in der Publikation berichtet wurden. Das kann also auch nur eine Teilmenge aller verfügbaren Variablen des vollständigen Datensatzes betreffen. Die Primärdaten sind ein grundlegender Bestandteil einer empirischen Publikation und eine Publikation ohne sie ist unvollständig.
Datenveröffentlichung Typ 2 bezieht sich auf die Veröffentlichung des vollständigen Datensatzes eines geförderten Forschungsprojekts. Die Richtlinien der DFG besagen, dass nach der Beendigung eines DFG-geförderten Projekts alle Daten – auch Daten, die noch nicht für Publikationen verwendet wurden – öffentlich gemacht werden sollen. Unveröffentlichte Null-Ergebnisse oder zusätzliche, explorative Variablen haben nun die Chance ans Tageslicht zu gelangen und von anderen Forschern nachgenutzt zu werden. Die Erfahrung zeigt, dass nicht alle geplanten Publikationen beim offiziellen Abschlussdatum eines Projekts fertiggestellt sind. Für diesen Fall erlauben unsere Empfehlungen, dass das Recht auf Erstnutzung durch eine Embargo-Periode um bis zu 5 Jahre verlängert werden kann, in der die (bis dahin unveröffentlichten) Daten nicht öffentlich gemacht werden müssen. Diese Embargo-Option betrifft nur Daten, die bisher noch nicht für eine Publikation genutzt wurden. Folglich kann dieses Embargo normalerweise nicht auf die Datenveröffentlichung Typ 1 angewendet werden.
Zusammenfassung & Ausblick
Zusammenfassend halte ich diese Empfehlungen für die bislang vollständigsten, praktischsten und spezifischsten Empfehlungen für Data Sharing in der Psychologie. (Natürlich enthalten die Empfehlungen selbst noch wesentlich mehr Details als hier berichtet wurde). Sie werden den Prinzipien der Offenheit, Transparenz und wissenschaftliche Integrität gerecht. Außerdem beschreiben sie keine abgehobenen ethischen Prinzipien, sondern geben sehr praktische Anleitung dazu, wie man Data Sharing in der Psychologie tatsächlich umsetzen kann.
Was sind die nächsten Schritte? Der Präsident der DGPs, Prof. Dr. Conny Antoni, und der Schriftführer Prof. Dr. Mario Gollwitzer haben bereits andere psychologische Gesellschaften (APA, APS, EAPP, EASP, EFPA, SIPS, SESP, SPSP) kontaktiert und unsere Empfehlungen vorgestellt, sowie alle Organzeitschriften der DGPs angeschrieben, mit der Bitte, die Empfehlungen zu bedenken und gegebenenfalls die Regularien für die Einreichung von Manuskripten anzupassen. Ein mittelfristiges Ziel wird sein, die Kompatibilität mit anderen bestehenden Empfehlungen zu prüfen, über die Angleichung verschiedener Empfehlungen innerhalb der Psychologie nachzudenken, sowie eine FAQ zu erstellen.
Da andere wissenschaftliche Disziplinen in Deutschland auch an ihrer fachspezifischen Implementierung der DFG-Richtlinien arbeiten, wird es interessant sein zu sehen, ob gemeinsame Linien existieren (obwohl sicherlich fortbestehende und notwendige Unterschiede zwischen den Anforderungen der Bereiche existieren werden).
Wenn Ihr Fachbereich auch derartige Empfehlungen/Richtlinien implementiert, sprechen Sie uns gerne an (felix.schoenbrodt@psy.lmu.de)
Download der Empfehlungen
Schönbrodt, F. D., Gollwitzer, M., & Abele-Brehm, A. (2017). Der Umgang mit Forschungsdaten im Fach Psychologie: Konkretisierung der DFG-Leitlinien. Psychologische Rundschau, 68, 20–35. doi:10.1026/0033-3042/a000341. [PDF Deutsch][PDF Englisch]
(Englische Übersetzung von Malte Elson, Johannes Breuer, and Zoe Magraw-Mickelson)