WiSe20 AK OpenData goes Praktikum

Aus ZaPFWiki

Vorstellung des AKs

Verantwortliche/r: Jeanette (alte Säckin/Göttingen)

Arbeitskreis: Open Data goes Praktikum

Protokoll vom 7.11.2020

Beginn
18 Uhr
Ende
(X) Uhr
Redeleitung
Jeanette
Protokollantum
Merten
Anwesende Fachschaften
Humboldt-Universität zu Berlin,
Universität Heidelberg,
Universität Rostock,
Universität Siegen,
Bergische Universität Wuppertal,
Universität Wien,
CERN

Protokoll

  • Zwei verschiedene Ansätze:
    • Wie mache ich meine im Praktikum aufgenommenen Daten zu Open Data?
    • Wie nutze ich Open Data im Praktikum?
  • Von Anfang an lernen, wie es "richtig" geht - Wie mache ich meine Daten ["FAIR"](https://www.go-fair.org/fair-principles/)? Was passiert zwischen der Messung "per Hand" und dem FAIRen Datensatz?
  • Vorschlag: Skizzieren eines Prakikumsversuchs, wie man sich diesen mit dem Open Data Konzept vorstellt
  • Was ist das Ziel?
    • Vorschlag an Praktikumsleiter\*innen
  • Arbeit im Arbeitspad (s. unten)
  • Nach Diskussion wird statt eines detailleirten ausgearbeiteten Praktikumsversuchs zunächst ein Positionspapier formuliert, in dem gefordert wird, dass in Praktikumsversuchen Daten nachnutzbar gespeichert werden sollen. FAIR-Prinzipien sollten in Praktikumsversuchen grundsätzlich vorkommen und nicht nur in einzelnen Versuchen.

Forderungen

  • Daten sollen nach den FAIR-Prinzipien gespeichert werden
  • Studierende sollen lernen, Daten und Metadaten nach dem FAIR-Prinzipien zu speichern (und zu veröffentlichen?)(Wichtig!!)
  • Daten sollen in einem einheitlichen Format präsentiert werden
  • Schrittweise von manueller Datenerfassung (Laborbuch/Versuchsprotokoll) zu mehr automatisierten Setups
  • Umgang mit (offenen) Repositorien soll erlernt werden (z.B. CERN-Daten, NOMACS, Zenodo, universitätseigenes Repo ...)
  • Studierende sollen die Möglichkeit erhalten zu lernen, wie Daten im Forschungsalltag im best case behandelt werden und dann nicht komplett überfordert sein, wenn sie echte Daten haben und damit umgehen müssen
  • Daten sollen über eine längere Zeit offen zugänglich gespeichert werden, um Meta-Auswertungen von Umwelteinflüssen, Verschleißteilen o.ä. zu ermöglichen
  • Meta-Praktikumsversuche, in denen Daten aus Vorgängerpraktika ausgewertet werden
  • Definition: Was sind Metadaten?

Arbeitspad

Kopie des Arbeitspads(Forderungen doppeln sich mit Protokoll

Vorschläge:

  • Alle teilen ihre Resultate im gleichen Format
  • Mit großen Datensätzen Statistik machen
  • Wie zitiere ich eigentlich Datensätze?
  • “Vergleich mit vorherigen Gruppen”
  • Problem: Confirmation Bias?
  • Reverse Engineering von Versuchen aus vorhandenen Datensätzen
  • Verschiedene Datensätze nutzen um Eigenheiten verschiedener Versuchsplätze zu analysieren
  • Vorbild Informatik: Wie dokumentiere ich meine Daten richtig?
  • Wichtigstes Thema: Wie erfasse ich meine Daten in einer nachnutzbaren Form?
  • Langfristige Speicherung sinnvoll, z.B. um zu sehen, wie sich Daten wegen Verschleiß verändern

Probleme:

  • “Freifahrtschein zum Abschreiben”
  • Problem: Praktikumsleiter*innen haben kaum Kapazitäten Innovationen umzusetzen
  • Detailliert ausgearbeitetes Konzept könnte hier helfen

Forderungen

  • Daten sollen nach den FAIR-Prinzipien gespeichert werden
  • Studierende sollen lernen, Daten und Metadaten nach dem FAIR-Prinzipien zu speichern (und zu veröffentlichen?)(Wichtig!!)
  • Daten sollen in einem einheitlichen Format präsentiert werden
  • Schrittweise von manueller Datenerfassung (Laborbuch/Versuchsprotokoll) zu mehr automatisierten Setups
  • Umgang mit (offenen) Repositorien soll erlernt werden (z.B. CERN-Daten, NOMACS, Zenodo, universitätseigenes Repo …)
  • Studierende sollen die Möglichkeit erhalten zu lernen, wie Daten im Forschungalltag im best case behandelt werden und dann nicht komplett überfordert sein, wenn sie echte daten haben und damit umgehen müssen
  • Daten sollen über eine längere Zeit offen zugänglich gespeichert werden, um Meta-Auswertungen von Umwelteinflüssen, Verschleißteilen o.ä. zu ermöglichen
  • Meta-Praktikumsversuche, in denen Daten aus Vorgaengerpraktika ausewertet werden
  • Definition: Was sind Metadaten?

Altes Zeugs

https://zapf.wiki/Kategorie:Praktikum

Positionspapier: FAIR und Open Data im physikalischen Praktikum

Antragssteller:innen

Jeanette Gehlert (Alumna), Philipp Jäger (Wuppertal|Manitoba), Manuel Längle (Uni Wien), Merten Dahlkemper (Alumnus), Christoph Blattgerste (Heidelberg)

Textvorschlag Positionspapier

Die ZaPF spricht sich dafür aus, dass Studierende im Rahmen der Praktika bereits ab dem Bachelor-Studium lernen, wie Daten nach den FAIR-Prinzipien [FAIR] erhoben, gespeichert und veröffentlicht werden. Diese Kompetenz ist Voraussetzung für datenbasierte Zusammenarbeit, etwa im Kontext der NFDI-Initiative, in der die ZaPF große Chancen sieht [NFDI]. Sie sind unter anderem in den Arbeitsgebieten der Einbindung in die Lehre und Ausbildung der Anträge der NFDI-Konsortien NFDI4Phys, PUNCH4NFDI oder FAIRMAT [NFDI4PHYS, FAIRMAT, PUNCH] und vielen anderen formuliert.

Studierende sollten nach Möglichkeit schrittweise in die vollständige, nachvollziehbare und korrekte Daten- und Metadatenerfassung eingeführt werden.

Darüber hinaus sollen Studierende den Umgang mit langfristig verwalteten Datenspeichern, sogenannten Repositorien, kennenlernen, um dadurch in die langfristige Speicherung von Forschungsdaten eingeführt zu werden. Neben offenen Repositorien wie Zenodo [ZENODO] können dies auch universitätseigene Datenrepositorien wie z.B. [GROData] sein. Um den Wert offener Datenquellen kennenzulernen, sollen diese Repositorien auch dazu verwendet werden, fremde Daten nachzunutzen. Hierbei sollte insbesondere auf Aspekte wie Lizenzen oder korrekte Datenzitation eingegangen werden.

In Grund- und Anfänger:innenpraktika ist diese Praxis ein “Grundstein für gutes wissenschaftliches Arbeiten” [Grund], wohingegen sie besonders in umfangreicheren Fortgeschrittenenpraktika als Vorbereitung auf “die aktuelle Laborpraxis” [Fort] und “das korrekte wissenschaftliche Arbeiten” [Fort] hilfreich ist.

Bisher sind die Daten, die im (Anfänger:innen-)Praktikum erhoben werden, in der Regel weder nachvollziehbar, noch vollständig gespeichert. Somit kann der Lerneffekt des Praktikums in Bezug auf Datenerfassung und -speicherung als eher gering eingeschätzt werden. Dabei bieten die Praktika oft die einzige Möglichkeit, den Umgang mit (Forschungs-)Daten vor Forschungarbeiten im Rahmen des Studiums kennenzulernen.

Konkreter gesprochen sollen Studierende in den Praktika die Möglichkeit haben, Daten sowohl von ihren Kommiliton:innen, als auch der früheren Kohorten einzusehen und mit auszuwerten, um Messfehler besser einschätzen zu können und die Diskussion von Versuchsergebnissen mit einer größeren Sicherheit durchführen zu können. Außerdem sollen Studierende die Möglichkeit erhalten, in einem Semester aufgenommene Daten eines Versuchs zu speichern und diese Daten dann im darauffolgenden Semester gemeinsam mit einem größeren Datensatz auszuwerten. Zusätzlich kann dann zwischen verschiedenen Ausgangsbedingungen und Aufbauten verglichen und der Einfluss verschiedener Parameter untersucht werden.

Ein wichtiger Teil nachhaltiger Forschung ist, dass Forschungsdaten nicht nur langfristig verfügbar, sondern vor allen Dingen für andere Wissenschaftler:innen verständlich und nutzbar bleiben. In letzter Konsequenz profitieren von einem Praktikum, das nach den FAIR-Prinzipien gestaltet wird, neben den Studierenden auch die Forschungsgruppen. Ein abwechslungreicherer Praktikumsbetrieb motiviert hierbei auch die Studierenden zusätzlich. Schlussendlich ernten die Forschungsgruppen, denen die Studierenden während ihrer Projektphasen angehören und so bereits wissen, wie man mit Forschungsdaten umgeht, die Erfolge dieses Konzepts.

Gerade im aufkeimenden “Post-Truth-Zeitalter” kommt Open Science eine kaum zu überschätzende gesellschaftliche Bedeutung zu [SpringerOS]. Wissenschaftler:innen von morgen sollten deshalb so früh wie möglich an das Konzept herangeführt werden um so “Open Science” als “Science just done right” zu verinnerlichen. [ResoOS]

[FAIR] https://www.go-fair.org/fair-principles/ [PUNCH] https://www.dfg.de/download/pdf/foerderung/programme/nfdi/absichtserklaerungen_2020/2020_nfdi_punch4nfdi.pdf [FAIRMAT] https://doi.org/10.5281/zenodo.4074973 [NFDI4PHYS] https://www.dfg.de/en/research_funding/programmes/nfdi/letters_of_intent_2020/index.html [ZENODO] https://www.zenodo.org [GROData] Beispielsweise gibt es an der Universität Göttingen das Portal GRO.Data: https://data.goettingen-research-online.de/ [ResoOS] https://zapfev.de/resolutionen/wise18/Reso_Open_Science/Resolution_Open_Science.pdf [Grund] https://zapfev.de/resolutionen/sose17/Praktika/PosPapier_Praktika.pdf [Fort] https://zapfev.de/resolutionen/sose19/Fortgeschrittenenpraktika/Fortgeschrittenenpraktika.pdf [SpringerOS] https://doi.org/10.1007/978-981-15-4276-3_2

Begründung

Die Ausgestaltung des Praktikums spielt für die ZaPF schon seit sehr langer Zeit eine Rolle. Dort ist immer wieder von dem Erlernen der guten wissenschaftlichen Praxis die Rede.

Im Verlauf der letzten zwei bis drei Jahre kamen dazu die Themen Open Science und Forschungsdatenmanagement immer stärker aufs Tableau, wobei sich herausstellte, dass dies in Zukunft immer stärker elementare Bestandteile dieser guten wissenschaftlichen Praxis werden.

Im NFDI-Papier aus Freiburg wurde ebenfalls erwähnt, dass Forschungsdatenmanagement über die NFDI ins Physikstudium eingebunden werden soll. Dieses Positionspapier führt diesen Gedanken weiter, indem es konkret skizziert, wie diese Themen in den physikalischen Praktika eingebunden werden können.

Ein zukünftiger Schritt könnte es sein, mit Praktikumsleiter:innen ins Gespräch zu kommen, um auszuarbeiten, wie ein solches Praktikum in der Praxis aussehen könnte.