WiSe19 AK NFDI
Vorstellung des AKs
Verantwortliche/r: Philipp (Wuppertal/Alumnus), Merten(jDPG)
Einleitung und Ziel des AK
Derzeit wird deutschlandweit eine "Nationale Forschungsdateninfrastruktur (NFDI)" im Rahmen eines Bund-Länder-Programms aufgebaut. Ganz viele Fächer haben da schon Arbeitsgruppen, Konsortien etc. gegründet, nun ergreift auch die DPG die Initiative, sich für die Physik dort einzubringen und unter dem Schlagwort NFDI4Phys eine Plattform für die Physik aufzubauen.
Zu dieser Initiative gab es im Sommer einer Workshop, und derzeit Ueberlegt die DPG, wie sie weiter vorgehen wird. Eine der bereits umgesetztes Konzept ist die Initiative FairMAT:
FAIRmat builds on extensive experience in computational materials science, i.e. the NOMAD (Novel Materials Discovery) Laboratory (https://nomad-coe.eu). Obviously, we are very well aware of the huge challenges ahead of us. In particular, data from experimental materials science are very complex. We have a strong team already working on all these aspects (see https://fairdi.eu/fairmat/structure). Also, the atmosphere at the FAIRmat meetings in March and July, and an informal spontaneous meeting at the last DPG Spring Meeting (organized by the leaders of the photoemission task), as well as the large number of registered FAIRmat participants and supporters give impressive evidence of an euphoric mood.
In a nutshell, FAIRmat follows three guiding principles:
- Open Data and sharing, if done properly, will significantly advance basic science and engineering;
- The NFDI should support science; it must not hamper the researchers’ actual work and needs;
- FAIRmat will not impose rules but support the community by developing and providing tools.
Handelt es sich um einen Folge-AK?
Ja. In Bonn hatten wir mit der Verantwortlichen von der DFG diskutiert. Es gab aus dieser Diskussion kein konkretes Ergebnis, aber viele Denkanstöße.
Wer ist die Zielgruppe?
Alle, die im Dunstkreis Praktika und Abschlussarbeiten oder Open Science unterwegs sind oder einsteigen wollen.
Wie läuft der AK ab?
Angleichung des Wissensstands der Teilnehmika, dann Erarbeitung einer Position (ggf. als PP)
Voraussetzungen (materielle und immaterielle)
nicht allzu betrunken sein
Materialien und weitere Informationen
Links oden im Text
Arbeitskreis: AK {{{Vorlage}}}
Protokoll vom tt.mm.jjjj
- Beginn
- HH:MM Uhr
- Ende
- HH:MM Uhr
- Redeleitung
- Vorname Nachname (Uni)
- Protokoll
- Vorname Nachname (Uni)
- Anwesende Fachschaften
Protokoll
https://protokolle.zapf.in/CutlpSu0Qn-7e5sa6Ehb-g#
https://www.overleaf.com/4186241966mdvsdmjsbrsd
Beginn
09:55 Uhr
Ende
HH:MM Uhr
Redeleitung
Philipp (Wuppertal/Alumnus), Merten(jDPG)
Protokoll
Christian Stoß (Ilmenau), Stephan Hagel (Giessen), [jemand da hinten]
Anwesende Fachschaften:
* FU Berlin * Bonn * Darmstadt * Erlangen * Frankfurt * Gießen * Göttingen * Hamburg * Ilmenau * jDPG * Kiel * Mainz * TU München * Potsdam * Oldenburg * Saarland * Wuppertal
- Bonn: Wo liegt das Problem? Ist das nicht trivial?
- Leitung: Formulierung eines Datenstandards anstatt bloßem Teilen von Daten (wer hat was wann erstellt?)
- TU München: Allgemeine Frage zu Konsortien
- Leitung: 3 Förderrunden, aktuell läuft die Zweite, jedes Jahr werden 10 Konsortien gefördert
- Bonn: Was ist das Kriterium zur Bildung eines Konsortiums?
- Leitung: Nicht nach Inhalten definiert, alle Konsortien am Ende zu einer großen Struktur zusammenbringen
- Oldenburg: Geht es auch darum, eine Hardware Infrastruktur aufzubauen oder lediglich um Dinge in Richtung Software und Dateninfrastruktur?
- Leitung: Hardware keine große Priorität (stellt auch kein Problem dar, da genug Datenkapazitäten)
Nächster Schritt: Brainstorming und Input
- Göttingen: Nutzung in normalem Übungsbetrieb als Student, auch schon zu Beginn des Studiums
* Leitung: Nutzung in der Lehre soll möglich sein
- Oldenburg: Anmeldung mit Studentenaccount?
- Göttingen: Öffentlicher Zugang?
* Zugang noch nicht klärbar * mindestens für Studierende zugänglich muss es schon sein
- Leitung: (Verweis Reso zu Open Science)
- Göttingen: Wie vermeidet man Missbrauch von Daten? (e.g. Aluhutphysik, Plagiatismus, etc.) Zugriff mit Uni-Account
- Mainz: Struktur: Welche Daten sollen in Struktur (differenzieren)? Nur die endgültigen veröffentlichten oder auch aktuelle Forschungsdaten?
* Leitung: Folglich Zugriffssicherung bei unveröffentlichten Daten wie z.B. am CERN
- Oldenburg: Schreibrecht für Studenten? (Daten aus Bachelor/Master Thesis, Diplomarbeit, etc.)
- Mainz: Sinnvoll auch ein Zugriff für Unternehmen
* Leitung: Keine konkreten Pläne
- Göttingen: Daten sollten auch in Rohfassung menschlich lesbar sein
* Kollektiv: Nein! Datenmenge deutlich zu groß
- Bonn: Tools zur Verfügung stellen zum Arbeiten mit den Daten
- Oldenburg: Standardisierte Git Server zur Verfügung stellen
* Git Uni-Server haben das Problem bei externen Zugriffsrechten
- Kiel: Überprüfung, Verifizierung von Daten (Frage der Seriösität)
* Wird schwierig, evtl. Peer Review? * Validierung auch nötig
- Göttingen: Förderprogramm für Replikation der Ergebnisse
- Bonn: Veröffentlichung der Daten zeitverschoben, um unabhängige Doppelblindstudien zu ermöglichen
* Verweis zum Punkt "Differenzieren"
- Mainz: Schwierigkeit von maschinellem Vergleich von Experimenten, Readme Dateien zu Datensätzen
* Überlegungen zu automatisierter Validierung erst mittelfristig, nicht in erster Antragsrunde
- Leitung: Sprecher von PTB/TIB als Ansprechpartner
- Bonn: Eventuell Hilfe von Datenexpteren vom CERN
- Saarland: Gibt es in anderen Ländern ähnliche Strukturen?
* Kanada: keine Länder mit vergleichbarer Datenstruktur, nur dezentrale Datensammlungen
- Kanada: Nicht alle Daten, sondern nur Daten, die für Veröffentlichungen verwendet werden, speichern -> Sonst zu viele Daten
* Leitung: Großexperimente Daten auf Plattform erst nach Auswertung auf öffentlich zugänglich einstellen (Verweis zu Differenzieren) * Oldenburg: Regelung durch Metadaten * Kanada: Hardwareproblem wegen sehr großer Datenmenge - Problem am Max Planck Institut schon vorhanden * Leitung: Bereits vor der zentralen Speicherung im NFDI Format speichern * Mainz: keine zentrale Bestimmung, ob Rohdaten veröffentlicht werden sollen (bedeutet mehr Speicherplatz) * TUM: Rohdaten notwendig für Reproduzierbarkeit * Leitung: Reproduzierbarkeit durch relevante Daten gewährleistet
- Hamburg: Wie schafft man es, dass nicht nur "Bequeme" Daten hochgeladen werden und andere Unterschlagen werden
* Leitung: Schwer umzusetzen, Vertrauensbasis als einzig sinnhafte Lösung
- Saarbrücken: Aktive Datenunterschlagung vs. Daten neu erstellen, um anderen Blickwinkel zu haben
* Leitung: Unterscheidung zwischen Testläufen und wirklich auszuwertenden Daten
- Göttingen: Elektronische Laborbücher wären in Metadaten sehr sinnvoll - Zugang und Nutzbarkeit
* Leitung: Open Notebook (da ist alles verfügbar)
- Göttingen: Helmholtzzentrum Berlin - Negativbeispiel für gut digitalisierte Laborbücher. Laborbücher waren analog und werden iwann nur noch archiviert
- TUM: Klarer Leitfaden zum Punkt Differenzierung
- Mainz: Code der Datenbank (insbesondere der Infrastruktur) größtenteils öffentlich zugänglich als Open Source
- Darmstadt: Wettbewerb in der Wissenschaft ist für Forschung kontraproduktiv
- Saarland: Wie sieht die Dokumentierung aus? Stichwortartig? Link zum Paper?
* Leitung: Steht in den Metadaten. Wie die Doku im einzelnen aussieht ist offen
- Göttingen: Heranführung der Studierenden schon im Studium (Nutzung im Praktikum, entsprechender Aufbau von Übungsaufgaben, Lehrdaten, Beispielaufgabenpool...)
- Gießen: Schon in frühen Semestern aufzeigen, dass es so eine Datenbank gibt und wie sie funktioniert - macht das Studium einfacher als bei späterer Entdeckung
- Mainz: Light-Version der Datenbank zur Lehre, Vollversion zur Forschung
* Leitung: Auch in Metadaten regelbar, bsp. ein Metadatenstempel "Zur Lehre geeignet"
- Oldenburg: Stadardisierung von Metadaten Tags. Was wären gute Datenbanken für Übungen zwecks Standardisierung?
* Leitung: Die Diskussion geht momentan zu weit
- Bonn: Urheberrechte? (Besonders bei Verwendung in der Lehre)
* Leitung: Einfach einen Datensatz für ein bestimmtes Problem finden
- Kanada: Paper finden, nachrechnen und nachvollziehen als Übungsaufgabe
Wen sollte man zum Vortrag einladen?
- Göttingen: Chemiker einladen, da diese eigenes Konsortium haben, die aber evtl. zusammenlegen wollen
- Mainz: Jurist für Wissenschaftsrecht
- Kanada: Vertreter von Bibliotheken, kennen sich gut aus
* Leitung: Technische Bibliothek in Hannover schon eingebunden
- Leitung: Studentischer Vertreter ja/nein? Wenn ja wen?
* Bonn: Student mit Erfahrung in Forschung und Datenverarbeitung (z.B. im Rahmen vom Thesis)
- Mainz: jDPG Bundesvorstand oder dergleichen (evtl einen der AK Leitung), da möglichst viel Erfahrung
* Leitung: ZaPF sollte Stellung zu nehmen
- Leitung: Didaktiker
* Mainz: Werden eventuell nicht ernst genommen * Kiel: Geht mehr um Meinungsinput als ums Ernstgenommenwerden * Mainz: Professor, der auch starken Einsatz in Didaktik UND Forschung zeigt
- Bonn: BMBF, höheres Ministerienwesen mit Wissenschaftsbezug
* Leitung: Politik eher irrelevant, da bereits beschlossen. Verwaltung scheint sinnvoller
- Leitung: DFG Vertreter?
- Bonn: 0815-Otto-Normal-Wissenschaftler (zufällige Person aus der Tagung)
* Kanada: Genau die sitzn im Publikum, sind folglich auch mit dabei
- Oldenburg: 0815-Otto-Normal-Student
- Göttingen: Verband der Deutschen Wissenschaftsjournalisten
* Leitung: solche Person als Moderator
- Mainz: AK sollte Vertreter entsenden. Konkrete Vorschläge: Philipp, Vicky
* Leitung: Besprechung im Plenum nötig?
- Kanada: Vertreter der Doktoranden
- Leitung: Big Data Mensch (Jemand mit Ahnung für technische Umsetzung)
- Oldenburg: Schlägt vor die Vorschläge zu diskutieren
* Leitung: Chemiker eher für einen späteren Talk
- Mainz: Juristen einklammern?
* Ilmenau: Gefährlich, wegen DSGVO etc., sehr viele Fallen und Fettnäpfchen * Leitung: Eher wichtig bei Umsetzung als beim Erstellen des Konzepts
- Leitung: Studi und Doktorand durch Überschneidung abdecken
* Kiel: Studi definitiv drinnen lassen, da andere Perspektive. Frage- wie sinnvoll? * Mainz: Findet Vorschlag der Leitung gut, da Leute, die sich für solch ein Thema engagieren, auch oft Engagement in der Lehre haben
- Saarland: Warum Wissenschaftsmanagement?
* Leitung: Antragsbewilligung für Umsetzung. Erwies sich in der Vergangenheit als hilfreich
- Mainz: TIB/PTB und Big Data selbe Person?
* Leitung: Nein.
- Bonn: Sicht des Studi kann auch über Didaktik mit einbezogen werden
Finale Zusammensetzung
- Wissenschaftsjournalist als Moderator
- Doktorand/Studierende als eine kombinierte Person mit viel Erfahrung
- TIB/PTB
- Didaktik (FV, AG Praktika)
- Big Data Mensch
- DFG, Wissenschaftsmanagement
Nächster Schritt: Positionspapier
- Statement für ein gemeinsames Physikkonsortium als Positionspapier (eins und nur eins)
- Bonn: Frage: Den Standard in internationale Strukturen einbinden?
- Leitung: Verweis zu Bestrebungen wie European Open Cloud etc.
- Saarbrücken: Warum bei Physik 3 unterschiedliche Modelle und erst später zusammenführen?
- Leitung: Diese Frage ist noch offen, versteht niemand so recht \*lange Geschichte\*, vermutlich historisch getrennte Anträge als Anlass- Idee des gemeinsamen Konsortiums
- Leitung: Sollten Statement formulieren, ein gemeinsames, übergreifendes Konsortium für Physik zu haben
- Saarland: Betonen, dass es im studentische Interesse liegt, einen themenübergreifenden Standard zu haben.
- Mainz: Wenn keine Einigung möglich und sich verschiedene Standards entstehen, könnte dies zu einem Fallstrick werden.
- Leitung: Die meisten Differenzen dabei sind weltanschaulicher Natur
- Saarland: Was ist mit interdisziplinären Daten? In mehreren Datenbanken? WICHTIG: Nicht hinten runter fallen lassen
- Leitung: DPG will das irgendwie machen (keine Ahnung, wie)
- Mainz: Mehr als gut auf Leute einreden scheint nicht möglich. Möglicher Geltungsdrang kann eventuell Soziale Kompetenzen überschatten
- Tafelanschrieb:
![](https://cyberterrori.st/NFDI/photo_2019-11-02_13-36-58.jpg "Logo Title Text 1")
![](https://cyberterrori.st/NFDI/photo_2019-11-02_13-37-00.jpg "Logo Title Text 1")
![](https://cyberterrori.st/NFDI/photo_2019-11-02_13-37-01.jpg "Logo Title Text 1")
Zusammenfassung/Ausblick
Bitte überlege vorher, ob der AK vielleicht in eine bereits existierende Kategorie einordbar ist (im Kategorienbaum unter Inhalte). Falls nicht kann die Sonstige Kategorie verwendet werden ([1]).