Datenbibliothek für Materialforschende
Das FAIRmat-Konsortium schafft eine Plattform für FAIRe Forschungsdaten in den Materialwissenschaften
Terrabytes an Daten: Nicht nur die Ergebnisse materialwissenschaftlicher Publikationen aufzubewahren, sondern auch alle Messdaten, die auf dem Weg dorthin anfallen, ist Ziel des Konsortiums FAIRmat. Die Bereitstellung der Daten soll nicht nur redundante Forschung verhindern, sondern Forschenden auch als Ausgangspunkt für weitere Analysen dienen.
Materialforschende sollen hier künftig mit wenigen Klicks die Messdaten zu ihren Experimenten hochladen können: Die Vision von FAIRmat ist eine dezentrale Datenbank, die sich gezielt nach Materialeigenschaften durchsuchen lässt und sich an den FAIR-Maßstäben orientiert. So sollen Messdaten aus den Materialwissenschaften nicht nur auffindbar (Findable), sondern auch zugänglich sein (Accessible). Zudem werden die Daten so aufbereitet, dass sie vergleichbar werden (Interoperable) und Forschende sie über verschiedene Kontexte hinweg wiederverwenden können (Reusable).
Ein besonderer Kniff: Die Plattform erkennt zum Beispiel auch, mit welchem Computercode Forschende ihre Daten berechnet haben, und bringt sie automatisiert in eine einheitliche Form. Im Rahmen des Vorgängerprojekts NOMAD können Forschende mithilfe dieser Funktion bereits Rechnungen hochladen. Ähnliches macht das FAIRmat-Team nun sukzessive für experimentelle Daten möglich. „Wer auf der Plattform nach bestimmten Kriterien Materialien sucht und auswählt, soll am Ende sehen können, was die ganze Welt zu diesem Thema gemessen oder berechnet hat“, erklärt Claudia Draxl, Physikprofessorin an der Humboldt-Universität zu Berlin und Koordinatorin des FAIRmat-Konsortiums.
Doch warum ist es eigentlich so wichtig, dass Materialforschende ihre Messdaten aufbereiten und sie miteinander austauschen? „Wenn ich eine Materialeigenschaft am Computer ausrechne oder etwas messe – etwa die Leitfähigkeit oder die optischen Eigenschaften eines Materials –, dann fallen auf dem Weg zum endgültigen Ergebnis viele wertvolle Informationen an“, erklärt Claudia Draxl. „Publiziert wird davon jedoch in der Regel nur ein sehr kleiner Teil.“ Wenn Rechenwege, Messbedingungen und Ergebnisse jedoch nicht zuverlässig erfasst, gespeichert und anderen zugänglich gemacht werden, lassen sich viele Rechnungen oder Experimente später nicht mehr nachvollziehen. Was in einem Projekt als Datenausschuss anfällt und ungenutzt in den Mülleimer wandert, kann zudem mit Blick auf eine andere Fragestellung durchaus zum Datengold werden. Daten aufzubewahren kann so dabei helfen, doppelte Messungen zu vermeiden.
Für die ersten fünf Jahre hat sich das Konsortium vorgenommen, fünf experimentelle Techniken und die Herstellung von Proben im Detail abzubilden. Zu parameterfreien quantenmechanischen Rechnungen kommen zudem auch klassische Simulationen hinzu. „Damit legen wir den Grundstein und werden danach relativ leicht auf weitere Techniken hochskalieren können“, meint Claudia Draxl. „Letztlich ist es aber natürlich ein nie endender Prozess, weil immer neue Experimente, Techniken, Mess- und Analysemethoden hinzukommen werden.“ Dass das Konsortium die Mammutaufgabe dennoch angeht, hat auch mit dem großen Erfolg des Vorgängerprojekts zu tun. „Mit dem NOMAD Laboratory hatten wir bereits zehn Jahre Erfahrung in der Sammlung und Aufbereitung von Rechnungen. Es sind immer wieder Kolleginnen und Kollegen aus den experimentellen Fächern an uns herangetreten und fragten, ob man das nicht auf Experimente erweitern könnte. Der Call von der nationalen Forschungsdateninfrastruktur (NFDI), die FAIRmat finanziert, kam dann gerade zur rechten Zeit.“
Nora Lessing für Adlershof Journal