Wie lassen sich die Daten, die das Forschungsdatenzentrum des IÖR regelmäßig veröffentlicht, ganz praktisch nutzen? Die aktuellste Veröffentlichung des IÖR-FDZ gibt Interessierten dazu nun eine wichtige Arbeitshilfe an die Hand. Die Materialien, die das Team frisch veröffentlicht hat, gehen weit über traditionelle Publikationen von Forschungsergebnissen hinaus. Sie sind als sogenanntes „Jupyter Book“ aufbereitet, welches automatisiert aus dem Quellcode erzeugt und als interaktive Webseite publiziert wird. Dies ermöglicht es den Nutzenden nicht nur, jeden Arbeitsschritt von der Datengrundlage hin zu den Ergebnissen nachzuvollziehen, sondern auch live im Browser mit dem Code zu experimentieren. Als Anwendungsfall dient die Untersuchung des Zusammenhangs zwischen dem Vorkommen des Haussperlings (Passer domesticus) und der Siedlungsdichte in Sachsen. Die Daten hierfür werden direkt über die Programmierschnittstellen (APIs) der globalen Biodiversitätsdatenbank GBIF und des IÖR-Monitors der Siedlungs- und Freiraumentwicklung abgefragt.
„Unser Ziel ist es, eine Brücke zwischen der Forschungspraxis und den hohen Anforderungen an Transparenz und Reproduzierbarkeit zu schlagen“, erklärt Alexander Dunkel, einer der Autoren. „Wir dokumentieren nicht nur unsere Methoden, sondern stellen die gesamte technische Infrastruktur und die ‚Best Practices‘ zur Verfügung. Die Basis dafür ist unser IÖR-FDZ Carto-Lab – eine komplett eingerichtete, versionierte Arbeitsumgebung, die sicherstellt, dass unsere Analysen von jedem exakt nachvollzogen werden können. Das stärkt das Vertrauen in die Wissenschaft und ermöglicht eine effizientere und qualitativ hochwertigere Forschung.“
Entwickelt wurden die Materialien im Kontext des Konsortiums NFDI4Biodiversity, das Teil der Nationalen Forschungsdateninfrastruktur (NFDI) ist. „Die Förderung über einen Flexfund des NFDI4Biodiversity hat die Erstellung der Trainingsmaterialien erst möglich gemacht“, erläutert Claudia Dworczyk vom IÖR, die die Materialien mitentwickelt und die Zusammenarbeit mit dem NFDI4Biodiverity koordiniert hat. Die Trainingsdaten und das begleitende Material stehen im Einklang mit den FAIR-Prinzipien, sind also auffindbar (findable), zugänglich (accessible), interoperabel (interoperable) und wiederverwendbar (reusable), und sie zeigen, wie moderne Werkzeuge zur Förderung von Open Science eingesetzt werden können. Die Trainingsmaterialien samt Code, Dokumentation und Beispieldaten sind als „Replication Package“ über das Forschungsdaten-Repositorium ioerDATA dauerhaft publiziert und zitierbar.
Die Materialien richten sich an Studierende, Promovierende und Forschende, die ihre Fähigkeiten in der räumlichen Datenanalyse mit Python erweitern und dabei moderne Standards des Forschungsdatenmanagements erlernen möchten.
Weiterführende Informationen
Trainingsmaterialien
Datenpublikation (Replication Package)
Technische Infrastruktur (IOER Carto-Lab)
Kontakt
Dr. Alexander Dunkel, E-Mail: A.Dunkelioer@ioer.de
Dr. Maria Nieswand (Leitung IÖR-FDZ), E-Mail: M.Nieswandioer@ioer.de