www.abcd-j.de/content/showcases/casestudy-trr379/_index.de.md

5.6 KiB

title topics contributors software sites
Fallstudie - Metadaten-Pooling für das Forschungskonsortium TRR379
datamanagement
adina-wagner
christian-moench
jenna-swarthout-goddard
michael-hanke
stephan-heunis
shacl-vue
dump-things
fzj

{{< lead >}}

Im Rahmen von ABCD-J haben wir einen Ansatz für das (Meta-)Datenmanagement entwickelt, der die gemeinschaftliche, modellgesteuerte Erfassung und Wiederverwendung von Forschungsinformationen über verteilte Standorte und Projekte hinweg ermöglicht.

{{< /lead >}}

Groß angelegte, verteilte Forschungskooperationen stehen oft vor einem gemeinsamen Problem: Metadaten zu Daten, Werkzeugen, Mitwirkenden und anderen Forschungsaktivitäten sind in der Regel über heterogene Systeme verstreut. Die Mitwirkenden von ABCD-J schließen diese Lücke, indem sie eine gemeinsame Metadaten-Infrastruktur für die Projektstandorte des Sonderforschungsbereichs entwickeln, um Forschungsinformationen zu bündeln, anzureichern, abzufragen und wiederzuverwenden. Insbesondere der von der DFG geförderte Sonderforschungsbereich TRR379 (Neuropsychobiologie der Aggression: Ein transdiagnostischer Ansatz bei psychischen Erkrankungen) dient als bislang umfassendste Umsetzung und zeigt, wie Metadaten den wissenschaftlichen Fortschritt und die Kommunikation fördern sowie Verwaltungsprozesse vereinfachen können.

Das System

Das Herzstück des Forschungsmetadatensystems von TRR379 ist ein Metadaten-Pooling-Dienst, der die strukturierte Erfassung, Anreicherung, Abfrage und Wiederverwendung von Forschungsinformationen über verteilte Standorte und Nutzer hinweg unterstützt. Er besteht aus zwei zentralen Softwarekomponenten:

Wichtig ist, dass diese Softwarekomponenten ihre Struktur dynamisch aus einem anwendungsspezifischen Schema ableiten (spezifiziert mit LinkML), wodurch derselbe Tool-Stack domänenübergreifend genutzt werden kann. Gleichzeitig bleiben die zugrunde liegenden generischen Schemakomponenten eng an semantische Standards wie die Provenance Ontology (PROV-O) des World Wide Web Consortium (W3C) angelehnt, was die Interoperabilität zwischen Domänen sowie langfristige Erweiterbarkeit gewährleistet. Mit diesem Design werden Metadaten über verschiedene Service-Bereitstellungen und nachgelagerte Anwendungen hinweg wiederverwendbar, unabhängig davon, ob die Informationen letztendlich zur Erstellung von Webseiten, Berichten, Datenkatalogen oder anderen Ausgaben verwendet werden.

Code-Entwicklung, Authentifizierung und automatisierte Workflows für die Anreicherung, Abfrage und Ausgabegenerierung werden alle über eine kollaborative und selbst gehostete forgejo-aneksajo-Bereitstellung unter https://hub.trr379.de/ unterstützt. Zusammen mit dem Metadaten-Pooling-Dienst bietet dies eine gemeinsame Infrastruktur, die es verteilten Teams ermöglicht, Forschungsaktivitäten zu beschreiben und zu verwalten.

Überblick über das Metadatensystem, einschließlich Schemata, Forgejo-Kollaborationsplattform, shacl-vue-Weboberfläche, dump-things-service-API, Pipelines zur Datenextraktion und -harmonisierung sowie Workflows zur Erzeugung von Ausgabedaten (Datenkatalog, Labor-Website, jährlicher Projektbericht)

Im TRR379-Kontext werden Metadaten nicht als administratives Nebenprodukt behandelt, sondern als aktive Koordinationsschicht. Dies ermöglicht:

  • die standortübergreifende Aggregation von Informationen zu Datensätzen, Werkzeugen, Projekten, Publikationen usw.
  • die strukturierte Wiederverwendung von Metadaten für Berichterstattung und Kommunikation
  • die automatisierte Generierung von konsortialorientierten Inhalten

Ein besonders sichtbares Ergebnis ist, dass ein Großteil der TRR379-Website nun automatisch aus der zugrunde liegenden Metadateninfrastruktur generiert wird, was eine kontinuierliche Synchronisation von Forschungsaktivitäten und deren öffentlicher Darstellung ermöglicht. Als Beispiel dafür, wie das Metadatensystem administrative Arbeitsabläufe unterstützen kann, beispielsweise bei der Erfüllung von Berichtspflichten gegenüber Förderorganisationen, hat das TRR379 die jährliche Umfrage der DFG zu koordinierten Programmen mithilfe des integrierten Metadatensystems durchgeführt.

Die Bedeutung

Das TRR379 stellt eine Validierung in der Praxis des integrierten Service-Ökosystems dar, das auf der ABCD-J-Plattform entwickelt wurde. In diesem Fall vereint die Infrastruktur:

  • eine zentrale Kollaborationsplattform
  • ein System zur Zusammenführung und Kuratierung von Metadaten
  • Werkzeuge und Workflows zur Verknüpfung und Verbreitung von Forschungsinformationen

Dieser Einsatz zeigt, wie eine föderierte, modellgesteuerte Metadatenebene das FAIR-(Meta-)Datenmanagement in wissenschaftlichen Arbeitsabläufen unterstützen und administrative Anforderungen erfüllen kann. Er veranschaulicht zudem, wie Forschungsergebnisse und organisatorische Informationen in einer kontinuierlich aktualisierten, maschinenlesbaren Form gepflegt werden können, um die Konsistenz und Wiederverwendbarkeit von (Meta-)Daten zu verbessern.