Forschungsprojekte

Datenqualität in Archiven und Museen. Entwicklung von Analyse-Tools als Python Package
Das Auffinden von Fehlern und die Messung von Qualität in den schnell wachsenden Datenbeständen der Gedächtnis- und Forschungsinstitutionen wird immer mehr zu einer quantitativen Herausforderung. Im Rahmen und mit Förderung der NFDI4Memory Incubator Funds werden daher durch das Deutsche Bergbau-Museum und das Montan.dok praktische und frei nachnutzbare Werkzeuge für die systematische Sicherung der Datenqualität strukturierter Forschungsdaten von Museen und Archiven entwickelt.

Zu diesem Zweck werden im DBM und montan.dok Tools mittels der universellen Programmiersprache Python programmiert, mit denen formale Qualitätsmängel in standardisiert vorliegenden Datensammlungen einfach identifiziert und Fehlerreports generiert werden. Zunächst liegt der Fokus auf LIDO und EAD als den gängigen Austauschformaten für Erschließungsdaten aus Archiven und Museen. Die Tools werden Open Source und unter einer freien Lizenz als Package im „Python Package Index“ (PyPI) veröffentlicht, so dass sie leicht nachgenutzt werden und die Basis für weitere Applikationen bilden können. Damit sollen die in NFDI4Memory und auch in anderen NFDI-Konsortien weiter zu entwickelnden Qualitätskriterien unmittelbar in praktikable Applikationen übersetzt und in den Gedächtnis- und Forschungsinstitutionen Maßnahmen zur Verbesserung der Datenqualitäten ergriffen werden können.

Technisch und konzeptionell bauen die projektierten Tools zunächst auf Werkzeugen auf, die zur internen Datenkuratierung im DBM  und montan.dok im Rahmen des Projekts „Digitale Infrastrukturen im Deutschen Bergbau-Museum Bochum und virtuelle Zugänglichkeit zum Bergbauerbe“ durch Andreas Ketelaer M. Sc. entwickelt worden sind. Diese werden nun weiterentwickelt, so dass sie auf in einschlägigen Metadatenstandards vorliegende Daten und in anderen Institutionen angewendet werden können. Da die Daten von Archiven und Museen trotz der Metadatenstandards meist sehr heterogen strukturiert sind, werden hierfür Testdaten möglichst vieler Institutionen bzw. Datenpartner einbezogen.

Informationen zum Projekt

Projektträger

Deutsches Bergbau-Museum Bochum, montan.dok

Beteiligte forschende Bereiche
Laufzeit

01.01.2024 – 31.12.2024

Typ des Vorhabens

Forschungs- und Infrastrukturprojekt