Assisted data migrations for MUSE4Anything

Thumbnail Image

Date

2025

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Maintaining data in large repositories requires a lot of effort. Type schemas change over time due to changing requirements or mistakes in the initial abstraction process. When these changes happen, objects of that type need to be updated as well to ensure they conform to the new schema. Otherwise, a program using the data would have to treat every object differently, depending on the schema version. The transformation of all objects to conform to a new schema is called data migration. MUSE (Muster Suchen und Erkennen, eng.: Search and Recognize Patterns) and MUSE4Music are specific repositories for costumes and classical music. These repositories are used to prepare categorical data for automatic analyses. MUSE4Anything, successor of these implementations, is a generic data repository that allows managing domain specific data conforming to user-defined ontologies. In this environment, defined types and their requirements may also change over time. While type and object modifications are already supported in MUSE4Anything, there is no implementation of automatic migration of objects after a type update yet. This thesis aims to extend the MUSE4Anything system with a migration engine that performs these processes. By automating data migration, the required manual effort is significantly reduced, and the user experience, especially for huge repositories, is improved.


Beim Management von großen Datenspeichern bereitet vor allem die Datenpflege viel Aufwand. Typenschemata ändern sich über die Zeit aufgrund von sich wandelnden Anforderungen oder Fehlern während des eigentlichen Abstraktionsprozesses. Wenn sich solche Änderungen ergeben, müssen auch alle Objekte eines Typs aktualisiert werden, damit sie dem neuen Schema entsprechen. Andernfalls müsste ein Programm, das die Daten verwendet, jedes Objekt abhängig von der jeweiligen Version des Schemas anders behandeln. Die Anpassung aller Objekte an das neue Schema wird Datenmigration genannt. MUSE (Muster Suchen und Erkennen) und MUSE4Music sind spezifische Repositories für Kostüme beziehungsweise klassische Musik. Die Repositories sind für die Vorbereitung einer automatischen Analyse von kategorialen Daten gedacht. MUSE4Anything, Nachfolger dieser Implementierungen, ist hingegen ein generisches Datenrepository, in dem domänenspezifische Daten nach benutzerdefinierten Ontologien verwaltet werden können. Auch in dieser Umgebung können sich die definierten Typen, und die Anforderungen an diese, ändern. MUSE4Anything unterstützt das Ändern von Typen und Objekten bereits, jedoch gibt es bis jetzt keinen Mechanismus der die Daten automatisch migriert nachdem sich eine Typdefinition geändert hat. In dieser Masterarbeit wird MUSE4Anything um eine migration engine erweitert, die diese Prozesse ausführt. Durch die Automatisierung der Migration wird der nötige manuelle Aufwand deutlich reduziert, und die Benutzerfreundlichkeit, vor allem bei großen Datenmengen, verbessert.

Description

Keywords

Citation

Endorsement

Review

Supplemented By

Referenced By