Browsing by Author "Giebler, Corinna"

Now showing 1 - 3 of 3

Open Access
Architekturkonzepte zur Datenverwaltung in Data Lakes
(2021) Giebler, Corinna; Mitschang, Bernhard (Prof. Dr.-Ing.)
Die zunehmende Digitalisierung in zahlreichen Bereichen und die damit verbundene Vielzahl an heterogenen Daten, die gespeichert, verwaltet und analysiert werden müssen, stellen eine Herausforderung für traditionelle Datenmanagementkonzepte dar. Insbesondere gilt es, den potentiellen Wert der Daten auszunutzen und durch neue Erkenntnisse Kosten zu senken und Effizienz zu erhöhen. Um die Verwaltung und flexible Analyse der generierten Daten zu ermöglichen, wurde das Konzept des Data Lake entwickelt. Daten heterogener Struktur werden hier in ihrer Rohform gespeichert, sodass auch lange nach ihrer Erfassung beliebige Anwendungsfälle darauf realisiert werden können. Soll allerdings ein solcher Data Lake für die praktische Nutzung in z.B. einem Unternehmen umgesetzt werden, zeigen sich zahlreiche Probleme und Lücken auf. Methodische Grundlagen sind unvollständig, vage oder fehlen ganz. So gibt es keine vollständige Data-Lake-Architektur oder einen Leitfaden, um eine solche zu erstellen. Auch fehlt es an einer passenden Datenorganisation, um die Vielzahl an Anwendungsfällen und Nutzergruppen eines unternehmensweiten Data Lake zu unterstützen. In dieser Arbeit werden diese Lücken adressiert. Hierzu werden drei Forschungsziele formuliert: Z1-Identifikation der Eigenschaften eines Data Lake, Z2-Erstellung eines Leitfadens zur Definition einer vollständigen Data-Lake-Architektur und Z3-Erarbeitung einer internen Data-Lake-Organisation. Diese Forschungsziele werden durch insgesamt sieben Forschungsbeiträge abgedeckt. Hierfür wird zunächst in einer vollständigen Literaturrecherche das Konzept des Data Lake identifiziert und definiert. Im zweiten Schritt stellt diese Arbeit das Data Lake Architecture Framework (DLAF) vor, welches die Definition einer vollständigen Data-Lake-Architektur ermöglicht. Abschließend bietet das Zonenreferenzmodell einen systematischen Ansatz zur Datenorganisation in Data Lakes. Die Umsetzbarkeit der erarbeiteten Lösungen wird mithilfe einer prototypischen Implementierung für ein reales Anwendungsszenario gezeigt. Eine abschließende Evaluation bestätigt, dass die entwickelten Lösungen vollständig sind, zahlreiche Vorteile bieten und so die Industrialisierung von Data Lakes unterstützen.
Open Access
LAKE - eine flexible Datenstromverarbeitungsarchitektur
(2017) Giebler, Corinna
Forschungsgebiete wie die Industrie 4.0 können nicht auf eine konstante Überwachung verschiedener Komponenten verzichten. Zahlreiche Sensoren sind nötig, um beispielsweise autonome Fabriken sicher betreiben zu können. Über diese Sensoren werden gewaltige Mengen an Daten verfügbar, die sowohl persistent gespeichert, als auch möglichst schnell verarbeitet werden sollen. Die Genauigkeit von Analysen steigt mit der Anzahl verarbeiteter Datensätze, wodurch auch die Verarbeitungszeit wächst. Gleichzeitig müssen aktuelle Informationen in Echtzeit zur Verfügung stehen. Dieses Problem wird durch zwei Architekturen zur Datenverarbeitung adressiert: Die Lambda- und die Kappa-Architektur verbinden Datenstrom- und Stapelverarbeitung, um sowohl genaue Datenanalysen als auch Echtzeitverarbeitung zu ermöglichen. Beide Architekturen haben allerdings ihre Schwachstellen. So können beispielsweise Ergebnisse der Stapelverarbeitung in Lambda nicht in der Datenstromverarbeitung verwendet werden oder der Ressourcenverbrauch in Kappa steigt mit den vorhandenen Datensätzen. Diese Arbeit stellt darum LAKE als Verbindung aus beiden Architekturen vor. LAKE adressiert die Schwachstellen und bietet die Möglichkeit, die Art der Verarbeitung jederzeit flexibel auf verschiedene Anwendungsfälle anzupassen. Zusammen mit dem Konzept beschreibt diese Arbeit auch verschiedene Systeme, die für die Realisierung eines LAKE-Prototypen verwendet werden können. Zwei Implementierungen eines solchen Prototypen werden in dieser Arbeit mit Apache Flink und Apache Spark umgesetzt. Zudem wird am Beispiel einer Klassifikation von Datenobjekten die Flexibilität von LAKE gezeigt. In der abschließenden Evaluation wird sichtbar, dass die Kombination aus Lambda- und Kappa-Architektur nicht nur die Schwächen der jeweiligen Architektur ausgleicht, sondern zudem weitere Möglichkeiten zur Datenverarbeitung bietet.
Open Access
Privatheit im Gesundheitsspiel Candy Castle
(2016) Giebler, Corinna
Die zunehmende Verwendung elektronischer Endgeräte stellt die heutige Gesellschaft vor das große Problem der Datenprivatheit. Die digitalen Helfer verwalten verschiedenste persönliche Daten, auf die wiederum eine Vielzahl von Anwendungen Zugriff hat. Selten ist es dem Benutzer möglich, direkten Einfluss oder auch nur Einblick in die Verwendung seiner Daten zu erlangen. Besonders in der Kritik stehen hierbei mobile Plattformen, wie Smartphones oder Tablets. Die Applikationen, oder kurz Apps, für diese Plattformen verfügen nur selten über Datenschutzerklärungen oder Maßnahmen zum Datenschutz. Auch ist es auf bestimmten Betriebssystemen nicht möglich, die Berechtigungen einer App einzuschränken. Dabei werden gerade diese mobilen Endgeräte mehr und mehr zur Verwaltung sensibler Daten verwendet. Hierzu gehören inzwischen auch medizinische Daten, die mithilfe diverser Gesundheits-Apps aufgezeichnet und verarbeitet werden können. Da es sich bei diesen medizinischen Werten um sehr private Daten handelt, sind diese besonders schützenswert. Zudem sollte der Nutzer einer solchen Gesundheits-App stets wissen, was mit seinen Daten geschieht und die Kontrolle über ihre Verwendung innehaben. In dieser Arbeit soll darum erörtert werden, wie sich die persönlichen Daten mithilfe eines Berechtigungssystems schützen lassen. Zunächst wird hierfür ein Anforderungskatalog ermittelt, der neben Anforderungen an Funktionalität und Bedienbarkeit auch Forderungen an Privatheit und Nutzerbestimmung stellt. Mithilfe dieses Katalogs wird anschließend ein Gesundheitsspiel für Kinder mit Diabetes weiterentwickelt und um Privatheitsaspekte erweitert. So entsteht ein Prototyp für ein Spiel, dessen Privatheitsgrad vom Benutzer einstellbar ist. Zuletzt wird gezeigt werden, dass die zuvor gestellten Anforderungen erfüllt sind und dass verarbeitete Daten auch vor unerlaubtem Zugriff geschützt werden können.