Bitte benutzen Sie diese Kennung, um auf die Ressource zu verweisen: http://dx.doi.org/10.18419/opus-12275
Autor(en): Satkunarajan, Jena
Titel: Visual analysis of news stories using neural language models
Erscheinungsdatum: 2021
Dokumentart: Abschlussarbeit (Master)
Seiten: 115
URI: http://nbn-resolving.de/urn:nbn:de:bsz:93-opus-ds-122925
http://elib.uni-stuttgart.de/handle/11682/12292
http://dx.doi.org/10.18419/opus-12275
Zusammenfassung: Mit der Einführung von Computern unterschiedlichster Größe in den Alltag der meisten Menschen, haben wir einen rasanten Anstieg der Menge an produzierten textuelle Inhalten erlebt, die über den gesamten, digitalisierten Globus verteilt werden. Unter den unüberschaubaren Mengen an Text die im Internet zu finden sind, sind Nachrichtenartikel von besonderem Interesse für viele Journalisten, Wissenschaftler und alle anderen Gruppen, die sich für die Ereignisse im Mittelpunkt des öffentlichen Interesses begeistern können. Da Hunderte und Tausende von Online-Nachrichtenanbietern über wichtige und weniger wichtige Themen bereichten, wird es zu einer fast unmöglichen Herausforderung, das wertvolle Wissen, verteilt über die unzähligen Quellen, zusammenzutragen. Sich einen Überblick über das allgemeine Geschehen zu verschaffen oder sich über bestimmte Themen zu informieren, wird so zur Suche nach neuartigen Informationen in einem Meer von wiederkehrenden und wiederverwendeten Inhalten. Diese Thesis stellt einen kombinierten Ansatz zur interaktiven Visualisierung von neuartigen Nachrichteninhalten und der Entwicklung von Themen in Nachrichtenkorpora vor. Es wird ein Prototyp entwickelt, der den neuronalen GPT-2 Transformer zur Bewertung der Neuartigkeit von Textinhalten verwendet. Die daraus resultierenden Novelty Scores werden zur visuallen Hervorhebung textueller Inhalte, mit dem Fokus auf die Neuartigkeit der Texte, verwendet. Der neuartige Artikelinhalt wird in mehreren Ansichten dargestellt, die mit zunehmender Größe der zugrundeliegenden Artikeldaten eine immer stärkere Aggregation ermöglichen. Unter Vwendung einer Funktion zur Gewichtung von Wörtern, welche die zuvor berechneten Novelty Scores einbezieht, werden Artikelvektoren erstellt und anschließend zur zeitbezogenen Modellierung der Themen des Artikelkorpus verwendet. Die daraus resultierenden, zeitabhängigen Themencluster werden in einem mehrschichtigen Visualisierungsansatz dargestellt, der mehrere Perspektiven auf die Entwicklung der Themen über die Zeit bietet. Die verschiedenen Visualisierungen und Funktionen werden interaktiv in mehreren, aufeinander abgestimmten Ansichten präsentiert.
Enthalten in den Sammlungen:05 Fakultät Informatik, Elektrotechnik und Informationstechnik

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat 
MasterArbeit.pdf3,96 MBAdobe PDFÖffnen/Anzeigen


Alle Ressourcen in diesem Repositorium sind urheberrechtlich geschützt.