Analyse der Repräsentanz von BERT-basierten Class-Embeddings in unbalancierten Datensätzen mittels Active Learning
| dc.contributor.author | Mujko, Alp | |
| dc.date.accessioned | 2023-10-19T14:13:21Z | |
| dc.date.available | 2023-10-19T14:13:21Z | |
| dc.date.issued | 2023 | de |
| dc.description.abstract | Das Sprachmodell BERT (Bidirectional Encoder Representations from Transformers) ist ein neuronales Netzwerk, das für die Verarbeitung von Textdaten ausgelegt ist und aufgrund seiner Fähigkeit, sowohl die Vorwärts- als auch die Rückwärtsrichtung des Kontexts zu berücksichtigen, als sehr leistungsfähig bei Aufgaben im Bereich der natürlichen Sprachverarbeitung gilt. In dieser Arbeit nutzen wir dessen Transformer-Architektur, um geeignete Dokumenten-Embeddings für Texte zu generieren. Aus diesen leiten wir für jede Klasse an Dokumenten ein Class-Embedding ab, das stellvertretend für die jeweilige Klasse steht. Um die Repräsentanz der erzeugten Class-Embeddings zu untersuchen, verwenden wir diese in einem Active Learning Szenario, um neue unbekannte Dokumente zu labeln. Wir stellen fest, dass die berechneten Class-Embeddings ihre Klasse sinngemäß repräsentieren und folglich den Embedding-Raum sinnvoll partitionieren. Darüber hinaus liefert der Abstand zwischen den Class-Embeddings Aufschluss über die semantische Ähnlichkeit zwischen den Klassen. | de |
| dc.identifier.other | 1867296470 | |
| dc.identifier.uri | http://nbn-resolving.de/urn:nbn:de:bsz:93-opus-ds-136732 | de |
| dc.identifier.uri | http://elib.uni-stuttgart.de/handle/11682/13673 | |
| dc.identifier.uri | http://dx.doi.org/10.18419/opus-13654 | |
| dc.language.iso | de | de |
| dc.rights | info:eu-repo/semantics/openAccess | de |
| dc.subject.ddc | 004 | de |
| dc.title | Analyse der Repräsentanz von BERT-basierten Class-Embeddings in unbalancierten Datensätzen mittels Active Learning | de |
| dc.type | bachelorThesis | de |
| ubs.fakultaet | Informatik, Elektrotechnik und Informationstechnik | de |
| ubs.institut | Institut für Maschinelle Sprachverarbeitung | de |
| ubs.publikation.seiten | 60 | de |
| ubs.publikation.typ | Abschlussarbeit (Bachelor) | de |