Automatisierte Generierung von Trainingsdaten für die Informationsextraktion aus deutschen Geschäftsdokumenten auf Basis von Sprachmodellen

dc.contributor.authorBurkhardt, Jannik
dc.date.accessioned2023-12-19T15:15:11Z
dc.date.available2023-12-19T15:15:11Z
dc.date.issued2023de
dc.description.abstractGenerative KI hat seit der Veröffentlichung von ChatGPT im Dezember 2022 enorme Popularität erlangt. Ihr Potenzial ist immens und schon heute wird diese neue Technik in viele Produkte und Anwendungen integriert. In dieser Arbeit wird untersucht, welchen Einfluss automatisiert annotierte Trainingsdaten und von ChatGPT generierte Trainingsdaten auf das Finetuning von Sprachmodellen haben, wenn nur wenige handannotierte Daten vorhanden sind. Die mit den Methoden verbundenen Vorteile und Hindernisse werden am Beispiel der Relation Extraction aus deutschen Geschäftsdokumenten in Erfahrung gebracht. Es wird gezeigt, dass die Daten von ChatGPT von Fehlern bereinigt werden müssen, diese Daten dann jedoch die Leistung des Sprachmodells signifikant verbessern gegenüber einem Sprachmodell, das nur auf wenigen handannotierten Daten basiert.de
dc.identifier.other187699374X
dc.identifier.urihttp://nbn-resolving.de/urn:nbn:de:bsz:93-opus-ds-138626de
dc.identifier.urihttp://elib.uni-stuttgart.de/handle/11682/13862
dc.identifier.urihttp://dx.doi.org/10.18419/opus-13843
dc.language.isodede
dc.rightsinfo:eu-repo/semantics/openAccessde
dc.subject.ddc004de
dc.titleAutomatisierte Generierung von Trainingsdaten für die Informationsextraktion aus deutschen Geschäftsdokumenten auf Basis von Sprachmodellende
dc.typemasterThesisde
ubs.fakultaetInformatik, Elektrotechnik und Informationstechnikde
ubs.fakultaetExterne wissenschaftliche Einrichtungende
ubs.institutInstitut für Maschinelle Sprachverarbeitungde
ubs.institutFraunhofer Institut für Arbeitswirtschaft und Organisation (IAO)de
ubs.publikation.seiten91de
ubs.publikation.typAbschlussarbeit (Master)de

Files

Original bundle

Now showing 1 - 1 of 1
Thumbnail Image
Name:
Masterarbeit_Jannik_Burkhardt.pdf
Size:
1.26 MB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
3.3 KB
Format:
Item-specific license agreed upon to submission
Description: