Ein hoch-performanter (approximierter) k-Nächste-Nachbarn Algorithmus für GPUs

dc.contributor.authorBreyer, Marcel
dc.date.accessioned2018-12-12T14:30:06Z
dc.date.available2018-12-12T14:30:06Z
dc.date.issued2018de
dc.description.abstractIn der heutigen Zeit, in der immer mehr Daten zur Verfügung stehen, gewinnt das Data-Mining zunehmendan Bedeutung. Insbesondere ist die Klassifizierung eine zentrale Methode des Data-Minings. Eine Möglichkeit Daten zu klassifizieren, stellt die Nächste-Nachbarn-Klassifikation dar. Dabei wird einem Objekt eine Klasse nur aufgrund dessen lokaler Nachbarschaft zugewiesen. Der naive Ansatz zur Lösung der Nächste-Nachbarn-Klassifikation setzt jedoch voraus, dass alle anderen Objekte in der Datenmenge betrachtet werden müssen, wodurch er eine quadratische Komplexität besitzt, was bei deren stetig wachsender Größe immer ineffizienter wird. Aufgrund dieser hohen Kosten, sind bei großen Datenmengen approximierende Verfahren attraktiv. Ein solches approximierendes Verfahren ist das in dieser Arbeit verwendete Locality Sensitive Hashing. Dieses Verfahren teilt alle Datenpunkte basierend auf deren Lokalisation durch spezielle Hash-Funktionen in Hash-Buckets auf. Mithilfe dieser Aufteilung müssen bei der Suche nach den Nächsten-Nachbarn nicht mehr alle Datenpunkte betrachtet werden. Zusätzlich zur Wahl des Algorithmus, muss jedoch auch auf eine hochperformante Implementierung für Grafikkarten geachtet werden. Dabei konnte auf NVIDIAs QUADRO GP100 Grafikkarte eine Laufzeitverbesserung um das bis zu 10-fache bei einer gleichzeitigen Genauigkeit von über 90%, gegenüber einer ebenfalls für Grafikkarten optimierten Implementierung des Naiven Algorithmus, für einen Datensatz mit 500 000 Datenpunkten in 10 Dimensionen beobachtet werden.de
dc.identifier.other515196916
dc.identifier.urihttp://nbn-resolving.de/urn:nbn:de:bsz:93-opus-ds-101694de
dc.identifier.urihttp://elib.uni-stuttgart.de/handle/11682/10169
dc.identifier.urihttp://dx.doi.org/10.18419/opus-10152
dc.language.isodede
dc.rightsinfo:eu-repo/semantics/openAccessde
dc.subject.ddc004de
dc.titleEin hoch-performanter (approximierter) k-Nächste-Nachbarn Algorithmus für GPUsde
dc.typebachelorThesisde
ubs.fakultaetInformatik, Elektrotechnik und Informationstechnikde
ubs.institutInstitut für Parallele und Verteilte Systemede
ubs.publikation.seiten78de
ubs.publikation.typAbschlussarbeit (Bachelor)de

Files

Original bundle

Now showing 1 - 1 of 1
Thumbnail Image
Name:
Bachelor_Arbeit_Marcel_Breyer.pdf
Size:
1.23 MB
Format:
Adobe Portable Document Format
Description:

License bundle

Now showing 1 - 1 of 1
No Thumbnail Available
Name:
license.txt
Size:
3.39 KB
Format:
Item-specific license agreed upon to submission
Description: