Bitte benutzen Sie diese Kennung, um auf die Ressource zu verweisen: http://dx.doi.org/10.18419/opus-2685
Langanzeige der Metadaten
DC ElementWertSprache
dc.contributor.authorHoffmann, Benjaminde
dc.date.accessioned2010-11-05de
dc.date.accessioned2016-03-31T07:58:59Z-
dc.date.available2010-11-05de
dc.date.available2016-03-31T07:58:59Z-
dc.date.issued2010de
dc.identifier.other381697169de
dc.identifier.urihttp://nbn-resolving.de/urn:nbn:de:bsz:93-opus-57811de
dc.identifier.urihttp://elib.uni-stuttgart.de/handle/11682/2702-
dc.identifier.urihttp://dx.doi.org/10.18419/opus-2685-
dc.description.abstractDocument retrieval is the task to retrieve from a possibly huge collection of documents those which are most similar to a given query document. In this paper, we present a new heuristic for inexact top K retrieval. It is similar to the well-known index elimination heuristic and is based on Zipf's law, a statistical law observable in natural language texts. We compare the two heuristics with regard to retrieval performance and execution time. Therefore, we use a text collection consisting of scientific articles from various computer science conferences and journals. It turns out that our new approach is not better than index elimination. Interestingly, a combination of both heuristics yields the best results.en
dc.language.isoende
dc.relation.ispartofseriesTechnischer Bericht / Universität Stuttgart, Fakultät Informatik, Elektrotechnik und Informationstechnik;2010,6de
dc.rightsinfo:eu-repo/semantics/openAccessde
dc.subject.classificationInformation Retrieval , Heuristik , Zipfsches Gesetzde
dc.subject.ddc004de
dc.titleComparison of standard and Zipf-based document retrieval heuristicsen
dc.typeworkingPaperde
dc.date.updated2011-09-05de
ubs.fakultaetFakultät Informatik, Elektrotechnik und Informationstechnikde
ubs.institutInstitut für Formale Methoden der Informatikde
ubs.opusid5781de
ubs.publikation.typArbeitspapierde
ubs.schriftenreihe.nameTechnischer Bericht / Universität Stuttgart, Fakultät Informatik, Elektrotechnik und Informationstechnikde
Enthalten in den Sammlungen:05 Fakultät Informatik, Elektrotechnik und Informationstechnik

Dateien zu dieser Ressource:
Datei Beschreibung GrößeFormat 
TR_2010_06.pdf185,84 kBAdobe PDFÖffnen/Anzeigen


Alle Ressourcen in diesem Repositorium sind urheberrechtlich geschützt.