Please use this identifier to cite or link to this item: http://dx.doi.org/10.18419/opus-6600
Authors: Kunz, Christoph Daniel
Title: Ein integrierter Ansatz zur wissensbasierten Informationsrecherche
Other Titles: An integrated approach for knowledge-based information retrieval
Issue Date: 2006
Publication type: Dissertation
Series/Report no.: IPA-IAO-Forschung und Praxis;436
URI: http://nbn-resolving.de/urn:nbn:de:bsz:93-opus-25560
http://elib.uni-stuttgart.de/handle/11682/6617
http://dx.doi.org/10.18419/opus-6600
ISBN: 3-936947-85-6
Abstract: Dokumente im Internet als auch in betrieblichen Kontexten (Intranet, Portal, Wissensdatenbank) liegen selten in strukturierter Form vor und besitzen fast keine Metainformationen bezüglich ihres Inhalts. Schon die schiere Menge, aber auch das Nichtvorhandensein einer einheitlichen Zugangsstruktur erschwert sowohl deren menschliche als auch deren maschinelle Verarbeitung und Wahrnehmung, im Besonderen das Entdecken relevanter Information, deren Zusammenhang und deren Synthese zu einem umfassenden Gesamtbild. Gerade in Unternehmen des Wirtschaftssystems wird es inzwischen als unabdingbar angesehen, durch einen schnellen und reibungslosen Informationszugriff eine Erhöhung organisationaler Lern- und Wandlungsfähigkeit zu fördern, um dadurch auf eine immer turbulenter werdende Umwelt reagieren zu können. Um dieses zu erreichen, werden Instrumente wie Intranets oder Wissensdatenbanken im Rahmen von Expertengemeinschaften eingesetzt, um vorhandenes (bereits kodifiziertes) Wissen zu konservieren und zugänglich zu machen. Dabei sind effiziente und nutzerfreundliche Zugriffs- und Recherchemechanismen von besonderer Bedeutung, um eine schnelle Lokalisierung von gerade wichtiger Information zu ermöglichen. Auf Grundlage dieser Ausgangssituation wird in der vorliegenden Arbeit ein nutzerorientierter und ganzheitlicher Ansatz beschrieben und evaluiert, welcher eine semantische Erschließ- und Recherchierbarkeit von großen und vernetzten Informationsräumen unter Einbeziehung der menschlichen Nutzung und Interpretation ermöglicht. Unter dem Begriff Informationsraum werden außer Dokumentkollektionen auch sonstige Ressourcen zusammengefasst, deren Inhalt von Interesse ist (Dienste, Produktdaten, etc.). Den Anwendungskontext stellen Intranets und komplexe Portalseiten, sowie spezialisierte Dokumentkollektionen dar, welche von Expertengruppen zur Dokumentation gemeinsamer Erfahrungen erstellt werden. In diesen Anwendungsgebieten ist ein effektiver und nutzerfreundlicher Informationszugriff essentiell. Der Ansatz verbindet eine herkömmliche stichwortbasierte Volltextsuche mit einer semantischen Suche auf Grundlage einer lernenden Themenontologie, welche einen Informationsraum abstrahiert und verdichtet. Ausgangspunkt ist dabei die Annahme, dass in Situationen der Informationssuche ein Kommunikationsprozess zwischen dem menschlichen Nutzer und dem benutzen Werkzeug statt findet. Neue ontologische Begriffe werden dabei durch Beobachtung der in diesem Kommunikationsprozess entstandenen Artefakte erzeugt, wie explizierte Präferenzen und persönliche Klassifikationssysteme, die sich in Lesezeichen zur Merkhilfe manifestieren. Eine Ontologie als Modellierungsformalismus ermöglicht zudem die einfache Verknüpfungsmöglichkeiten dieser mit nicht textuellen, strukturierten Informationsquellen (z.B. Datenbankschemata). Diese können dadurch parallel mit stichwortbasierten Suchanfragen ausgewertet und gemeinsam als Antworten dargestellt werden. Die verschiedenen damit geschaffenen Arten des Informationszugriffs erfolgen über eine einheitliche und bedarfsgerechte Nutzerschnittstelle. Deren Hauptmerkmal ist die Visualisierung der Ontologie als Abstraktion und Verdichtung der semantischen Struktur des suchbaren Informationsraums. Die dabei eingesetzte Technik beruht auf der hochinteraktiven Darstellung einer Adjazenzmatrix des Ontologiegraphen. Diese Strukturvisualisierung ist mit einer Präsentation von Suchergebnissen zu einem wählbaren Thema eng gekoppelt. Zusätzlich sind damit stichwortbasierte und semantische Abfragemöglichkeiten verbunden. Semantische Suchanfragen können innerhalb der Nutzerschnittstelle unter Verwendung der dargestellten Ontologie visuell konstruiert werden, womit die Erlernung einer logischen Abfragesprache (z.B. F-Logik ) entfällt. Damit werden drei Arten von Informationszugängen geschaffen: Auf Strukturebene kann navigatorisch durch Verbreiterung und Einengung eines Themas, sowie der Verfolgung von bedeutungsvollen Querbeziehungen gestöbert und unmittelbar die zugehörigen Inhalte eingesehen und recherchiert werden. Eine Volltextsuche ermöglicht eine ungenaue Suche auf Basis von Stichwörtern, während die semantische Suche eine präzise Lokalisierung von gewünschter Information ermöglicht. Mit Hilfe dieser Mechanismen soll auch das Verständnis des eigenen Informationsbedarfs der Nutzer gefördert werden, welcher das Ziel einer Recherche bestimmt. Eine umfangreiche Evaluation des Ansatzes zeigt Leistungsvorteile gegenüber der herkömmlichen Volltextsuche und belegt dessen Nützlichkeit in den Anwendungsbereichen. Es konnte gezeigt werden, dass die prototypische Umsetzung des Ansatzes gleichermaßen von Experten und durchschnittlichen Nutzern zu bedienen war. Ebenfalls konnte die Machbarkeit der kollaborativen Wissensakquise durch Beobachtung des Ablageverhaltens und die hohe Qualität der daraus entstandenen Wissensbasis nachgewiesen werden. Neben der Güte der dadurch erzeugten neuen Begrifflichkeiten ist die damit erreichte Klassifikationsquote hervor zu heben, welche weit über rein maschinellen Verfahren liegt.
Documents on the internet as well as in business contexts (intranet, portals, knowledge database) are rarely available in a structured format and hold hardly any metainformation regarding the content. Sheer quantity as well as the non-availability of a standardized access structure complicates human and machine processing and perception, i.e., finding of relevant information, their context and their synthesis into a comprehensive overall picture. Especially in businesses of the economic system a fast and unobstructed information access is considered indispensable for facilitating organizational mutability and ability to learn in order to be able to react to an environment being more and more turbulent. For this reason, instruments such as intranets and knowledge databases are deployed for conserving and reusing existing (already codified) knowledge in the context of Communities of Practice (CoPs). Besides, efficient and user-friendly information access and retrieval mechanisms are of great importance for enabling rapid localization of just now relevant information. On the basis of this initial situation, the present work describes and evaluates a user-centered and holistic approach for making large and networked information spaces semantically available and researchable by including human use and interpretation. The term information room includes not only document collections but also other resources whose content is of interest (services, product data, etc.). Application areas e are intranets and complex portal sites as well as specialised document collections which are created by expert communities in order to preserve their common experience. An effective and user-friendly information access is crucial in these application areas. The approach combines conventional keyword-based full-text search with semantic retrieval methods on the basis of a learning probabilistic ontology of topics which abstracts and condenses an information space. The starting point is the assumption that in the case of a research situation a communication process takes place between a human user and a used tool and forms a socio-technical system between the communication partners. New ontological concepts are generated by observing artefacts which are created in this communication process and can be explicit preferences and personal classification systems that become manifest in bookmarks as a memory aid. Using an ontology as a modelling formalism allows a simple linkingS-up with non-textual and structured data sources (e.g. data-base schemes). These can be then analysed simultaneously with keyword-based queries and displayed as answers at the same time. The various resulting information access mechanisms are integrated into one consistent and requirements-based user interface. The main feature of the user interface is the visualization of the ontology, abstracting and aggregating the semantic structure of the researchable information space. For this, the technique applied is based on a highly interactive adjacency matrix display of the ontology graph. The structure visualization is tightly coupled with a list-based presentation of search results given by a freely selectable topic based on the principle of direct manipulation. Additionally, keyword-based and semantic query features are combined with it. The semantic queries can be visually constructed in order to avoid learning of a logical query language, like F-Logic. Thus, three types of an information access are created: browsing on a structural level can be done by navigationally broadening or narrowing a topic and by following semantic relationships between topics. Corresponding content can be seen directly and inspected in the list. A full-text search on the basis of keywords provides an imprecise search, whereas by the use of semantic queries, needed information can be precisely localized. By using these mechanisms, the understanding of users’ information needs should be furthered which directs the goal of a research. Extensive evaluation studies of the approach show performance advantages in comparison with a conventional full-text retrieval and attests usefulness in the application areas. It could be demonstrated that the prototypical implementation of the approach could be used by experts and customary users alike. Also, the feasibility of the collaborative knowledge acquisition by observing users’ filling behaviour as well as the high quality of the resulting knowledge base could be proven. Besides, the quality of the new concepts generated, the exceedingly high classification quota has to be stressed which is a more advanced performance compared to pure mechanical classification methods.
Appears in Collections:14 Externe wissenschaftliche Einrichtungen

Files in This Item:
File Description SizeFormat 
Diss_Kunz_hs.pdf2,82 MBAdobe PDFView/Open


Items in OPUS are protected by copyright, with all rights reserved, unless otherwise indicated.