Auszug aus:
Heber, Jürgen: Knowledge Discovery
Broker-Entwicklungsarbeiten für das xFIND-Suchsystem :
Untersuchung gegenwärtiger Information Retrieval- und Klassifikationssysteme
sowie Entwicklung eines Brokerprototyps. Diplomarbeit an der
Technischen Universität Graz. - TU Graz, Juli 2000, Kapitel 3. Information Retrieval Systeme
http://www.iicm.edu/jheber/html/kapitel3.html
Eine Möglichkeit besteht darin, eine allgemeinere boolsche Anfrage zu formulieren, wodurch jedoch viele Ergebnisse mit niedriger Relevanz hinzukommen. Man könnte auch andere Suchbegriffe verwenden, aber auch hier gibt es keine Sicherheit, daß sich die gewünschten Ergebnisse einstellen. Relevanz-Feedback soll in diesem Problemkreis Abhilfe schaffen und so die Performance des IR Systems positiv beeinflussen. [FB92]
Einen vielversprechenden Ansatz stellt die dynamische Gewichtung von Suchbegriffen (Query Reweighting) dar, dabei wird die Wahrscheinlichkeit miteinbezogen, mit der ein Begriff in relevanten und nichtrelevanten Dokumenten auftritt. Die Wahrscheinlichkeiten werden aus den Anfrageergebnissen ermittelt und für die Gewichtung neuerlicher Anfragen herangezogen, man nützt also die Rückmeldung des Systems zu einer weiteren Verbesserung des Resultates. [FB92]
Demgegenüber steht die Veränderung und Hinzunahme von Suchbegriffen
(Query Expansion) vor einer neuerlichen Suche. Die Erweiterung kann unter
Verwendung eines Thesaurus erfolgen, der Synonyme oder andere zu den Suchbegriffen
passende Worte der Suchanfrage hinzufügt. Das Hauptproblem dabei besteht in der
Tatsache, daß diese Worte zumeist gemeinsam in denselben Dokumenten vorkommen,
was keine wesentliche Verbesserung des Suchergebnisses zur Folge hat. Eine
andere Möglichkeit der Erweiterung besteht darin, aus den relevanten
Ergebnissen Begriffe herauszufiltern und dem Benutzer zur Auswahl vorzulegen.
Die Auswahl kann auch automatisch getroffen werden, wobei die Anzahl der
hinzugefügten Begriffe nicht zu groß sein sollte. Gute Ergebnisse werden
beispielsweise erzielt, wenn die ersten 20 dieser nach absteigender Relevanz
sortierten Begriffe der Suchanfrage hinzugefügt werden. [FB92]"