Auszug aus:
Heber, Jürgen: Knowledge Discovery Broker-Entwicklungsarbeiten für das xFIND-Suchsystem : Untersuchung gegenwärtiger Information Retrieval- und Klassifikationssysteme sowie Entwicklung eines Brokerprototyps. Diplomarbeit an der Technischen Universität Graz. - TU Graz, Juli 2000, Kapitel 3. Information Retrieval Systeme
http://www.iicm.edu/jheber/html/kapitel3.html

Relevanz-Feedback:
Im allgemeinen ist der Recall (siehe Abschnitt 3.2.4) eines IR Systems begrenzt, es werden also in den seltensten Fällen alle relevanten Dokumente für eine Suchanfrage gefunden. Somit stellt sich die Frage, wie man die ausständigen relevanten Dokumente auffinden kann. [FB92]

Eine Möglichkeit besteht darin, eine allgemeinere boolsche Anfrage zu formulieren, wodurch jedoch viele Ergebnisse mit niedriger Relevanz hinzukommen. Man könnte auch andere Suchbegriffe verwenden, aber auch hier gibt es keine Sicherheit, daß sich die gewünschten Ergebnisse einstellen. Relevanz-Feedback soll in diesem Problemkreis Abhilfe schaffen und so die Performance des IR Systems positiv beeinflussen. [FB92]

Einen vielversprechenden Ansatz stellt die dynamische Gewichtung von Suchbegriffen (Query Reweighting) dar, dabei wird die Wahrscheinlichkeit miteinbezogen, mit der ein Begriff in relevanten und nichtrelevanten Dokumenten auftritt. Die Wahrscheinlichkeiten werden aus den Anfrageergebnissen ermittelt und für die Gewichtung neuerlicher Anfragen herangezogen, man nützt also die Rückmeldung des Systems zu einer weiteren Verbesserung des Resultates. [FB92]

Demgegenüber steht die Veränderung und Hinzunahme von Suchbegriffen (Query Expansion) vor einer neuerlichen Suche. Die Erweiterung kann unter Verwendung eines Thesaurus erfolgen, der Synonyme oder andere zu den Suchbegriffen passende Worte der Suchanfrage hinzufügt. Das Hauptproblem dabei besteht in der Tatsache, daß diese Worte zumeist gemeinsam in denselben Dokumenten vorkommen, was keine wesentliche Verbesserung des Suchergebnisses zur Folge hat. Eine andere Möglichkeit der Erweiterung besteht darin, aus den relevanten Ergebnissen Begriffe herauszufiltern und dem Benutzer zur Auswahl vorzulegen. Die Auswahl kann auch automatisch getroffen werden, wobei die Anzahl der hinzugefügten Begriffe nicht zu groß sein sollte. Gute Ergebnisse werden beispielsweise erzielt, wenn die ersten 20 dieser nach absteigender Relevanz sortierten Begriffe der Suchanfrage hinzugefügt werden. [FB92]"