1. Relevanz Ranking
  2. Relevanz Feedback

Relevanz Ranking

In den bisherigen Lerneinheiten sind wir davon ausgegangen, dass die Bestimmung der Relevanz eines Indexterms für ein Dokument bei der Erschließung vergenommen wird. Suchmaschinen nehmen tatsächlich das Relevanz Ranking erst 'on the fly' im Verlauf des Rechercheprozesses vor. Hierfür werden in der Praxis komplexe Ranking-Formeln angewandt. Das Prinzip des Relevanz Ranking lässt sich aber in der folgenden einfachen Formel demonstrieren. Schauen Sie sich dazu folgendes Beispiel an.

Gesucht sind Dokumente zum Thema "Tiere und Pflanzen in Korallenriffs" in einer großen biologischen Datenbank mit 1.000.000 Datensätzen.

Die Datenbank enthält

Zunächst wird eine vereinfachte Formel zur Berechnung der Gewichte der einzelnen Suchtermini angewandt. Die Formel (IDF) kennen Sie bereits aus der Lerneinheit "Statistische Verfahren".

G = log2(N/n)

In diesem Beispiel:

Für jeden Datensatz, der einen oder mehrere der Suchtermini enthält, werden folgende Schwellenwerte berechnet:

Formeln für die Gewichtung der Datensätze

Bezogen auf das Beispiel oben: "Tiere und Pflanzen in Korallenriffs": Es handelt sich um eine Suchformulierung mit mehr als 2 Suchtermini.

MMG = (Tiere) 4,6 + (Pflanzen) 5,1 + (Korallenriff) 14,2 = 23,9
MAG = MMG / 2 = 23,9 / 2 = 11,9



Folglich werden erst alle Treffer angezeigt,

STEP 1

Einführung

STEP 2

Initialaufgabe

STEP 4

Übung 1

STEP 5

Übung 2
Step 1
Step 2
Step 3
Step 4
Step 5
Lektüre: Relevanz-Ranking und Relevanz-Feedback

LE 08: Retrievalmodelle