Bei gewichteter Indexierung können neben der Zahl der Eigenschaften auch deren Gewichte in der Ähnlichkeitsberechnung berücksichtigt werden. Die Termgewichte lassen sich z. B. über der Ermittlung der von TF * IDF errechnen. Unsere Tabelle könnte dann folgendermaßen aussehen:
Deskriptor | Dok 1 | Dok 2 | Dok 3 | Dok 4 |
Bundeskanzler | 0 | 1,5 | 0 | 1,5 |
Birne | 0,5 | 0,25 | 0,75 | 1,0 |
Deutsche Einheit | 1,0 | 2,0 | 0,75 | 0,5 |
Euro | 0,25 | 0,25 | 0,4 | 0,5 |
Helmut Kohl | 2,0 | 0 | 1,5 | 2,8 |
Erstellen Sie bitte eine gerankte Liste der Dokumente 1 bis 4 auf die Anfrage: "Leistungen von Bundeskanzler Helmut Kohl für die Deutsche Einheit und die Einführung des Euro". Für den Fragevektor gehen Sie bitte für alle in der Suchanfrage vorhandenen Suchbegriffe von einem Gewicht von 1 aus.