Schritt 1

Schritt 2

Schritt 3

Schritt 4

Sie sind hier

Einführung + Aufgabe

3 Verbesserungen

Invertierte Dateiensysteme

Übung



Lerneinheit 2

Volltextinvertierung

Lerninhalte

  1. Funktionsweise von Volltextinvertierung
  2. Nachteile einfacher Stichwortsuche
  3. Einfache Möglichkeiten der Optimierung von Stichwortextraktion
  4. Invertierte Dateiensysteme
  5. Literatur & Links: Glöggler

Lernziele

Wenn Sie diese Lerneinheit über Volltextinvertierung bearbeitet haben,

  1. können Sie erläutern, wie Programme zur Volltextinvertierung vorgehen
  2. können Sie erläutern, wie sich einfache Stichwortextraktion nachteilig auf die Qualität des Information-Retrieval auswirkt
  3. können Sie einfache Maßnahmen für eine Verbesserung der Indexierungsergebnisse nennen und erläutern
  4. haben Sie eine Vorstellung von einem invertierten Dateiensystem und seiner Funktion in einem Information-Retrieval-System.

Ausgangslage bei WissOrg


Hier sehen Sie, wie Jochen Stahl gerade folgende Ansicht vertritt:

"Alle Dokumente, die wir verwenden, sind sowieso schon elektronisch verfügbar: e-mails, Websites, Fachliteratur... Auf die setzen wir eine nette kleine Indexierungssoftware an - und schon ist ein Dokumentar ersetzt."


Katja Rabe rauft sich die Haare und schlägt dann gefasst vor: "Lassen Sie uns gemeinsam ansehen, was dabei rauskommt, bevor wir eine Entscheidung treffen."

In der darauf folgenden Woche treffen sich die beiden zu einem Test einer solchen "netten kleinen Indexierungssoftware". Das Programm extrahiert jedes einzelne Wort aus den Dokumenten; so indexiert es. Diese 3 e-mails sind durch die Indexierungssoftware über einen Index suchbar. Den Index automatisch zu erzeugen dauerte keine Sekunde.

Ein Dokumentar eingespart?


Aufgabe: Und so kommen Sie ins Spiel

Sehen Sie sich ein paar Indexausschnitte an und beantworten Sie dann die 3 Fragen unten

  1. Erklären Sie Jochen Stahl: Genau was tat das Programm, um die e-mails zu indexieren?
  2. Greifen Sie Jochen Stahl unter die Arme: In wie fern ist das Indexierungsergebnis eigentlich ganz o.K.? Nennen Sie 3 Beispiele!
  3. Greifen Sie Katja unter die Arme: Inwiefern ist das Indexierungsergebnis unbefriedigend? Nennen Sie 3 Beispiele!
  4. Wie kann der Programmierer das Indexierungsprogramm so verbessern, dass die Indexierungsergebnisse für eine inhaltliche Suche von e-mails befriedigender sind?
Bereiten Sie bitte in Ihrer Arbeitsgruppe Antworten auf diese Fragen und Argumente für beide Parteien vor. Stellen Sie Ihre Ideen im Plenum zur Verfügung.


weiter: 3 Verbesserungen


Stand: 22. August 2003