Lerninhalte

  1. Funktionsweise von Volltextinvertierung
  2. Nachteile einfacher Stichwortsuche
  3. Einfache Möglichkeiten der Optimierung von Stichwortextraktion
  4. Invertierte Dateiensysteme
  5. Literatur & Links: Glöggler; Croft; Gödert & Lepsky

Lernziele

Wenn Sie diese Lerneinheit über Volltextinvertierung bearbeitet haben,

  1. kennen Sie einige Voraussetzungen, die erfüllt sein müssen, damit Maschinen natürliche Sprache weiterverarbeiten können (Fachbegriff: NLP = natural language processing)
  2. können Sie erläutern, wie Programme zur Volltextinvertierung vorgehen,
  3. können Sie erläutern, wie sich einfache Stichwortextraktion nachteilig auf die Qualität des Information-Retrieval auswirkt,
  4. können Sie einfache Maßnahmen für eine Verbesserung der Indexierungsergebnisse nennen und erläutern,
  5. haben Sie eine Vorstellung von einem invertierten Dateisystem und seiner Funktion in einem Information-Retrieval-System.

Situation bei WissOrg

Jochen Stahl

Hier sehen Sie, wie Jochen Stahl gerade folgende Ansicht vertritt:

"Alle Dokumente, die wir verwenden, sind sowieso schon elektronisch verfügbar: E-Mails, Websites, Fachliteratur... Auf die setzen wir eine nette kleine Indexierungssoftware an - und schon ist ein Informationsspezialist ersetzt."

 

 


Katja Rabe

Katja Rabe rauft sich die Haare und schlägt dann gefasst vor: "Lassen Sie uns gemeinsam ansehen, was dabei rauskommt, bevor wir eine Entscheidung treffen."

 

 

 

In der darauf folgenden Woche treffen sich die beiden zu einem Test einer solchen "netten kleinen Indexierungssoftware". Das Programm kostet so gut wie nichts; das gefällt Jochen Stahl. Es extrahiert jedes einzelne Wort aus den Dokumenten; so indexiert es. Diese 3 E-Mails sind durch die Indexierungssoftware über einen Index suchbar. Einen Index zu den E-Mails automatisch zu erzeugen dauerte keine Sekunde.

Eine Informationsspezialistin eingespart?

 

Stand: 25. September 2017

< Seite drucken >
< Zum Seitenanfang >

STEP 2

Initialaufgabe

STEP 3

Lektüre 1

STEP 4

Lektüre 2

STEP 5

Übung
Step 1
Step 2
Step 3
Step 4
Step 5
Einführung

LE 02: Volltextinvertierung