Die Dokumentensammlung aus Schritt 4 (Lektüre) wird durch folgendes Dokument ergänzt:

Dokument 3

Ein Mensch sitzt stumm und liebeskrank
Mit einem Weib auf einer Bank;

Er nimmt die bittre Wahrheit hin,
Dass sie zwar liebe, doch nicht ihn.

Ein andrer Mensch geht still vorbei
Und denkt, wie glücklich sind die zwei.

(aus: Eugen Roth: Optische Täuschung)

1. Bitte zeigen Sie, wie die invertierte Datei für das Stichwort 'mensch' aussieht, nachdem dieses dritte Dokument in die Datenbank aufgenommen wurde.
2. Stellen Sie schematisch dar, wie im Retrievalsystem nach Dokumenten mit dem Stichwort 'Mensch' gesucht wird.

Bitte erläutern Sie Ihre Darstellungen!


Alternative für Programmierfreaks

1. Bitte führen Sie für Dokument 3 mit Hilfe von Python eine Tokenisierung (Zerlegung in für das Programm erkennbare Worte (getrennte Zeichenkentten)) von Dokument 3 vor.
2. Lassen Sie sich anschließend die Position im Index für glücklich ausgeben. Wie es geht, können Sie in diesem Beispiel nachsehen.

Bitte erläutern Sie Ihre Darstellungen!


Stand: 25. September 2017

< Seite drucken >
< Zum Seitenanfang >

STEP 1

Einführung

STEP 2

Initialaufgabe

STEP 3

Lektüre 1

STEP 4

Lektüre 2
Step 1
Step 2
Step 3
Step 4
Step 5
Übung: Stichwortsuche und invertierte Dateien

LE 02: Volltextinvertierung