Die Dokumentensammlung aus Schritt 4 (Lektüre) wird durch folgendes Dokument ergänzt:
Dokument 3
Ein Mensch sitzt stumm und liebeskrank Mit einem Weib auf einer Bank; Er nimmt die bittre Wahrheit hin, Ein andrer Mensch geht still vorbei |
(aus: Eugen Roth: Optische Täuschung)
1. Bitte zeigen Sie, wie die invertierte Datei für das Stichwort 'mensch' aussieht, nachdem dieses dritte Dokument in die Datenbank aufgenommen wurde.
2. Stellen Sie schematisch dar, wie im Retrievalsystem nach Dokumenten mit dem Stichwort 'Mensch' gesucht wird.
Bitte erläutern Sie Ihre Darstellungen!
Alternative für Programmierfreaks
1. Bitte führen Sie für Dokument 3 mit Hilfe von Python eine Tokenisierung (Zerlegung in für das Programm erkennbare Worte (getrennte Zeichenkentten)) von Dokument 3 vor.
2. Lassen Sie sich
anschließend die Position im Index für glücklich ausgeben. Wie es geht, können Sie in diesem Beispiel nachsehen.
Bitte erläutern Sie Ihre Darstellungen!
Stand: 25. September 2017