Und so kommen Sie ins Spiel:
Katja Rabe und Julia Wissmann (Sie!) experimentieren mit einer Liste, die Grundlage für ein wörterbuchbasiertes
Stemming-Programm ist.
Schauen Sie sich die Lexikondatei(stemming dictionary) an.
Stellen Sie sich dabei die nachstehenden Fragen und machen Sie Notizen für eine Präsentation Ihrer Beobachtungen.
Bitte begründen Sie Ihre Antworten.
- Wie erreicht es das Programm, dass ein Text, in dem das Wort "angemeldeter" vorkommt, auf "angemeldet" gestemmt wird? Schauen Sie sich dazu die Wörterbucheinträge an.
- Einige der bisher bekannten Probleme der automatischen Indexierung sind hier gelöst. Bitte nennen Sie Beispiele.
- Ergänzen Sie "beruf" im Wörterbuch. Geben Sie möglichst vollständig alle Wortformen ein. Sorgen Sie dafür, dass Texte, in denen die Wörter Berufe, Berufen, Berufs, vorkommen, mit Beruf indexiert werden.
- Wie können Sie erreichen, dass Texte, in denen das Kompositum "violinkonzert" vorkommt, sowohl auf "violine" als auch "konzert" gestemmt wird?
Wörterbuchdatei
- für deutschsprachige Texte
- mit Terminologiekontrolle
- wörterbuchbasiert
René Krieger: Stemming dictionary
Stand: 14. Mai 2018
< Seite drucken >
< Zum Seitenanfang >
STEP 1 - Einführung | STEP 2 - Initialaufgabe | STEP 3 - Lektüre | STEP 4 - Übung 1 | STEP 5 - Übung 2