Und so kommen Sie ins Spiel:

Katja Rabe und Julia Wissmann (Sie!) experimentieren mit einer Liste, die Grundlage für ein wörterbuchbasiertes Stemming-Programm ist.

Schauen Sie sich die Lexikondatei(stemming dictionary) an.
Stellen Sie sich dabei die nachstehenden Fragen und machen Sie Notizen für eine Präsentation Ihrer Beobachtungen.

Bitte begründen Sie Ihre Antworten.

  1. Wie erreicht es das Programm, dass ein Text, in dem das Wort "angemeldeter" vorkommt, auf "angemeldet" gestemmt wird? Schauen Sie sich dazu die Wörterbucheinträge an.
  2. Einige der bisher bekannten Probleme der automatischen Indexierung sind hier gelöst. Bitte nennen Sie Beispiele.
  3. Ergänzen Sie "beruf" im Wörterbuch. Geben Sie möglichst vollständig alle Wortformen ein. Sorgen Sie dafür, dass Texte, in denen die Wörter Berufe, Berufen, Berufs, vorkommen, mit Beruf indexiert werden.
  4. Wie können Sie erreichen, dass Texte, in denen das Kompositum "violinkonzert" vorkommt, sowohl auf "violine" als auch "konzert" gestemmt wird?
  5. Wörterbuchdatei

    • für deutschsprachige Texte
    • mit Terminologiekontrolle
    • wörterbuchbasiert

    René Krieger: Stemming dictionary

    Stand: 14. Mai 2018

    < Seite drucken >
    < Zum Seitenanfang >

STEP 1

Einführung

STEP 3

Lektüre

STEP 4

Übung 1

STEP 5

Übung 2
Step 1
Step 2
Step 3
Step 4
Step 5
Initialaufgabe

LE 05: Lexikonbasierte Verfahren