Lerninhalte

  1. Stemming als Möglichkeit der Wortformenreduktion,
  2. Weak Stemming / Strong Stemming,
  3. Over- und Understemming,
  4. Stemming im Deutschen und im Englischen,
  5. Beispiel: Stemming-Algorithmus für das Englische,
  6. Stemming als Möglichkeit der fehlertoleranten Retrievalgestaltung.

Lernziele

Wenn Sie die Lerneinheit bearbeitet haben,

  1. haben Sie eine konkrete Vorstellung von der Funktionsweise regelbasierter linguistischer Verfahren zur Vereinheitlichung eines Index,
  2. können Sie Möglichkeiten und Grenzen regelbasierter Verfahren der automatischen Indexierung einschätzen und an eigenen Beispielen erklären.
  3. können Sie die Einsatzbedingungen regelbasierter linguistischer Verfahren einschätzen und erklären.

WissOrg experimentiert

Jochen Stahl


Selbst Jochen Stahl sah ein, dass eine bloße Stichwortextraktion zu einem Ballast an unbrauchbaren Indexaten führt. Auf einer kürzlich besuchten Messe hatte er aber an einer Präsentation eines Softwarepakets teilgenommen, das "linguistische Verfahren" anwendet und die zuvor beobachteten "Schönheitsfehler" - wie er sich ausdrückt - automatisch bereinigen kann. Er ist begeistert.

 


Rainer Fuchs


Rainer Fuchs glaubt, dass sich der Geschäftsführer blenden ließ: "linguistische Verfahren" - weiß Jochen Stahl überhaupt, was das ist? Er erklärt dem Geschäftsführer, dass ein solches Programm, wie er es auf der Messe gesehen hat, keine "nette kleine Indexierungssoftware" mehr ist; es wird vermutlich komplex und teuer sein.

 

 

Katja Rabe


Katja Rabe hält nichts von Spekulationen: "Ich habe den Eindruck, wir alle wissen nicht wirklich, wovon wir reden. Ich finde, wir sollten uns erst einmal informieren, was es mit den linguistischen Verfahren auf sich hat. Ich würde mir auch gerne mal ein paar Demo-Versionen ansehen, bevor wir uns wieder treffen."

 

 

Stand: 27. April 2018

< Seite drucken >
< Zum Seitenanfang >

STEP 2

Initialaufgabe

STEP 3

Lektüre 1

STEP 4

Lektüre 2

STEP 5

Übung
Step 1
Step 2
Step 3
Step 4
Step 5
Einführung

LE 04: Regelbasierte linguistische Verfahren