Lerninhalte

  1. Schwächen der Volltextinvertierung
  2. Worthäufigkeit als Indikator für die Ermittlung geeigneter Deskriptoren
  3. Vergleich automatische Indexierung und intellektuelle Indexierung
  4. Abhängigkeit der Indexierungsqualität von der Textart
  5. Literatur & Links

Lernziele

Wenn Sie diese Lerneinheit über Indexierungsqualität bearbeitet haben,

  1. wissen Sie, worin der Unterschied zwischen Volltextinvertierung und automatischer Indexierung besteht,
  2. wissen Sie, auf welchen Grundannahmen über Worthäufigkeiten statistische Verfahren der automatischen Indexierung basieren,
  3. wissen Sie, wie Programme zur automatischen Indexierung durch die Berücksichtigung statistischer Gegebenheiten von Texten diesen sinntragende Deskriptoren zuteilen.
  4. können Sie anhand der Formeln zur Berechnung der Termfrequenz und der inversen Dokumenthäufigkeit nachvollziehen, wie bei statistischen Verfahren der automatischen Indexierung die Deskriptoren ermittelt werden,
  5. können Sie Stärken und Schwächen statistischer Verfahren der automatischen Indexierung im Vergleich zur intellektuellen Indexierung benennen.

WissOrg testet

Julia Wissmann

Das Team von WissOrg beschäftigt sich mit der Auswertung der Ergebnisse der Volltextinvertierung. Man ist sich darüber einig, dass ein auf Grundlage einer Volltextinvertierung mögliches Freitext-Retrieval nicht den Qualitätsanforderungen der Firma entspricht:
Julia Wissmann hat im Studium gelernt: "Wenn jedes Wort des Textes, bis auf die Wörter aus der Stoppwortliste, suchbar ist, entsteht bei der Recherche zu viel Ballast und die Nachbearbeitung der Ergebnisse dauert zu lange."

 

 

Katja Rabe

Katja Rabe hat sich inzwischen etwas auf dem Markt für Indexierungssoftware umgeschaut und formuliert die These: "Obwohl das Verfahren der Stichwortrecherche, das wir getestet haben, vollautomatisch arbeitet, kann es nicht eigentlich zu den automatischen Indexierungsverfahren gezählt werden."

 

 

 

 

Julia stimmt zu. Sie erinnert an die Formulierung in der DIN Norm 31623 "Indexieren ist das Zuordnen von Deskriptoren oder Notationen zu einer dokumentarischen Bezugseinheit zur Wiedergabe der einzelnen darin enthaltenen Sachverhalte."

Finden Sie Begründungen für Julias und Frau Rabes Behauptungen. Gehen Sie anschließend gleich weiter zu STEP 2.

Stand: 22. April 2005

< Als Textdatei ansehen/ausdrucken >
< Zum Seitenanfang >

STEP 2

Initialaufgabe

STEP 3

Lektüre 1

STEP 4

Lektüre 2

STEP 5

Übung
Step 1
Step 2
Step 3
Step 4
Step 5
Einführung

LE 06: Statistische Verfahren