Durch die Auswertung der Ergebnisse der Volltextindexierung haben die MitarbeiterInnen der Firma WissOrg gelernt, dass sich nicht alle Wörter eines Textes gleich gut als Deskriptoren eignen.
Wenn wir die Qualität von intellektueller Indexierung bewerten, legen wir zwei Kriterien zu Grunde.
Unterstützen Sie das Team von WissOrg bei der Formulierung von Anforderungen an eine eine Indexierungsoftware, die diese Erkenntnis automatisch umsetzen kann.
Schauen Sie sich bitte nochmal die folgenden 5 Texte an. Lassen Sie die Texte durch die Simulationen Volltextindexierung und lexikonbasierte Indexierung indexieren. Erstellen Sie jeweils einzelne Indices für jeden Text und einen Index für alle 5 Texte. Überlegen Sie anhand der resultierenden Indices, wie wirklich geeignete Deskriptoren für die 5 Dokumente automatisch gewonnen werden könnten. Nennen Sie 3 Indexate, die nach Ihrer Meinung wirklich für den Inhalt eines Dokuments stehen und stellen Sie Vermutungen darüber an, wie sie automatisch identifiziert werden könnten.
Wenn Sie eine Textsammlung zum Thema "E-Learning" vor sich hätten, wäre es nicht sinnvoll, für jedes Dokument das Schlagwort "E-Learning" zu vergeben. Warum nicht?
Überlegen Sie sich, wie man die zweite Anforderung (Diskriminanzeffekt, siehe oben) in einem statistischen Verfahren der automatischen Indexierung umsetzen könnte.
Stand: 22. April 2005