Abstracts zu Fachliteratur

Zweiter Schritt: automatische Indexierung


Bild automatische Indexierung

Im zweiten Schritt simulieren Sie die Arbeit eines Computerprogramms zur Indexierung. Das Programm soll die Termgewichtung nach der TF * IDF Formel auf Grundlage der logarithmischen Werte berechnen. Es soll nur Substantive extrahieren. Julia Wissmann hat Ihnen bereits einen Großteil der Rechenarbeit abgenommen und die Ergebnisse in eine Tabelle eingetragen. Nur an den rot markierten Stellen müssen Sie noch einmal nachrechnen.

  • Sie können Julias Tabellen zur Weiterarbeit verwenden.
  • Wie sind Sie mit den Ergebnissen zufrieden? Schreiben Sie ein Gutachten für die Abteilung Doku, das die folgenden Punkte berücksichtigt.

    Intellektuelle Indexierung: Automatische Indexierung:
    Vorteile Nachteile Vorteile Nachteile
    1.
    2.
    3.
    1.
    2.
    3.
    1.
    2.
    3.
    1.
    2.
    3.
    mögliche Fehlerquellen mögliche Fehlerquellen
    1.
    2.
    3.
    1.
    2.
    3.
    Vorschläge zur Optimierung der automatischen Indexierung
    einige Ideen:
    • hilft die informationslinguistische Bearbeitung auf Grundform?
    • Hilft eine Stoppwortliste?
    • Wie könnte man die Formel verändern?
    • Ist die Festlegung eines Schwellenwertes,also eines Mindesgewichtes, das ein Term erreichen muss, damit er als Deskriptor vergeben wird, sinnvoll?

    In der Plenumssitzung werden Sie Ihre Ergebnisse mit den Ergebnissen der Gruppe, die sich mit den Abstracts zu Fachaufsätzen beschäftigt hat, vergleichen.


    zurück: WissOrg testet Ende der Lerneinheit 5   


    Stand: 11. September 2003