Schritt 1

Schritt 2

Schritt 3

Schritt 4

Schritt 5

Schritt 6

Schritt 7

Sie sind hier

Einführung
 

Aufgabe 1
 

Häufigkeit
- Übung

Termfrequenz
 

Aufgabe 2
 

IDF    
- Übung

WissOrg testet
- Formeln



Aufgabe 1

Durch die Auswertung der Ergebnisse der Volltextindexierung haben die MitarbeiterInnen der Firma WissOrg gelernt, dass nicht alle Wörter eines Textes sich gleich gut als Deskriptoren eignen. Eine einfache Möglichkeit, Wörter, die für den Inhalt eines Textes stehen, automatisch zu ermitteln, bietet die statistische Ermittlung von Worthäufigkeiten.

Die Statistik ist jedoch nur das Werkzeug. Aufgabe von Informationsspezialisten ist es, sinnvolle, in Programme umsetzbare Modelle dafür zu entwickeln, welcher Zusammenhang zwischen Auftretenshäufigkeit eines Wortes in einem Text und seiner Eignung als Deskriptor besteht.

Schauen Sie sich bitte diese Ergebnisse einer einfachen Volltextinvertierung der 3 e-mails aus der Lerneinheit "Stichwortextraktion" an.

Überlegen Sie, wie aus dieser Liste geeignete Deskriptoren für die Dokumente extrahiert werden könnten.

weiter: Häufigkeit


Stand: 08. September 2003