a-step: Dokumentklassifikation – Einführung

Lerninhalte

  1. Automatisches Klassifizieren ohne vorgegebene Klassifikation (Clustering)
  2. Automatisches Klassifizieren mit vorgegebener Klassifikation (Zuordnung)

Lernziele

Wenn Sie diese Lerneinheit bearbeitet haben,

Ausgangslage bei WissOrg

Mario Schreiber

Die Kollegen aus der Informationsabteilung haben Mario Schreiber die Ergebnisse des Dokument-Clustering mit der Anwendung Carrot2 (LE 9, step 5) Verfahrens vorgelegt. Nicht gerade euphorisch kommentiert er:

"Das ist ja ganz nett, aber die Cluster sind ja völlig willkürlich und ich vermisse die Zuordnung zu unserer Klassifikation. Die IPTC-Klassifikation, die wir zur Verschlagwortung unserer Texte einsetzen, spiegelt so prima wider, welche Strukturen wir Journalisten bei der Suche im Kopf haben. Könnt Ihr die Klassifikation nicht irgendwie in das automatische System integrieren?"

Die Bemerkungen von Mario Schreiber haben Herrn Fuchs gefallen. Die Überzeugung, dass Klassifikationen einen unschätzbaren Beitrag für die Wiederauffindbarkeit von Informationen liefern, hat er bereits während seines Studiums gewonnen. Spontan bietet er an, dass er sich nach entsprechenden Verfahren umschauen werde.

Aus der Fachliteratur weiß er, dass eine kommerzielle Klassifizierungssoftware zwischen 40.000 und über 100.000 Euro kosten kann. (Otto Oberhauser: Automatisches Klassifizieren. Frankfurt: Lang, 2005.- S. 37 f.)

 


 

Stand: 5. Juli 2018

< Seite drucken >
< Zum Seitenanfang >

STEP 2

Initialaufgabe

STEP 3

Lektüre 1

STEP 4

Lektüre 2

STEP 5

Übung
Step 1
Step 2
Step 3
Step 4
Step 5
Einführung

LE 10: Dokumentklassifikation