Übung 1
Die folgenden beiden Dokumente sollen automatisch einer der drei Klassen der Klassifikation unten zugeordnet werden. Errechnen Sie, in welche Klasse die beiden Dokumente eingeordnet werden. Gehen Sie analog vor, wie in dem Beispiel für den Spamfilter aus der Präsentation.
Dokument 1: Courths-Mahler, Hedwig: Der Arzt gab der Prinzessin einen Kuss. Das wollte der Kommissar mit Gewalt verhindern.
Dokument 2: Grimm, Wilhelm: Die Hexe und die Fee trafen auf dem Blocksberg die Prinzessin
| Klasse/Attribut | Märchen | Krimi | Schnulze |
|---|---|---|---|
| Fee | Mord | Liebe | |
| Hexe | Kommissar | Sehnsucht | |
| „und wenn sie nicht gestorben sind…“ | Gewalt | Kuss | |
| Prinzessin | Kanone | Arzt | |
| Grimm, Wilhelm | Christie, Agatha | Courths-Mahler, Hedwig |
Übung 2
Die Kollegen der Dokumentationsabteilung haben sich jetzt beide Verfahren der automatischen Dokumentklassifikation genau angesehen. Wie so häufig vertritt Herr Stahl aus betriebswirtschaftlicher Perspektive eine andere Position als die übrigen Kollegen in der Doku. Ergreifen Sie Partei für Jochen Stahl einerseits und die Kollegen der Doku andererseits und begründen Sie Ihre Entscheidungen.
| Stahl: Pro freies Clustering | Doku: Pro Zuordnung zu einer vorgegebenen Klassifikation | ||
| Vorteile freies Clustering | Nachteile freies Clustering | Vorteile vorgegebene Klassifikation | Nachteile vorgegebene Klassifikation |
1. 2. 3. 4. 5. |
1. 2. 3. 4. 5. |
1. 2. 3. 4. 5. |
1. 2. 3. 4. 5. |