WissOrg beschäftigt sich mit der Frage, mit welchen Methoden man automatisch die Ähnlichkeit zwischen Dokumenten ermitteln kann. Zur Vereinfachung haben die KollegInnen vier Dokumente in Hinblick auf das Vorhandensein bestimmter Deskriptoren miteinander verglichen und die Ergebnisse in eine Tabelle übertragen. Schauen Sie sich einmal folgende Tabelle an.
Deskriptor | Dok 1 | Dok 2 | Dok 3 | Dok 4 |
Bundeskanzler | 0 | 1 | 0 | 1 |
Birne | 1 | 1 | 1 | 1 |
Deutsche Einheit | 1 | 1 | 0 | 1 |
Euro | 1 | 0 | 1 | 1 |
Helmut Kohl | 1 | 0 | 1 | 1 |
Welche beiden Dokumente sind sich am ähnlichsten und warum? Könnte man die Einträge in der Tabelle vielleicht noch verfeinern? (Denken Sie an die Möglichkeiten statistischer Verfahren.)