Thema der Sitzung vom 31.03. lautete „Volltextinvertierung“
31.03.2005
Zuerst wurde die Aufgabe vom 24.03. besprochen. Danach sollte von den Seminarteilnehmern die Aufgabe „3 Emails“ bearbeitet werden.
Die Besprechung der Seminaraufgabe fing mit der Zusammentragung der Ergebnisse an. Im Verlauf des Seminars gab es keine Diskussion unter den Seminarteilnehmern. Wenn es zu einer Diskussion kam, wurde sie linear geführt. Es war eher eine von der Dozentin geleitete Ergebniszusammentragung.
Zu diesem Punkt, der Berichtigung der Ergebnisse der Aufgabe vom 24.03., wurden zwei Fragen geklärt. Zum Einen der Begriff „Indexierungsergebnis“ bzw. wie es zu mehreren Indexierungsergebnissen kommen kann. Dies passiert meist bei Bibliotheksverbünden wie dem „gbv“. Hier indexieren mehrere dem „gbv“ angeschlossenen Bibliotheken den selben Datensatz. Zum Anderen eine Erklärung zu den verwandten Formeln. Diese dienten dem Zweck des Vorstellens der Errechnung von Recall und Precision. Die Formeln bedurften keiner mathematischen Erklärung, sie sollten nicht hergeleitet sondern benutzt werden.
5. Anhand der Initialaufagabe wurde gezeigt, wie ein Programm zur Wiederauffindung von Emails arbeitet. Dazu werden alle Wörter eines Textes in eine separate Liste, einen Index, geschrieben und alphabetisch sortiert. Das ist insofern praktikabel, als das es durch die Aufnahme aller Worte keinen Verlust an Daten gibt. Die Arbeitsweise des Programms ist dadurch schnell und die Ergebnisse stehen den Mitarbeitern ebenso schnell zur Verfügung. Nachteilig wirkt dagegen, daß durch die Aufnahme aller Worte ein zu großer Index entsteht, das heißt dadurch entsteht auch ein zu großer Ballast. Außerdem hat diese Arbeitsweise nichts mit intelligenter Lösung zu tun, es kann ebenso gut jede Email „hinter einander geheftet“ werden. Der Nutzen ist nicht sehr groß. Die erzeugte Datenmenge lässt sich verringern, wenn das Programm nicht alle Wörter aufnimmt sondern vorher bestimmte Wörter, sog. Stoppwörter, die über eine Stoppwortliste verwaltet werden, ausläßt.
Durch die Volltextinvertierung läßt sich für den Nutzer viel schneller und besser einsehen, ob die gefundenen Treffer einer Suchmaschine relevant sind. Auch scheint es ein einfaches und schnelles Verfahren zu sein, seine Informationen leichter wiederauffindbar zu machen.