PROTOKOLL DER SITZUNG VOM 22.10.2003

Thema der Sitzung: Volltextinvertierung

Ein Indexierungsprogramm soll auf seine Tauglichkeit geprüft werden. Dazu hat das Programm 3 E-Mails indexiert. Die nachfolgenden Fragen sollten dazu beantwortet werden:

  1. Was tat das Programm, um die E-Mails zu indexieren?
  2. Inwiefern ist das Indexierungsergebnis in Ordnung?
  3. Inwiefern ist das Indexierungsergebnis unbefriedigend?
  4. Wie kann der Programmierer das Indexierungsprogramm so verbessern, dass die Indexierungsergebnisse für eine inhaltliche Suche von E-mails befriedigender sind?

I Unsere Problemlösungen

Zu 1.) Wie arbeitet das Programm?

Durch Vergleich der Index-Ausschnitte mit den indexierten E-Mails kamen wir zu folgendem Ergebnis:

Zu 2) Vorteile des Programmes:

Unser Ergebnis:

Zu 3.) Nachteile des Programmes:

Unser Ergebnis:

Zu 4.) Verbesserungsvorschläge für das Programm:

Unsere Diskussion ergab die nachfolgenden Vorschläge zur Verbesserung:

II Unser weiterer Lernprozess

Als Ergebnis kann festgehalten werden, dass die Indexierungssoftware in jedem Fall verbesserungswürdig ist.

Im Verlauf der Sitzung wurden außerdem folgende Begriffe geklärt:

KWIC-Index (KWIC = Keyword in context)

Bei dieser Indexierungsart wird das Stichwort zusammen mit dem Kontext (vorherige und nachfolgende Wörter)angezeigt und hervorgehoben.

Beispiel aus Betreff-Feld der 3 e-mails:

designer-kurse für die e-learning-plattform webct ce
designer-kurse für die e-learning-plattform webct ce
designer-kurse für die e-learning-plattform webct ce
schutz gegen spam und viren
sopresa
schutz gegen spam und viren
schutz gegen spam und viren
designer-kurse für die e-learning-plattform webct ce

KWOC-Index (KWOC = Keyword out of Context)

Bei dieser Indexierungsart wird das Stichwort alphabetisch meist vor ihrem Kontext angezeigt.

Beispiel aus Betreff-Feld der 3 e-mails:

ce Designer-Kurse für die E-Learning-Plattform WebCT CE
designer-kurse Designer-Kurse für die E-Learning-Plattform WebCT CE
e-learning-plattform Designer-Kurse für die E-Learning-Plattform WebCT CE
schutz Schutz gegen SPAM und Viren
sopresa sopresa
spam Schutz gegen SPAM und Viren
viren Schutz gegen SPAM und Viren
webct Designer-Kurse für die E-Learning-Plattform WebCT CE

25. Oktober 2003

Protokollantin: Nicole Petrucela / Medok / 3. Semester / A (leicht korrigiert Spree 03.11.2003) T-Online eMail - Anhänge