Protokoll der Sitzung vom:
2005-06-02
Thema:
Automatische Textzusammenfassung
Arbeitsauftrag:
Mit einer Simulation für verschiedene Methoden der automatischen Textzusammenfassung sollten Vor- und Nachteile der verschiedenen Methoden beurteilt werden.
Verlauf unserer Diskussion:
Zwei Arbeitsergebnisse der automatischen Textzusammenfassung wurden ausführlich besprochen.
1. Automatische Textzusammenfassung mit Statistik-Methode:
(Aufgabe von B. Neumann u. M. Yeesune-Hlong, Text:"Partnerkonflikte wegen Kindererziehung")
Dem Programm ist folgendes gelungen:
- Die grundlegenden Aussagen des Textes wurden wiedergegeben.
- Der Abstract ist ohne Zugriff auf das Originaldokument verständlich.
- ungebräuchliche Bezeichnungen wurden vermieden.
- Die Köhärenz wurde erhalten.
Hierbei hat das Programm "versagt":
- Wenige, jedoch wesentliche Inhalte sind nicht vorhanden (z.B. "Schwangerschaft").
- Die Zusammenfassung enthält Redundanzen.
- Der Abstract ist zu lang.
- Die Kohäsion des Abstracts ist unzureichend.
Anmerkungen der Kursteilnehmer:
- Möglicherweise wäre das Ergebnis bei Verwendung eines anderen Stichworts besser. (Das Wort "Kind", das verwandt wurde, ist naheliegend, jedoch evtl. nicht ideal gewählt)
2. Automatische Textzusammenfassung mit Struktur-Methode:
(Aufgabe von S. Mohr u. S. Gärner, Text "Partnerkonflikte wegen Kindererziehung")
Dem Programm ist folgendes gelungen:
- Die Kernaussagen des Textes wurden wiedergegeben, da ein gut strukturiertes Dokument vorlag.
- Inhaltlich ist die Zusammenfassung, trotz der nur punktuellen Wiedergabe, prinzipiell verständlich.
- Inhaltlicher und sprachlicher Zusammenhang ist vorhanden, jedoch nur in Bezug auf die Anfänge der Absätze (Überschrift und folgender Satz).
Folgendes konnte das Programm nicht leisten:
- Durch die Auswahl der Überschriften und ersten Sätze werden mögliche inhaltliche Zusammenfassungen am Ende eines Absatzes übergangen
- Der Abstract ist wegen seiner "Punktualität" nur mit Rückgriff auf das Original völlig verständlich.
- Der Abstract scheint, gemessen an der Länge des Originalstextes, als zu kurz.
- Für den gesamten Text sind Kohärenz und Kohäsion, wegen der Auslassung langer Textpassagen, nicht gegeben.
Das wichtigste Fazit aus der Sitzung:
Die automatische Textzusammenfassung, besonders für journalistische Texte der Firma Wissorg, ist mit den vorgestellten Methoden nur unbefriedigend möglich.
Eine Verbesserung könnte die Kombination mehrerer Methoden erbringen.
Generell wurde festgestellt, dass die automatische Textzusammenfassung nur bei formal gut strukturierten Texten zu brauchbaren Ergebnissen führt.
Datum: 2005-06-03
Protokollant: Jan Kairies (Matr.-Nr. 1760022)