Abstracts zu Fachaufsätzen

Erster Schritt: intellektuelle Indexierung


Bild intellektuelle Indexierung

Indexieren Sie für die spätere Kontrolle der Ergebnisse die Dokumente zunächst intellektuell.
  • Extrahieren Sie 5 Stichwörter, die den Inhalt des Textes gut wieder geben (nur Substantive), Ansetzung im Nominativ Singular
  • Teilen Sie, falls nötig, zusätzliche Schlagworte zu
  • Tragen Sie die Ergebnisse in eine Tabelle ein

Referate zu Fachliteratur

In der Datenbank sind zur Zeit 200 Dokumente gespeichert.

Dokument 1. GERHARD, DFG-Projekt des BIS Oldenburg 1996-98, kombiniert Funktionen einer Suchmaschine und eines klassifikationsgestützten Verzeichnisses (UDK), beschränkt sich auf deutsche, wiss. relevante Server, ist hier aktueller und vollständiger als die bekannten Suchmaschinen. Integriert Searching und Browsing. Kurz zum Projekt, zu Navigations- und Suchfunktionen, Hardware. Beschreibung der Funktionsweise. 400 Startadressen zusammengestellt, Dokumente werden mittels Harvest 1.5 bis in eine Tiefe von zwölf Stufen gesammelt. Nur HTML-Dateien, nur WWW. mSQL-Konfigurationsdatenbank mit WWW-Schnittstelle, liefert Informationen über das Roboting, steuert parallele Sammelläufe auf verschiedenen Maschinen. Umstieg auf COMBINE geplant, das im Parallelbetrieb effizienter als Harvest arbeitet. Gründe für die Wahl der UDK. UDK wurde linguistisch aufbereitet, ein Lexikon als Buchstabenbaum mit Trunkierungsvariablen und Fähigkeit zum Umgang mit Mehrwortbegriffen generiert. Zu klassifizierende Texte werden derart linguistisch aufbereitet, daß effizientes und effektives Nachschlagen im Lexikon möglich ist. Das Ergebnis (Notationen, Häufigkeit des Auftretens) wird statistisch analysiert und bewertet. Für die Indexierung kam nur ein relationales Datenbanksystem in Frage, Gründe für die Wahl von Oracle. Fehlerquellen beim Klassifizieren. Algorithmen werden weiter optimiert, Zahl der einbezogenen Server wird erweitert werden. Geplante Kooperationen, mögliche weitere Anwendungen des Systems. (178 Wörter)

Dokument 2. Für eine fiktive Dokumentenmenge wurde eine Dokument-Wort-Matrix erstellt und mittels zweier Suchanfragen, ebenfalls als Matrix dargestellt, wurden die Retrievalergebnisse ermittelt. Den Wörtern der Dokumentmenge werden in einem zweiten Schritt Aspekte zugeordnet, und die Untersuchung wurde erneut durchgeführt. Ein Vergleich bestätigt die schon früher gefundenen Vorteile der aspektischen Indexierung gegenüber anderen Methoden der Retrievalverbesserung, wie Trunkierung und Controlled terms. (58 Wörter)

Dokument 3. Das Informationsangebot im WWW nimmt mit einer derartigen Geschwindigkeit zu, daß der Versuch der intellektuellen Indexierung zum Scheitern verurteilt sein muß. Die bisher entwickelten Suchwerkzeuge erfüllen ihren Zweck nur unzureichend. Neue Datenformate für elektronische Dokumente in Verbindung mit entsprechender Software erleichtern das Dokumentenretrieval. Dublin Core ist unter diesen Formaten dasjenige, das sich am wahrscheinlichsten durchsetzen wird; Autoren, die im WWW publizieren, sollten es deshalb verwenden. (65 Wörter)

Dokument 4. Obwohl sie das meistgenutzte Bibliotheksmaterial ist, schenkt die Forschung der Schönen Literatur wenig Aufmerksamkeit. Als Objekt von Untersuchungen wird es durch allgemeine Arbeiten über Erschließung und Retrieval überlagert. Wegen ihres Charakters ist die Schöne Literatur für die Indexierung schwer zu handhaben und Formen der inhaltlichen Erschließung wurden bis in die jüngste Zeit ignoriert. Aber es zeichnen sich Veränderungen ab. Eine Bedarfsanalyse geht besonders auf die Schwierigkeiten der Inhaltserschließung von Schöner Literatur ein. Ferner werden Ergebnisse eines Pilotprojektes in fünf Bibliotheken vorgestellt. Dabei wird die Notwendigkeit weiterer Studien hervorgehoben, um nicht nur Indexierung und Klassifizierung, sondern auch das Retrieval von Schöner Literatur dem Nutzerbedarf anpassen zu können. Der seit 1998 bestehende zentrale Indexierdienst in Finnland für Schöne Literatur gibt Aufschluss über Vor- und Nachteile eines solchen Dienstes. (126 Wörter)

Dokument 5. Geht erneut auf Buch und Aufsatz in dieser Zs. von Fugmann ein, der Möglichkeit zufriedenstellender automatischer Indexierung verneint. Vgl. Druckausgabe des DOBI 99/4, Nw. 2518, 2519. Es wird seine theoretische Basis der totalen Ablehnung natürlichsprachiger Systeme abgelehnt, außerdem gegen seine Einschätzung, daß höchstens bei kleinen Systemen eine automatische Indexierung funktionieren könne. Es sind im Gegenteil die großen Systeme, die automatische Indexierung zwingend benötigen. Hier laufen automatisches Information Indexing und Retrieval erfolgreich, theoretisch verankert durch Informationslinguistik und -statistik sowie mittels ordnungstheoretischer Vorgaben und technisch abgesichert durch Patente. Verbesserungen sind möglich und nötig. Beide Ansätze der Inhaltserschließung müssen miteinander kombiniert werden. (99 Wörter)

Weiter mit dem Zweiten Schritt


zurück: WissOrg testet


Stand: 20. August 2003