Was ist ein Thesaurus? Funktion von Thesauri Struktur von Thesauri |
Quellen zum Nachschlagen Weiterführende Ressourcen |
Was ist ein Thesaurus? |
Ein Thesaurus ist allgemein ein Wortschatz: Im Bereich der Sprachwissenschaft versteht man darunter ein Synonymwörterbuch wie Roget's Thesaurus. In das Textverarbeitungsprogramm MS Word ist eine Funktion für Synonymvorschläge unter dem Menüpunkt
Thesaurus integriert. Im Informationsbereich ist ein Thesaurus ein kontrolliertes und strukturiertes Vokabular für Indexierung und Retrieval. Thesauri bilden Relationen zwischen Synonymen und Vorzugsbenennungen, hierarchische Relationen und Relationen zwischen thematisch verwandten Begriffen ab.
"Ein Thesaurus im Bereich der Information und Dokumentation ist eine geordnete Zusammenstellung von Begriffen und ihren (vorwiegend natürlichsprachigen) Bezeichnungen, die in einem Dokumentationsgebiet zum Indexieren, Speichern und Wiederauffinden dient." [DIN 1463-1:1987]
Wie ein Wörterbuch besteht ein Thesaurus aus einer Menge von Bezeichnungen der natürlichen Sprache (häufig einer Fachsprache). Diese Bezeichnungen werden in einem Thesaurus - wie in anderen kontrollierten Vokabularen auch - nach festgelegten Regeln terminologisch kontrolliert:
Die Bezeichnungen (Terme) des Thesaurus repräsentieren Begriffe (Konzepte). Zwischen diesen Begriffen werden die hierarchischen und assoziativen Relationen aufgebaut (begriffliche Kontrolle). Diese Begriffsbeziehungen bilden die Struktur des Thesaurus.
Funktion von Thesauri |
Thesauri werden zur inhaltlichen Erschließung in allen wissenschaftlichen Domänen (Naturwissenschaften, Kulturwissenschaften, Angewandte Wissenschaften), aber auch im kommerziellen Bereich und zur Informationsorganisation in Intranets eingesetzt.
Thesauri
Zunehmend gewinnen Thesauri auch an Bedeutung als Referenzvokabulare für inhaltliche Metadaten. So empfiehlt z.B. die Dublin Core Metadata Initiative die Nutzung des Thesaurus of Geographic Names (TGN) oder der
Library of Congress Classification für die Werte der Metadatenelemente "Coverage" und "Subject". In den
DCMI Metadata Terms werden die kontrollierten Vokabulare als
Encoding Schemes bezeichnet.
Struktur von Thesauri |
Ein Thesaurus wird durch drei Relationstypen definiert:
Die Relationen in Thesauri werden im Unterschied zu Taxonomien und Wortlisten explizit durch so genannte Relationenkürzel gekennzeichnet. Alle Thesaurusrelationen sind reziprok, d.h. jede Relation hat eine Umkehrrelation mit einem entsprechenden Relationenkürzel.
Beispiel:
UB steht für Unterbegriff, OB für Oberbegriff. UB und OB sind die reziproken Relationenkürzel.
Die Äquivalenzrelation teilen Thesauri mit Normdateien und Synonymlisten. Eine Äquivalenzrelation ist die Beziehung zwischen gleichwertigen Bezeichnungen (bedeutungsgleich oder bedeutungsähnlich), die zu einer Äquivalenzklasse zusammengeführt werden
[DIN 1463-1:1987, 5.2]. In Thesauri wird von den Synonymen auf die Vorzugsbenennung (Deskriptor) verwiesen.
Grafische Darstellung
Die Hierarchierelation haben Thesauri gemeinsam mit systematisch strukturierten Vokabularen wie Klassifikationen und Taxonomien.
Grafische Darstellung
"Hierarchierelationen liegen vor, wenn zwei Begriffe zueinander in einem Verhältnis der Über- bzw. Unterordnung stehen. Dabei sind zwei grundsätzlich unterschiedliche Formen der Hierarchierelation zu unterscheiden:
- die Abstraktionsrelation
- die Bestandsrelation."
[DIN 1463-1:1987]
Die deutsche Norm (wie auch die internationalen Standards) definieren die hierarchische Relation strikt als entweder generische Relation oder partitive Relation.
Angloamerikanische Standards kennen darüber hinaus die Instanzrelation, eine Beziehung zwischen einem Individualbegriff (meist ein Eigenname) und dem generischen Oberbegriff.
Grafische Darstellung
Beispiel
Die Assoziationsrelation (Beziehung zwischen verwandten Begriffen) in Thesauri entspricht den Siehe-auch-Verweisungen in Klassifikationen und Buchregistern. Nutzer werden bei der Recherche auf weitere für ihre Suche möglicherweise interessante Themen aufmerksam gemacht. Diese Relation kann auch für die automatische Ausweitung einer Suche (Expansion) auf verwandte Begriffe eingesetzt werden, die in das Suchergebnis mit einbezogen werden.
"Eine Assoziationsrelation ist eine zwischen Begriffen bzw. ihren Beziehungen als wichtig erscheinende Relation, die weder eindeutig hierarchischer Natur ist, noch als äquivalent angesehen werden kann." [DIN 1463-1:1987]
Präziser beschreibt der amerikanische Standard diesen Relationstyp, indem Beispiele für Assoziationsrelationen angegeben werden (Semantic Relationships used in Controlled Vocabularies).
Entsprechend der deutschen Norm haben Thesauri eine alphabetische und eine systematische Darstellung.
Im alphabetischen Teil sind alle Thesaurusterme - Deskriptoren und Nichtdekriptoren - alphabetisch aufgelistet.
Beispiel aus dem Thesaurus EUROVOC
"Im systematischen Teil sind alle Deskriptoren bzw. alle Bezeichnungen systematisch nach den im Thesaurus enthaltenen hierarchischen Relationen geordnet." [DIN 1463-1:187, 6.5]
Beispiel aus dem Thesaurus EUROVOC
Viele, vor allem größere Thesauri, enthalten zusätzliche gruppierende und systematisierende Elemente, die die oberen Hierarchieebenen bilden und den Thesaurus weiter untergliedern. Diese Elemente werden z.B. als Mikrothesauri, Teilthesauri, Subthesauri oder Sachbereiche bezeichnet. Sie sind ein Einstieg für die Suche auf einer hierarchisch hohen Ebene und erleichtern eine thematische Navigation.
Beispiel aus dem Thesaurus EUROVOC
Zur Gliederung eines Thesaurus werden häufig neben Sachgebietsthemen auch allgemeinere Kategorien benutzt. Ein bekanntes Beispiel sind die sieben Facetten des Art & Architecture Thesaurus.
zu den Beispielen
Quellen zum Nachschlagen |
Weiterführende Ressourcen |