Überblick Metadaten Vokabulare Beispiele Test Glossar Quellen

Thesaurus

Was ist ein Thesaurus?
Funktion von Thesauri
Struktur von Thesauri
Quellen zum Nachschlagen
Weiterführende Ressourcen

Was ist ein Thesaurus?

Ein Thesaurus ist allgemein ein Wortschatz: Im Bereich der Sprachwissenschaft versteht man darunter ein Synonymwörterbuch wie Roget's Thesaurus. In das Textverarbeitungsprogramm MS Word ist eine Funktion für Synonymvorschläge unter dem Menüpunkt Thesaurus integriert. Im Informationsbereich ist ein Thesaurus ein kontrolliertes und strukturiertes Vokabular für Indexierung und Retrieval. Thesauri bilden Relationen zwischen Synonymen und Vorzugsbenennungen, hierarchische Relationen und Relationen zwischen thematisch verwandten Begriffen ab.

"Ein Thesaurus im Bereich der Information und Dokumentation ist eine geordnete Zusammenstellung von Begriffen und ihren (vorwiegend natürlichsprachigen) Bezeichnungen, die in einem Dokumentationsgebiet zum Indexieren, Speichern und Wiederauffinden dient." [DIN 1463-1:1987]

Wie ein Wörterbuch besteht ein Thesaurus aus einer Menge von Bezeichnungen der natürlichen Sprache (häufig einer Fachsprache). Diese Bezeichnungen werden in einem Thesaurus - wie in anderen kontrollierten Vokabularen auch - nach festgelegten Regeln terminologisch kontrolliert:

Die Bezeichnungen (Terme) des Thesaurus repräsentieren Begriffe (Konzepte). Zwischen diesen Begriffen werden die hierarchischen und assoziativen Relationen aufgebaut (begriffliche Kontrolle). Diese Begriffsbeziehungen bilden die Struktur des Thesaurus.

Funktion von Thesauri

Thesauri werden zur inhaltlichen Erschließung in allen wissenschaftlichen Domänen (Naturwissenschaften, Kulturwissenschaften, Angewandte Wissenschaften), aber auch im kommerziellen Bereich und zur Informationsorganisation in Intranets eingesetzt.

Thesauri

Zunehmend gewinnen Thesauri auch an Bedeutung als Referenzvokabulare für inhaltliche Metadaten. So empfiehlt z.B. die Dublin Core Metadata Initiative die Nutzung des Thesaurus of Geographic Names (TGN) oder der Library of Congress Classification für die Werte der Metadatenelemente "Coverage" und "Subject". In den DCMI Metadata Terms werden die kontrollierten Vokabulare als Encoding Schemes bezeichnet.

Struktur von Thesauri

Die Thesaurus-Relationen

Ein Thesaurus wird durch drei Relationstypen definiert:

Die Relationen in Thesauri werden im Unterschied zu Taxonomien und Wortlisten explizit durch so genannte Relationenkürzel gekennzeichnet. Alle Thesaurusrelationen sind reziprok, d.h. jede Relation hat eine Umkehrrelation mit einem entsprechenden Relationenkürzel.
Beispiel:



UB steht für Unterbegriff, OB für Oberbegriff. UB und OB sind die reziproken Relationenkürzel.

Die Äquivalenzrelation teilen Thesauri mit Normdateien und Synonymlisten. Eine Äquivalenzrelation ist die Beziehung zwischen gleichwertigen Bezeichnungen (bedeutungsgleich oder bedeutungsähnlich), die zu einer Äquivalenzklasse zusammengeführt werden [DIN 1463-1:1987, 5.2]. In Thesauri wird von den Synonymen auf die Vorzugsbenennung (Deskriptor) verwiesen.
Grafische Darstellung

Die Hierarchierelation haben Thesauri gemeinsam mit systematisch strukturierten Vokabularen wie Klassifikationen und Taxonomien.
Grafische Darstellung

"Hierarchierelationen liegen vor, wenn zwei Begriffe zueinander in einem Verhältnis der Über- bzw. Unterordnung stehen. Dabei sind zwei grundsätzlich unterschiedliche Formen der Hierarchierelation zu unterscheiden:
- die Abstraktionsrelation
- die Bestandsrelation."
[DIN 1463-1:1987]

Die deutsche Norm (wie auch die internationalen Standards) definieren die hierarchische Relation strikt als entweder generische Relation oder partitive Relation.

Angloamerikanische Standards kennen darüber hinaus die Instanzrelation, eine Beziehung zwischen einem Individualbegriff (meist ein Eigenname) und dem generischen Oberbegriff.
Grafische Darstellung
Beispiel

Die Assoziationsrelation (Beziehung zwischen verwandten Begriffen) in Thesauri entspricht den Siehe-auch-Verweisungen in Klassifikationen und Buchregistern. Nutzer werden bei der Recherche auf weitere für ihre Suche möglicherweise interessante Themen aufmerksam gemacht. Diese Relation kann auch für die automatische Ausweitung einer Suche (Expansion) auf verwandte Begriffe eingesetzt werden, die in das Suchergebnis mit einbezogen werden.

"Eine Assoziationsrelation ist eine zwischen Begriffen bzw. ihren Beziehungen als wichtig erscheinende Relation, die weder eindeutig hierarchischer Natur ist, noch als äquivalent angesehen werden kann." [DIN 1463-1:1987]

Präziser beschreibt der amerikanische Standard diesen Relationstyp, indem Beispiele für Assoziationsrelationen angegeben werden (Semantic Relationships used in Controlled Vocabularies).

Grafischer Überblick über die Thesaurusrelationen (1)
Grafischer Überblick über die Thesaurusrelationen (2)

Der systematische Teil

Entsprechend der deutschen Norm haben Thesauri eine alphabetische und eine systematische Darstellung.
Im alphabetischen Teil sind alle Thesaurusterme - Deskriptoren und Nichtdekriptoren - alphabetisch aufgelistet.
Beispiel aus dem Thesaurus EUROVOC

"Im systematischen Teil sind alle Deskriptoren bzw. alle Bezeichnungen systematisch nach den im Thesaurus enthaltenen hierarchischen Relationen geordnet." [DIN 1463-1:187, 6.5]
Beispiel aus dem Thesaurus EUROVOC

Viele, vor allem größere Thesauri, enthalten zusätzliche gruppierende und systematisierende Elemente, die die oberen Hierarchieebenen bilden und den Thesaurus weiter untergliedern. Diese Elemente werden z.B. als Mikrothesauri, Teilthesauri, Subthesauri oder Sachbereiche bezeichnet. Sie sind ein Einstieg für die Suche auf einer hierarchisch hohen Ebene und erleichtern eine thematische Navigation.
Beispiel aus dem Thesaurus EUROVOC

Zur Gliederung eines Thesaurus werden häufig neben Sachgebietsthemen auch allgemeinere Kategorien benutzt. Ein bekanntes Beispiel sind die sieben Facetten des Art & Architecture Thesaurus.

zu den Beispielen

Quellen zum Nachschlagen

Wikipedia
Thesaurus
http://de.wikipedia.org/wiki/Thesaurus

DIN 1463 - Teil 1 (1987):
Erstellung und Weiterentwicklung von Thesauri. Berlin: Deutsches Institut für Normung, November 1987. - 12 Seiten

Schulz, Ursula (2004):
WissensORGanisation. Lerneinheit 3.2: Thesauri.
http://www.bui.haw-hamburg.de/pers/ursula.schulz/worg1/le-32.html (2003-07-06 updated)

Zeng, Marcia (2005):
Construction of Controlled Vocabularies - A Primer.
http://www.slis.kent.edu/%7Emzeng/Z3919/index.htm
- Kapitel 4: Semantic Relationships used in Controlled Vocabularies

Weiterführende Ressourcen

ANSI/NISO Z39.19 (2003):
Guidelines for the Construction, Format, and Management of Monolingual Thesauri. American National Standards Institute / National Information Standards Organization (Hrsg.). Bethesda: NISO Press, August 2003. - 69 Seiten.
Der Standard kann als PDF-Datei heruntergeladen werden unter http://www.niso.org/standards/index.html

ANSI/NISO Z39.19 (200x):
Guidelines for the Construction, Format, and Management of Monolingual Controlled Vocabularies. American National Standards Institute / National Information Standards Organization (Hrsg.). Bethesda: NISO Press, Draft 2005.
- 176 Seiten. Der Standard (Entwurf) kann als PDF-Datei heruntergeladen werden unter http://www.niso.org/standards/resources/Z39-19Ballot041105.pdf.
Der Entwurf liegt der online zugänglichen Einführung in kontrollierte Vokabulare von Marcia Zeng zu Grunde: Construction of Controlled Vocabularies - A Primer.
http://www.slis.kent.edu/~mzeng/Z3919/index.htm

ISO 2788 (1986):
Documentation - Guidelines for the establishment and development of monolingual thesauri. Second edition. International Organization for Standardization, Nov 1986. - 32 Seiten

Burkart, Margarete (2004):
Thesaurus. In: Kuhlen, Rainer; Seeger, Thomas; Strauch, Dietmar (Hrsg.): Grundagen der praktischen Information und Dokumentation. 5., völlig neu gefasste Ausgabe. München: Saur, 2004. - S. 141-154

EUROVOC (2005):
EUROVOC Thesaurus. Version 4.2. Europäische Gemeinschaften, 2005.
- hier besonders: Präsentation des Thesaurus.
http://europa.eu.int/celex/eurovoc/cgi/sga_doc?eurovoc_dif!SERVEUR/menu!prod!MENU&langue=DE

Garshol, Lars Marius (2004):
Metadata? Thesauri? Taxonomies? Topic Maps! Making sense of it all.
http://www.ontopia.net/topicmaps/materials/tm-vs-thesauri.html
- Kapitel 3: "Subject Based Classification", hier speziell: "3.3. Thesauri"

Gastmeyer, Manuela (2001):
Der Einsatz des Standard-Thesaurus Wirtschaft im HWWA. (Letzte Aktualisierung: 2001-01-02) [Letzter Zugriff: 2005-08-13]
http://www.hwwa.de/Publikationen/Dokumentation/docs/0004-gastmeyer.htm
hier besonders: Systematik des Thesaurus.
http://www.hwwa.de/Publikationen/Dokumentation/docs/0004-gastmeyer.htm#Thesaurus-Systematik