Kontrollierte Vokabulare - Grundlagen
Was sind kontrollierte Vokabulare? |
Ein
Vokabular ist der
Wortschatz einer Sprache oder eines Bereiches der Sprache (z.B. Fachvokabular).
Als kontrollierte Vokabulare bezeichnet man Sammlungen von Wörtern, die nach festgelegten Regeln bearbeitet wurden, um die Mehrdeutigkeiten der natürlichen Sprache zu reduzieren (terminologische Kontrolle). Die typologischen Ausprägungen kontrollierter Vokabulare reichen von einfachen
Wortlisten bis zu komplexeren, strukturierten Vokabularen wie z.B.
Taxonomien und
Thesauri. Die Struktur dieser Vokabulare entsteht durch den Aufbau von Relationen zwischen den Begriffen (begriffliche Kontrolle).
Kontrollierte Vokabulare werden in der Informationspraxis zu Indexierung und Retrieval benutzt. Beim gebundenen Indexieren müssen alle Indexterme einem kontrollierten Vokabular entstammen.
Terminologische Kontrolle - die Bezeichnungen
Eine Dokumentationssprache sollte so eindeutig wie möglich sein
- um eine konsistente Indexierung zu unterstützen
- damit vollständige und präzise Suchergebnisse erzielt werden können.
Die natürliche Sprache ist aber oft mehrdeutig, denn der sprachliche Ausdruck (Bezeichnung) und das "Gemeinte" (Begriff) stehen nicht in einer eindeutigen Beziehung zueinander. Aufgabe der terminologischen Kontrolle ist es, Begriffe und Bezeichnungen eindeutig aufeinander zu beziehen.
- Begriff
(auch: Konzept, engl. concept), das "Gemeinte"; die gedankliche Vorstellung von einem konkreten oder abstrakten Gegenstand, die eine Bezeichnung hervorruft; sprachunabhängige Wissenseinheit, die durch die Zusammenfassung von Merkmalen der Bezugsobjekte definiert wird
- Bezeichnung
(auch: Term, Benennung; engl. term, label); sprachliches Zeichen, das einen Begriff repräsentiert
Bedeutungs- und Bezeichnungsvielfalt entstehen durch Homonyme/Polyseme und Synonyme:
- Homonyme und Polyseme
Ein Wort kann sich auf mehrere verschiedene Dinge beziehen, d.h. eine Bezeichnung kann mehr als eine Bedeutung haben (Mehrdeutigkeit, Ambiguität, Bedeutungsvielfalt):
Beispiel: Atlas (Gebirge, Seide, einer der Titanen der griechischen Mythologie, geographisches Nachschlagewerk, Halswirbel).
Grafische Darstellung
Homonym
Polysemie
- Synonyme
Ein Ding kann durch mehrere verschiedene Wörter referenziert werden, d.h. ein Begriff kann mehr als eine Bezeichnung haben (Bezeichnungsvielfalt):
Beispiel: Reichskristallnacht, Kristallnacht, Novemberpogrom, Pogromnacht, Reichspogromnacht
meinen alle den Begriff "Zerstörung jüdischer Geschäfte in der Nacht vom 9./10.11.1938 in Deutschland".
Synonym
Bezeichnungs- und Bedeutungsvielfalt der natürlichen Sprache werden durch die teminologische Kontrolle aufgelöst. Es werden (so weit wie möglich) eindeutige Bezeichnungen für Indexierung und Retrieval festgelegt.
- Homonym-/Polysemkontrolle
Homonyme oder Polyseme werden durch Klammerzusätze disambiguiert (wörtlich: "entmehrdeutigt", also vereindeutigt, eindeutig gemacht):
Beispiel: Atlas (Gebirge), Atlas (Seide), Atlas (Mythologie), Atlas (Anatomie), Atlas (Geographie)
- Synoynmkontrolle
Synonyme werden identifiziert und zu so genannten Äquivalenzklassen zusammengefasst. Vokabulare wie Normdateien und Thesauri legen einen Term aus der Äquivalenzklasse für Indexierung und Retrieval als Vorzugsbenennung fest:
Beispiel: "Reichskristallnacht, Kristallnacht, Novemberpogrom, Pogromnacht, Reichspogromnacht" sind Synonyme und bilden eine Äquivalenzklasse. Es kann z.B. "Novemberpogrom" als Vorzugsbenennung gewählt werden (Äquivalenzrelation).
Funktion kontrollierter Vokabulare |
Kontrollierte Vokabulare werden für die inhaltliche Erschließung von Dokumenten jeder Art eingesetzt. Sie
- ermöglichen eine konsistente Indexierung
- verbessern die Wiederauffindbarkeit von Dokumenten
- helfen bei der Präzisierung der Recherche
- dienen der Verständigung über die Inhalte einer Domäne
- unterstützen die Interoperabilität
Struktur kontrollierter Vokabulare? |
Kontrollierte Vokabulare zeigen einen unterschiedlichen Grad der Strukturierung. Einfache Schlagwortlisten sind nur alphabetisch sortiert und haben darüber hinaus keine weitere Strukturierung. Begriffssysteme wie Taxonomien, Klassifikationen und Thesauri bilden durch ihre Begriffsrelationen zunehmend komplexere, netzartige Strukturen aus.
Begriffliche Kontrolle - die Relationen
In der natürlichen Sprache werden Bezeichnungen meist durch den Kontext, in dem sie benutzt werden, disambiguiert. Z.B. ist "Atlas" in einem Zusammenhang mit "Textilien" leicht als "Seide" zu erkennen, im medizinischen Kontext als der Halswirbelknochen. Solche semantischen Relationen werden auch in manchen kontrollierten Vokabularen abgebildet, um die Begriffe in einen Kontext zu stellen und dem Nutzer dadurch den Sucheinstieg zu erleichtern. Die wichtigsten Beziehungen in den traditionellen Dokumentationssprachen sind:
- Äquivalenzrelation
In Dokumentationssprachen die Beziehung zwischen den Synonymen einer Äquivalenzklasse und der Vorzugsbenennung, die den Begriff repäsentiert.
Beispiel: Von den Synonymen "Reichskristallnacht, Kristallnacht, Pogromnacht, Reichspogromnacht" wird durch die Relation "Benutze Synonym" auf die Vorzugsbenennung "Novemberpogrom" verwiesen. Diese Vorzugsbenennung ist nun das Schlagwort, mit dem indexiert und recherchiert wird. In Thesauri werden diese Schlagwörter auch "Deskriptoren" genannt. Die Umkehrrelation, mit der die Beziehung vom Deskriptor zum Synonym bezeichnet wird, heißt "Benutzt für".
Exkurs: Relationen
Thesaurus - Äquivalenzrelation
- Hierarchische Relation
Beziehung zwischen übergeordneten und untergeordneten Begriffen (oder Oberklassen und Unterklassen; Kategorien und Subkategorien etc.), oft nach dem Prinzip der Unterteilung in Gattung und Art (genus/specius, s. generische Relation). Je nach Grad der Abstraktion sind die Benennungen für die Elemente der Hierarchiestufen unterschiedlich (Kategorien sind z.B. abstraktere Einheiten als Klassen). Allen gemeinsam ist das Prinzip der Gruppierung und hierarchischen Gliederung von Gegenständen oder Sachverhalten auf Grund ihrer gemeinsamen Merkmale. Dabei muss mindestens ein Merkmal für die Unterteilung maßgabend sein.
Die deutschen Normen definieren zwei Typen hierarchischer Relationen: die generische Relation oder Abstraktionsbeziehung und die partitive Relation oder Bestandsbeziehung. Die angloamerikanischen Standards beschreiben noch eine dritte Ausprägung: die Instanzrelation.
Thesaurus - Hierarchierelation
- Generische Relation
Diese hierarchische Relation ist eine logische Abstraktionsrelation. Der untergeordnete Begriff bzw. die Unterklasse teilen alle Merkmale des übergeordneten Begriffes bzw. der Oberklasse und besitzen darüber hinaus mindestens ein weiteres spezifizierendes Merkmal. Man kann auch sagen, die "Kinder" (die Unterbegriffe oder untergeordneten Knoten, engl. "child nodes") erben die Eigenschaften der Eltern (die Oberbegriffe oder übergeordneten Knoten, engl. "parent nodes") und haben noch mindestens eine weitere differenzierende Eigenschaft. Diese Relation wird auch IsA-Relation genannt. Mit einem einfachen
Test kann man prüfen, ob eine Relation eine logische generische Relation ist.
Beispiel:
- Partitive Relation
Diese Relation drückt eine Beziehung zwischen einem Ganzen und seinen Teilen aus (auch: Teil-Ganzes-Beziehung, Bestandsbeziehung). In den Normen und Standards wird sie als hierarchische Beziehung behandelt; anderen Auffassungen zu Folge wird sie zu den assoziativen Relationen gerechnet.
Beispiel: 
- Instanzrelation
Die Instanzrelation wird in deutschen Normen nicht genannt. Angloamerikanische Standards definieren diesen Relationstyp als hierarchische Beziehung zwischen einem Allgemeinbegriff und einer individuellen Ausprägung dieses Begriffes, der Instanz. Diese Instanz ist ein Individualbegriff, der meist durch einen Eigennamen (Personenname, Körperschaftsname, Ortsname) repräsentiert wird. Da Instanzen keine weiteren Unterbegriffe haben können, nennt man sie auch "classes-of one".
Beispiel:
Thesaurus - Instanzrelation
- Assoziationsrelation
Eine Assoziationsrelation ist eine nichthierarchische Beziehung zwischen Begriffen, die in einem thematischen Zusammenhang stehen wie z.B. Ursache - Wirkung, Handlung - Handelnder, Rohmaterial - Produkt. Dieser Relationstyp ist charakteristisch für die Dokumentationssprache Thesaurus (
Thesaurus - Assoziationsrelation)
Exkurs:
Relationen
Typen kontrollierter Vokabulare |
Kontrollierte Vokabulare können nach Art und Grad ihrer Strukturierung typologisiert werden in:
- einfachste Formen kontrollierter Vokabulare ohne begriffliche Strukturierung
- Liste äquivalenter Terme (Synonymringe)
- Liste bevorzugter Terme (Synonymlisten, Schlagwortlisten, Normdateien)
- strukturierte kontrollierte Vokabulare
- hierarchisch strukturierte Vokabulare (Taxonomien, Klassifikationssysteme, Systematiken)
- Thesauri
Die zunehmende Aussagekraft der Relationen wird oft durch eine Achse dargestellt, die im folgenden Beispiel von links nach rechts verläuft:
Diese Achse fungiert im Menüpunkt "Vokabulare" als Navigationsleiste. Durch Anklicken der Buttons können die Kapitel zu den kontrollierten Vokabularen aufgerufen werden.
Wikipedia
International Center for Terminology - Infoterm
Fast, Karl; Leise, Fred; Steckel, Michael (2003):
Fast, Karl; Leise, Fred; Steckel, Michael (2002):
Zeng, Marcia (2005):
Weiterführende Ressourcen |
Deutsches Biblioteksinstitut (1998):
Garshol, Lars Marius (2004):
Harpring, Patricia (1999):