Metadaten
"Unter Metadaten versteht man im Allgemeinen (strukturierte) Daten, die Informationen über andere Daten, Objekte, Entitäten etc. enthalten. Im informationswissenschaftlichen und bibliothekarischen Kontext versteht man hierunter Daten, die der Beschreibung von elektronischen Ressourcen dienen. In letzter Zeit geht der Trend jedoch dahin, den Begriff Metadaten auch für Daten und Kataloge in Datenbanken zu verwenden, die nicht-elektronische Ressourcen beschreiben." [
Die Deutsche Bibliothek -> DDB professionell -> Metadaten]
Metadaten liefern also Informationen über Eigenschaften eines Dokuments, wie z.B. seinen Verfasser, den Zeitpunkt der Entstehung des Dokuments, das technische Format, Inhalt, Rechteinhaber usw. Diese Metadaten sind eine Sammlung von definierten Elementen, die ähnlich den Elementen bibliographischer Beschreibungen der Identifizierung und Wiederauffindbarkeit einer Ressource dienen.
Metadaten
- sind eine standardisierte, maschinenlesbare Beschreibung von (elektronischen) Ressourcen
- dienen der Beschreibung unterschiedlicher (elektronischer) Informationseinheiten und Ressourcentypen wie Bilder, Datensammlungen, Texte, Multimedia-Präsentationen etc.
- beschreiben unterschiedliche Eigenschaften der Ressourcen wie Inhalt, Autor, Verlag, Nutzung etc.
- können Ressourcen auf allen Ebenen der Aggregation beschreiben
- sollen die Interoperabilität verschiedener Metadatenformate und verschiedener technischer Systeme (Datenbanktypen, Rechnerplattformen) unterstützen.
Metadaten können
- eingebettet in die Ressource, z.B. in HTML-Seiten
(Beispiel) oder Bilddateien vorkommen oder
- in separaten Dateien (Standalone-Metadata) bzw. Datenbanken stehen.
zu den
Beispielen (Übersicht)
Ziel der Metadatenstandards ist es, den Zugriff auf Daten durch vereinheitlichte Beschreibungsverfahren zu erleichtern. Hierzu ist es nötig, dass Metadaten zwischen verschiedenen Repräsentationsformen (Metadatenformaten) auch über Systemgrenzen hinweg ausgetauscht werden können. Ein weiteres Ziel besteht darin, durch sorgfältige Darlegung der Beschreibungsprinzipien eine Grundlage für die Interoperabilität mit solchen Systemen zu schaffen, die aich auf andere Metadatenstandards stützen. Damit verbinden sich folgende Ziele:
- Verbesserung der Wiederauffindbarkeit von Dokumenten
- Erhöhung der Retrieval-Qualitiät (Recall und Precision)
- Erleichterte Verwaltung elektronischer Ressourcen, z.B. in Workflow-Systemen
- Erleichterung des Datenaustauschs und der Interoperabilität
zu anderen Metadaten-Standards
- Leichte Integration von Ressourcenbeschreibungen, die nach älteren Regeln angefertigt wurden
- Schnellere Lokalisierung der Primärdokumente mit Hilfe von verlässlichen Ressourcen-Indikatoren (URIs, URNs, usw.)
- Offenlegung und Unterstützung inhaltlicher Erschließungsverfahren wie Klassifikation, Indexierung u.a.
- Integration von Verarbeitungsanweisungen für Softwarekomponenten wie Webserver, Browser, Suchmaschinen-Robots.
Nach ihrer Funktion werden Typen von Metadaten unterschieden:
- Beschreibende Metadaten (auch: deskriptive Metadaten, engl.: descriptive metadata)
sind Informationen, die der Identifizierung und dem Wiederauffinden der Ressource dienen wie Titel, Verfasser, Abstract, Schlagwörter etc.
- Verwaltungsmetadaten (auch: administrative Metadaten, engl.: administrative metadata) sind
Informationen über die Herstellung, Speicherung, Verwahrung der Ressource oder des Objektes, Rechtemanagement, Verwaltung der Zugriffsrechte usw.
- Strukturelle Metadaten (engl.: structural metadata) sind
Informationen über den strukturellen Aufbau der Ressource wie Einteilung in einzelne Kapitel oder Textpassagen, Abschnitte mit visuellen Medien etc.
- Technische Metadaten (engl.: technical metadata) umfassen Angaben zu Merkmalen der digitalen Ressource wie Umfang, verwendete Codierverfahren, technisch relevante Strukturmerkmale usw.
Zur Speicherung und Übertragung von Metadaten gibt es eine Reihe von Datenformaten. Datenmodelle und Datenschemata wie beispielsweise die DCMI Terms lassen sich in unterschiedlichen Formaten ausdrücken.
- Metadatenformate liefern
Regeln für die Codierung (d.h. die maschinelle Repräsentation) und die Syntax (d.h. die Kennzeichnung und Anordnung) von Metadaten.
Beispiel: Das Metadatenelement "Title" der
DCMI Metadata Terms wird im xml-Format standardmäßig nach dem UTF8-Zeichensatz codiert und so gekennzeichnet: <dc:title>Understanding Metadata</dc:title>.
- Diese Regeln sind erforderlich, damit Browser, Suchmaschinen und andere Programme die Metadaten verlässlich verarbeiten können.
Beispiele für Metadatenformate
- MARC
MARC (Machine-Readable Cataloguing Record) ist ein bibliographisches Datenschema, für das lange Zeit nur ein Datenformat existierte (
Beispiel). Die MARC-Formate sind Standards für die Repräsentation und den Austausch bibliografischer Informationen in maschinenlesbarer Form. MARC 21 ist ein internationaler Standard und eine Implementierung des American National Standard Information Interchange Format (ANSI Z39.2) und des internationalen "Format for Information Exchange (ISO 2709)".
- HTML
HTML definiert das Element <meta>, welches speziell für die Integration von Metadaten in Web-Ressourcen eingeführt wurde. Diese Tags können im <head>-Element erscheinen und werden hauptsächlich für Informationen wie zum Beispiel Erzeugungsdatum, Autor, Beschreibung oder Copyright-Informationen verwendet. Sie werden nicht im Browserfenster angezeigt, können aber im Seitenquellcode eingesehen werden. Webbrowser und Suchmaschinen werten diese Metadaten unterschiedlich aus. Der HTML-Standard seit Version 4.0 schreibt keine konkreten Meta-Angaben mehr vor, sondern definiert lediglich die Syntax einer Meta-Angabe.
Meta-Tags in HTML bestehen aus Paaren von "name"-Attributen und "content"-Attributen, wobei "name" den Namen des Metadatenelements, z.B. "author" enthält und "content" den Inhalt oder Wert dieses Elements, z.B. "Otto Müller".
(
Beispiel einer Metadatenanzeige in Firefox)
Das HTML-Meta-Element kann darüber hinaus für Verarbeitungswanweisungen
an Server, Netzwerk-Software und Browser genutzt werden.
- XML
XML ist seit der Einführung im Jahr 1999 das De-facto-Standardformat für fast alle neueren Metadatenschemata. Die konkrete XML-Syntax für ein Schema (Elementnamen, Inhaltstypen, Anzahl, Reihenfolge und Schachtelung) wird dabei in einer abstrakten Syntaxsprache (DTD, XML-Schema, Relax-NG u.a.) notiert. Dieser strenge Formalismus minimiert den Auslegungsspielraum und damit die Wahrscheinlichkeit von Missverständnissen bei der Implementierung von Verarbeitungverfahren.
zu den
Beispielen
Ein Metadatenschema
- definiert ein Set von Metadaten-Elementen durch
- Festlegung der Element-Bezeichnung und
- möglichst eindeutige Beschreibung der Bedeutung des Elements
- stellt Regeln dafür auf, in welchem Kontext welches Element zulässig ist
- legt - soweit erforderlich - Vereinbarungen fest für
- Datentypen (z.B. Text, Zahlenwert, Datumswert usw.)
- Wertevorräte (numerische Bereiche, kontrolliertes Vokabular usw.)
- Referenzen auf andere Schemata und Regelwerke.
Soweit Metadatenschemata nicht direkt auf ältere Konventionen zurückgreifen (wie bei einigen bibliografischen Schemata), werden die Vereinbarungen heute meist nicht mehr nur in natürlicher Sprache, sondern zusätzlich auch in formalen Spezifikations- und Syntaxsprachen (s.o.) festgelegt.
Datentypen und Wertevorräte
Für verschiedene Metadatenelemente kann es nützlich oder erforderlich sein, die dort möglichen Angaben bereits im Metadatenschema einzuschränken. Unterscheidungen nach Datentyp (Text, numerische oder andere Angabe) erleichtern die softwaregestützte Verarbeitung der Metadaten.
Darüber hinaus können elementspezifische Wertevorräte definiert werden. So kann es nützlich sein, eine Geschlechtsangabe im Kontext von Personendaten von vornherein auf die Werte "weiblich", "männlich" und "unbekannt" zu beschränken und hierfür verbindliche Schreibweisen festzulegen. Solche Wertevorräte können als kontrollierte Vokabulare aufgefasst werden. Sie werden entweder im Zusammenhang mit dem Metadatenschema formuliert oder einer externen Quelle entnommen.
Kann ein extern definierter Datentyp oder Wertevorrat aus mehreren unterschiedlichen Quellen stammen, so wird eine ausdrückliche Referenz auf die Quelle erforderlich. Kalendarische Angaben können sich beispielsweise auf verschiedene Kalendersysteme beziehen und Schlagworte können mehreren externen Vokabularen entnommen sein. In diesen Fällen wird das Metadatenschema auch Ausdrucksmöglichkeiten für den Quellenverweis bereitstellen müssen. In XML-basierten Schemata werden für diesem Zweck häufig die XML-Namensräume verwendet.
zu den
Beispielen
Für den ersten Überblick
Niedersächische Staats- und Universitätsbibliothek Göttingen (2004):
NISO (2004):
Schulz, Ursula (2004):
SELFHTML (2005):
Schütz, Thomas (2004):
Dokumentenmanagement. In: Kuhlen, Rainer; Seeger, Thomas; Strauch, Dietmar (Hrsg.): Grundagen der praktischen Information und Dokumentation. 5., völlig neu gefasste Ausgabe. München: Saur, 2004. - Hier besonders das Kapitel: Metadaten im Dokumentenmangement. S. 340-341
Zeng, Marcia (2004):
Standards
ANSI/NISO Z39.85 (2001):
The Dublin Core Metadata Element Set. American National Standards Institute / National Information Standards Organization (Hrsg.). Bethesda: NISO Press. Approved September 10, 2001. - VIII, 6 Seiten.
Der Standard kann als PDF-Datei heruntergeladen werden unter
http://www.niso.org/standards/resources/Z39-85.pdf. [Letzter Zugriff: 2005-08-07]
Dublin Core Metadata Initiative (2005):
Glossare
Dublin Core Metadata Initiative (2004):
UK Office for Library and Information Networking (UKOLN) (2001):
Weiterführende Ressourcen |
Baca, Murtha (Hg.) (2000):
Beckett, Dave et al. (2002):
Die Deutsche Bibliothek (2004):
Düro, Michael; Schweibenz, Werner (2001):
Metadaten zur Erschließung von Museumsinformation im World Wide Web. In:
Museologie online. 3. Jg. 2001. - S. 1-83. Hier als Einstieg in das Kapitel Metadaten: Kapitel 2.2 "Die Rolle von Metadaten im WWW"
http://www.vl-museen.de/m-online/01/01-1.pdf [Letzter Zugriff: 2005-08-07]
Duval, Eric; Hodgins, Wayne; Sutton, Stuart; Weibel, Stuart L. (2001):
Garshol, Lars Marius (2004):
Gill, Tony (2000):
Gilliland-Swetland, Anne (2000):
Hillmann, Diane (2003):
IFLA (2003):
Knüttel, Helge (2003):
Entwurf und prototypische Implemenierung eines Metadaten-Rahmenwerks für die Digitalisierung an der Universitätsbibliothek Regensburg. Berlin: Institut für Bibliothekswissenschaft der Humboldt-Universität zu Berlin, 2005. (Berliner Handreichungen zur Bibliothekswissenschaft 126). - viii, 47 S.
http://eprints.rclis.org/archive/00003983/01/h126.pdf [Letzter Zugriff: 2005-08-07]
Payer, Margarete (1999):
Payer, Margarete (2005):
Payer, Margarete (2002):
Schweibenz, Werner (1999):
Die Verwendung von Metadaten und Metatag-Generatoren am Beispiel der Homepage des Juristischen Internet-Projekts Saarbrücken (Teile 1 und 2).
- JurPC Web-Dok. 159/1999, Abs. 1 - 105
http://www.jurpc.de/aufsatz/19990159.htm [Letzter Zugriff: 2005-08-07]
Links
BUBL LINK - Catalogue of Internet Resources:
Helsinki University Library (2000):
IFLANET (2005):
DIGITAL LIBRARIES: Metadata Resources. International Federation of Library Associations and Institutions (Hg.). (Latest Revision: 2005-07-22)
http://www.ifla.org/II/metadata.htm [Letzter Zugriff: 2005-08-07]
UK Office for Library and Information Networking (UKOLN) (2001):
Tools und Templates
Dublin Core Metadata Initiative (2005):
Koch, Traugott et al. (1998):
BSZ - Bibliotheksservice-Zentrum Baden-Württemberg (Hg.):
DCS - Metadata Services and Tools:
RURL Kirovohrad (2001-2002):
Searchcode.de - Das etwas andere Suchmaschinen-Verzeichnis