Lerninhalte

Die Informationslinguistik entwickelt Verfahren zur Verarbeitung der natürlichen Sprache. Im Kontext von Indexierung und Retrieval ist das wichtig, da ein Retrievalprogramm nur dann erfolgreich sein kann, wenn Anfrage- und Indexierungsvokabular übereinstimmen.

Wenn Informationsspezialisten und Informationsspezialistinnen Schlagworte vergeben, stehen diese meistens im Nominativ Singular. (Diese Normierung nennt man Terminologiekontrolle.) Voraussetzung hierfür ist ein Wissen über die Bedeutung und Form von Wörtern in einer Sprache. In dieser Lerneinheit stellen wir uns deshalb die Frage, über welches linguistische Wissen eine Software verfügen müsste, um diese intellektuelle Arbeit ersetzen zu können.

Einzelheiten unserer sprachlichen Kompetenz sind uns in der Regel nicht bewusst - keine gute Voraussetzung für ihre Integration in Computerprogramme. Diese LE macht Ihnen deshalb Ihr implizites Wissen über die Form von Wörtern bewusst. Mit den Wörtern und Wortformen beschäftigt sich innerhalb der Linguistik die Teilsdisziplin der Morphologie.

Lernziele

Wenn Sie diesen Teil der Lerneinheit über linguistische Grundlagen der automatischen Indexierung bearbeitet haben,

  1. haben Sie sich das linguistische Wissen bewusst gemacht, das eine Software für die automatische Wortformenkontrolle benötigt,
  2. können Sie wichtige linguistische Erscheinungen, die für die automatische Indexierung eine Rolle spielen, mit Fachtermini benennen,
  3. haben Sie ein Problembewusstsein für die linguistischen Unregelmäßigkeiten von Sprachen entwickelt,
  4. haben Sie erste Vorstellungen darüber entwickelt, wie linguistisches Wissen in maschinelle Abläufe integriert werden könnte.

WissOrg ist ratlos

Rainer Fuchs


Alle Mitarbeiter sind sich einig, dass bloße Volltextinvertierung keine Inhaltserschließung ist. "Naja,", sagt Rainer Fuchs, "wenn wir daran denken, alle Suchtermini zu trunkieren, alle Synonyme und fremdsprachigen Äquivalente mit OR zu verknüpfen und mit Felddefinitionen und Proximity-Operatoren arbeiten, können wir die schlechte Indexqualität bei der Recherche einkalkulieren."

 


Katja Rabe


Mario Schreiber ist verärgert: "Ich weiß nicht, was diese Sachen bedeuten und will es auch nicht wissen. Ich will mein Thema in die Datenbank eingeben und die richtigen Ergebnisse kriegen - wie bei Google."

 

 

 

Die Doku-Mitarbeiter sind ratlos. Was Rainer Fuchs sagt, ist nicht ganz falsch, berücksichtigt aber nicht die Vorkenntnisse und Bedürfnisse der Mitarbeiter. Sie beschließen, die einzelnen Probleme, die ihnen bei der Volltextinvertierung aufgefallen sind, systematisch anzugehen. Erstes Thema: Wortformenvielfalt.

 

Stand:26. April 2018

< Seite drucken >
< Zum Seitenanfang >

STEP 2

Initialaufgabe

STEP 3

Lektüre 1

STEP 4

Lektüre 2

STEP 5

Übung
Step 1
Step 2
Step 3
Step 4
Step 5
Einführung

LE 03: Linguistische Grundlagen