Was ist Inhaltliche Erschließung?
Der Inhalt von Medien erschließt sich aus unterschiedlichen Quellen: aus dem Titel, dem Inhaltsverzeichnis, einem zusammenfassenden Text auf dem Cover eines Buches, Abstracts, einzelnen Texten eines Mediums oder sogar dem Volltext.
Allen gemeinsam ist, dass daraus Begriffe (Stichworte) wahrgenommen werden, die den Inhalt mehr oder weniger repräsentieren, nach denen auch gesucht würde …
Oft sind diese Begriffe nicht ausreichend. Inhaltliche Erschließung ist daher
der Versuch, ein vorliegendes Medium inhaltlich zu analysieren und in geeigneter Form strukturiert inhaltlich zu beschreiben.
Das geschieht primär durch Sprache,
natürliche Sprache – allerdings mit
normiertem Vokabular, normierten Begriffen, die mit anderen Begriffen, die dasselbe meinen aber anders lauten (Synonyme) in einem Normdatensatz verknüpft sind und die so bei einer Suche (Retrieval) automatisch mitgesucht werden. In einem Normdatensatz sind auch verwandte Begriffe dokumentiert, Ober- und Unterbegriffe – ob assoziativ, parallel oder hierarchisch – unter Umständen ein ganzes thematisches Feld. Die
Gemeinsame Normdatei (GND) wird im deutschsprachigen wissenschaftlichen Bibliothekswesen verwendet und umfasst sämtliche für die bibliografische Beschreibung nötigen normierten Begriffe (Normdatensätze), auch jene für die verbale inhaltliche Erschließung.
Verbale Inhaltserschließung
Diese Begriffe, die den Inhalt eines Mediums als Ganzes oder wesentliche thematische Aspekte beschreiben, nennt man
Schlagworte. Sie werden im bibliografischen Datensatz des Mediums erfasst. Dies ist mindestens ein Schlagwort, es können aber auch mehrere Schlagworte sein, die miteinander eine oder mehrere Schlagwortfolge(n) bilden. Es gibt unterschiedliche Arten von Schlagworten: Personen- und Familienschlagworte, Körperschafts- und Kongressschlagworte, Geografika, Werktitel, Sachschlagworte, Zeitschlagworte und und Formangaben zur Genre, Präsentationsform und Zielgruppe eines Mediums.
Die Vergabe der Schlagwörter erfolgt nach einfachen Regeln, den
Regeln für die Schlagwortkatalogisierung (RSWK), die etwa eine bestimmte Reihenfolge (Syntax) der Schlagworttypen innerhalb einer Folge vorsehen. Formangabe und die Zielgruppe werden in eigenen Kategorien erfasst und sind kein Teil der Schlagwortfolge. Als Faustregel hilft vielleicht die Vorstellung aus dem Fremdsprachenunterricht vom sinnerfassenden Lesen: bilde zwei bis drei Sätze zum Inhalt des Mediums, extrahiere die Substantive und bilde eine Schlagwortfolge…
Die Tradition, Schlagwortfolgen zu bilden, ist jedoch nicht in allen deutschsprachigen Verbünden normative Praxis – es werden auch Einzelschlagwörter aus der GND vergeben und verknüpft. Diese bilden zumindest für die unterschiedlichen Discovery Systeme einen Anker für die thematische Suche. Schlagwortfolgen sind hingegen auch für die LeserInnen auf einen Blick leichter zu erfassen.
Die Erfassung neuer Schlagwörter in der GND folgt - je nach Schlagwortyp - nach RDA oder RWSK. Zum Nachweis, dass ein Begriff in der Fachwelt wissenschaftlich akzeptiert ist und dem neuesten Wissensstand entspricht, gibt die Liste der Nachschlagewerke (NSW) eine Reihenfolge sämtlicher für die einzelnen Fachgebiete zu konsultierenden Nachschlagewerke vor, die für die Definition bzw. den wissenschaftlichen Nachweis eines neuen Begriffes relevant sind. Selbstverständlich sind auch Internetquellen zulässig.
Grundsätzlich wird das engste Schlagwort, also das am präzisesten zutreffende vergeben; es können mehrere Schlagwortfolgen vergeben werden, wenn eine Folge nicht ausreicht, um die unterschiedlichen Aspekte eines Werkes abzubilden. Je nach vergebenen Schlagworten ergibt sich auch die sogenannte Indexierungstiefe, also die Granularität der inhaltlichen verbalen Erschließung – mit welchen Begriffen wird der Sucheinstieg gelingen…?! Hilfreich ist dabei immer die Überlegung, sich in die Position der Leserin zu versetzen – wie würde ich suchen… - als Expertin, als Laie…? Die Genauigkeit bzw. das Ausmaß an inhaltlicher Erschließung ist natürlich immer eine Zeitfrage – dennoch hängt davon die Qualität des Suchergebnisses ab. Es mögen viele Treffer kommen (der Recall ist also gut) – stimmt das Ergebnis aber auch mit dem tatsächlich Gesuchten und Erwarteten überein (das ist die Precision)? Zwischen diesen Parametern bewegt sich also die adäquate Schlagwortvergabe…
Klassifikatorische Inhaltserschließung
Alternativ zur verbalen inhaltlichen Erschließung durch Schlagworte besteht die Möglichkeit, einzelne thematische Bereiche mehr oder weniger umfassend mit Hilfe von
Klassifikationssystematiken – also durch Einteilung in Klassen – in Form von Notationen inhaltlich zu kennzeichnen – die
klassifikatorische inhaltliche Erschließung. Notationen sind Codes, die aus Zahlen und/oder Buchstaben bestehen können und die auch eine verbale Benennung haben.
Es gibt unterschiedliche Systeme – im Österreichischen Bibliothekenverbund werden die
BK (Basisklassifikation), die
RVK (Regensburger Verbundklassifikation), die
DDC (Dewey Dezimalklassifikation), die
MSC (Mathematics Subject Classification) und die
NLM (National Library of Medicine Classification) verwendet. Je nach Verwendungszweck werden gröbere oder feiner strukturierte Klassifikationssystematiken verwendet. Wenn z.B. die Notation Teil einer zu vergebenden Signatur sein soll und die Medien als Freihandbestand systematisch aufgestellt werden, empfiehlt sich eine feine Systematik wie z. B. die RVK, die im deutschsprachigen Raum seit über 50 Jahren die am weitesten verbreitete Klassifikation in wissenschaftlichen Bibliotheken darstellt. Im angloamerikanischen Raum kommt der DDC diese Bedeutung zu – sie ist auch die älteste Klassifikation und findet mittlerweile ebenfalls im deutschsprachigen Raum partielle Anwendung.
Zur großflächigeren virtuellen Diversifizierung von Fachgebieten eignen sich hingegen gröbere Systematiken, wie z.B. die BK, die thematische Teilbestände gut isoliert epräsentieren und durchsuchbar machen kann.
Automatische und halbautomatische Inhaltserschließung
Gegenwärtig befindet sich die Inhaltliche Erschließung in einer Umbruchsphase. Die konventionellen intellektuell-manuellen Verfahren finden Grenzen in ihrer Anwendbarkeit auf umfangreiche Medienpakete elektronischer Medien (E-books, E-journals,…). Die maschinellen
Verfahren automatischer Inhaltserschließung (Vergabe von Notationen, Schlagworten) sind allerdings qualitativ noch nicht so weit, dass jegliche intellektuelle Arbeit inhaltlicher Erschließung obsolet wäre. Eine Kombination von beiden (Methodenmix) ist das Mittel der Wahl – es werden an mehreren Institutionen unterschiedliche Methoden zur automatischen Indexierung erforscht und angewendet (Deutsche Nationalbibliothek Ema – Erschließungsmaschine, ZBW – Leibniz Informationszentrum Wirtschaft – annif u. a. m.). Im OBV findet der
Digitale Assistent (DA-3) Anwendung – eine halbautomatische One-Stop-Solution, die mehrere Tools in sich vereinigt, um einerseits Inhaltserschließungsdaten verbundübergreifend zu harvesten und andererseits – wo es keine Fremddaten zu nutzen gibt – auf einfache Weise den Zugriff auf Normdaten zu ermöglichen und sie in die Metadaten zu implementieren.
(Text: Christoph Steiner)