Terminologiebereinigung – Ein Einblick in die Praxis

In der letzten Woche hat meine Kollegin Rebecca Gasper bereits erläutert, warum die Bereinigung von Terminologie so eine hohe Relevanz für den praktischen Einsatz von Terminologiedatenbanken hat. Im heutigen Blog möchte ich ein wenig über den technischen Hintergrund und gängige Herangehensweisen aus dem Alltag der Terminologiebereinigungen berichten.

Kleines 1×1 der Terminologiedatenbanken

Terminologiedatenbanken helfen Unternehmen dabei, einheitliche Regeln für zu verwendende Terminologie festzulegen und die Einhaltung dieser mithilfe technischer Tools zu sichern. Sie sind in der Regel hierarchisch aufgebaut:

     

      • Die Eintragsebene ist das übergeordnete semantische Konzept zur Sammlung von zusammengehörigen Benennungen.

      • Die Sprachebene gruppiert die Benennungen innerhalb eines Konzeptes nach Sprache.

      • Die Benennungsebene umfasst die Benennungen zu einem Eintrag in einer Sprache (etwa Vorzugsbenennung, verbotene Benennungen, Synonyme, …).

    Terminologie in Datenbankstrukturen

    Terminologiedatenbankschemata legen die konkrete Zusammenstellung der erlaubten Beschreibungsfelder und Metadaten auf jeder dieser Ebenen fest. Unternehmen legen in der Regel zusätzlich genau fest, nach welchem Regelkatalog die Terminologie inhaltlich in die nach diesem Schema definierte Datenbank einzutragen ist, da sich komplexere Anforderungen nicht immer vollständig im Schema abbilden lassen.

    Warum müssen Terminologiedatenbanken bereinigt werden?

    Terminologie verändert sich über Zeit, sodass Nutzer die Terminologiedatenbanken anpassen. Das können etwa Änderungen an Benennungen und ihren Übersetzungen, Beschreibungsfeldern wie dem Verwendungsstatus oder auch am Schema bzw. dem internen Regelkatalog sein.

    Kommt es zu vielen solcher Änderungen, mehrt sich auch das Potential für Fehler über die Zeit:

       

        • Existierende Regeln werden nicht immer richtig verstanden oder eingehalten.

        • Es stellen sich unschöne Konventionen oder Workarounds ein, z.B. die missbräuchliche Verwendung von Beschreibungsfeldern für interne Prozesse.

        • Es werden neue Benennungen als neuer Eintrag eingefügt, obwohl ein alter Eintrag mit einem dann ggf. veränderten Verwendungsstatus bereits in der Datenbank ist.

        • Nicht mehr relevante oder aus sonstigen Gründen nicht mehr gewünschte Einträge werden nicht immer gelöscht.

        • Festgelegte Vorgehensweisen ändern sich, aber es verbleiben Datenbestände, die noch nach alten Konventionen erstellt wurden.

      Die Größe von Terminologiedatenbanken, die in Summe aller Sprachen durchaus in die Hundertausenden von Benennungen gehen kann, wobei jede dieser Benennungen auch noch unzählige Beschreibungsfelder haben kann, machen Datenbanken schwerfällig und sehr schwierig zu überblicken. Häufig ist ein Großteil der genannten problematischen Muster sehr repetitiv, erfordert aufgrund der Größe der Datenbank jedoch zur Behebung in der Standard-Programmoberfläche einen enormen manuellen Aufwand. Dieser ist für die Terminologen häufig kaum noch realistisch leistbar.

      Wie bereinigt man eine Terminologiedatenbank?

      Um dem Ausmaß solcher historisch gewachsener Probleme Herr zu werden, kann eine automatisierte oder semi-automatisierte Bereinigung der Terminologiedatenbank Abhilfe schaffen.

      Diese Bereinigungen lassen sich im Wesentlichen in zwei Arten unterscheiden:

      Inhaltliche Terminologiebereinigung

      Bei der inhaltlichen Terminologiebereinigung wird eine existierende Terminologiedatenbank zunächst automatisch auf potenziell problematische Muster untersucht und anschließend manuell bereinigt. Solche problematischen Muster können z.B. unerwünschte Zeichen, grammatikalische Formen, Abkürzungen oder zusammengehörige, aber nicht als Eintragsgruppe markierte Benennungen sein.

      Sie erlaubt Terminologen Fokus und Vorfilterung explizit auf die relevanten Teile der Terminologiedatenbank. Dadurch ist es einfacher, bei ähnlichen Problemmustern immer gleich vorzugehen. Zudem kann ein Zwischenformat genutzt werden, das sich besser für die sequenzielle Abarbeitung der Probleme eignet als das Ursprungs- und Zielformat. Durch diese Vorteile reduziert sie erheblich den Zeitaufwand für die manuelle Terminologiebereinigung im Vergleich zur Bereinigung ohne vorherige Problemanalyse.

      Existieren unabhängig von der Terminologiedatenbank größere Mengen an unternehmensspezifischem Fließtext (wie etwa in großen Translation Memories oder Website-Texten), lassen sich zudem die „realen“ Verwendungshäufigkeiten der Terminologie in der Terminologiedatenbank statistisch berechnen. Alternativ lässt sich im Rahmen einer Terminologie-Extraktion solche Unternehmensterminologie ermitteln, die in der tatsächlichen Verwendung häufig ist, aber nicht in der Terminologiedatenbank enthalten ist.

      Die automatische Analyse von problematischen Mustern und der Terminologieverwendung lässt sich aber auch unabhängig von einer anschließenden Bereinigung durchführen. Das kann sinnvoll sein, um etwa eine umfassende IST-Analyse der Qualität der Bestandsterminologie vorzunehmen.

      Strukturelle Terminologiebereinigung

      Bei der strukturellen Terminologiedatenbank-Bereinigung wird die Terminologiedatenbank direkt im Ursprungsformat vollautomatisch modifiziert. Eine vollautomatische Umsetzung von Änderungen aller Art ist immer dann möglich, wenn diese nach einem klaren regelbasierten Muster definiert ist. Solche klaren Muster können z.B. sein:

         

          • Umbenennung von Beschreibungsfeldern oder Sprachbezeichnungen

          • Bedingungsloses oder bedingtes Löschen bestimmter Beschreibungsfelder

          • Abbildungsregelbasiertes Ändern von Inhalten

          • Verschieben von Feldern zwischen Metadaten-Detailebenen

          • Regelbasiertes Erstellen von Feldern mit normierten Inhalten

          • Pauschales oder regelbasiertes Pseudonymisieren von Feldern mit GDPR-relevanten Inhalten

          • Verschmelzen oder Zerteilen von Terminologiedatenbanken

        Überblick Terminologiebereinigung

        Je nach Anforderungen können die inhaltliche oder die strukturelle Terminologiedatenbank-Bereinigung unabhängig voneinander oder beide zur Anwendung kommen. Für die besten Ergebnisse sollte immer die Ausgangssituation des Terminologie-Managements im Unternehmen analysiert werden und die Lösung individuell auf die Anforderungen des Unternehmens zugeschnitten sein.

        Fazit

        Terminologiedatenbanken sind mächtige Werkzeuge für die Dokumentation und Anwendung von Unternehmensterminologie. Um sicherzustellen, dass der Nutzen dieser Werkzeuge erhalten bleibt, auch wenn sich einmal Probleme über die Zeit angesammelt haben, können Terminologiebereinigungen Abhilfe Leisten.

        Schreiben Sie uns gerne an, wenn Sie mehr über das Thema wissen möchten oder sich fragen, wie Terminologiebereinigungen oder Terminologiemanagement in Ihrem Unternehmen zum Einsatz kommen können.

        Image: Photo by Joshua Hoehne on Unsplash

        Tags:

        Related Posts