Terminologie aufbauen mit Plan – und einer Prise KI

Wie ein KI-gestützter Prozess die Terminologie erweitert - eine blc Success Story

Ausgangssituation

Eine Termbank mit Potenzial

Viele Unternehmen kennen diese Situation: Die Terminologie-Datenbank ist vorhanden, aber noch überschaubar. Sie enthält vielleicht ein paar zentrale Begriffe – oft ohne Kontext, ohne klare Definition, ohne Metadaten. So war es auch bei unserem Kunden: Ein mittelständisches Schweizer Unternehmen mit internationaler Ausrichtung, ambitionierten Zielen und einem klaren Vorhaben.

Ziel war es, die eigene Terminologiearbeit zukunftssicher zu gestalten. Konkret: Ein KI-gestützter Terminologie-Prozess sollte aufgebaut und im Kleinen erprobt werden – als Prototyp für eine spätere großflächige Anwendung im Unternehmen. 

Der Startpunkt: Eine schmale Termbasis ohne strukturierte Definitionen, ohne Kontextangaben – aber mit der klaren Idee, dass sich das ändern muss. Genau dafür wurde blc ins Boot geholt.

Herangehensweise

Vom rohen Text zu terminologisch geprüften Begriffen

Termextraktion: Der erste Aufschlag

Mithilfe des blc Data Toolkits extrahierten wir neue Termkandidaten aus einer Sammlung von Fachtexten und strukturierten sie für die anschließende Prüfung. Die Termextraktion folgt bei uns einem hybriden Ansatz, d.h. einer Verbindung aus KI und Statistik. 

Der Fokus lag dabei nicht nur auf der reinen Termliste, sondern auf der Vorbereitung aller relevanten Informationen, die später für die Definitionserstellung benötigt würden, insbesondere Kontextsätze aus dem Originalmaterial.

Termvalidierung: Der Feinschliff

Bei der automatischen Termextraktion kommen, je nach Einstellung, oft sehr viele Kandidaten raus – darunter z.T. auch solche, die nicht termwürdig sind. Deshalb verwendeten wir on top nochmal unser Data Toolkit. Mithilfe eines speziell auf Termprüfung trainierten KI-Modells wurden die extrahierten Benennungen validiert. Natürlich haben wir uns aber nicht allein auf die Maschine verlassen: Bei blc durchläuft die automatisch extrahierte und vorvalidierte Terminologie immer auch eine menschliche Qualitätssicherung durch unsere Expert:innen. Diese geht durch die maschinelle Vorarbeit sehr schnell!

Außerdem durfte ein Abgleich mit der Bestandsterminologie nicht fehlen – wir wollen schließlich keine Dubletten erzeugen.

Definitionserstellung mit KI: Der eigentliche Gamechanger

Der eigentliche Clou des Projekts? Die automatisierte Generierung von Definitionen. Dazu entwickelten wir eine Pipeline, die Kontextsätze aus den Kundendokumenten als Input für eine KI-gestützte Definitionserstellung nutzte – mit LLM und einem RAG-Prozess.

So lief es konkret ab:

  • Für jede Benennung wurden relevante Kontexte aus den Originaltexten automatisch extrahiert.
  • Diese Kontexte wurden als Grundlage verwendet, um mit einem LLM fachliche Definitionen zu generieren.
  • Mithilfe von Prompt Engineering wurde sichergestellt, dass die Definitionen den formalen und fachlichen Anforderungen entsprechen.
  • Jede Definition enthielt die Angabe der zugrundeliegenden Quelle, sodass jederzeit nachvollziehbar war, worauf sich die Begriffsbestimmung stützte.

Das Resultat: Fachlich fundierte, gut formulierte Definitionen mit nachvollziehbarer Herkunft – schnell erstellt für den gesamten Batch.

Terminologiearbeit: Immer noch nötig, aber gerichtet, schnell und einfach!

Im nächsten Schritt durchlief jede generierte Definition eine terminologische Prüfung durch unsere Expert:innen. Dabei wurden formale und inhaltliche Korrektheit, Konsistenz und Relevanz geprüft. In manchen Fällen wurden Definitionen leicht überarbeitet, in anderen durch Rückmeldungen aus der Fachabteilung weiter geschärft. Und unser fachliches Fazit an dieser Stelle: Die meisten Definitionen waren schon (weitestgehend) nutzbar, nur wenige mussten angepasst werden!

Und waren einmal Definitionen da, konnten Begriffe aufbereitet werden: Synonyme und Schreibvarianten wurden zusammengefasst, Verwendungsstatus festgelegt und weitere Metadaten (z. B. Kontext, Quelle, grammatische Informationen) ergänzt. 

Import: Sorgenfrei ins Zielsystem

Alle geprüften Begriffe samt Metadaten wurden anschließend – wieder mithilfe des Data Toolkits – in das Datenmodell der Kunden-Termbank gebracht. So konnte die neue Terminologie einfach in die bestehende Termbank importiert und direkt für alle Redaktionsprozesse genutzt werden.

Das Ergebnis

Eine Termbank mit Substanz

Am Ende des Projekts stand die erfolgreiche Erweiterung der Termbank um einen ersten Batch neuer Begriffe – inklusive vollständig gepflegter Metadaten und vor allem: Hochwertiger Definitionen.

Die Vorteile für den Kunden waren vielfältig:

  • Höhere Qualität der Termbank durch verlässliche, maschinell gestützte, aber fachlich geprüfte Terminologie inklusive Definitionen.
  • Deutliche Zeitersparnis bei der KI-gestützten Extraktion, Validierung und Definitionserstellung, da in kurzer Zeit fundierte Vorschläge geliefert wurden.
  • Nachvollziehbarkeit durch Quellenangabe, was das Vertrauen in die Inhalte erhöhte.
  • Datenlieferung direkt ins System – fertig für den produktiven Einsatz.

Fazit – KI kann Terminologie (und wir auch!)

Dieses Projekt hat eindrucksvoll gezeigt: Eine KI-gestützte Pipeline für den Terminologieaufbau funktioniert – in der Praxis, unter realen Bedingungen, und mit überzeugenden Ergebnissen. Der Mix aus intelligenter Automatisierung und fachlicher Humanvalidierung macht den Unterschied und führt zu Termdaten, die im Unternehmen auch tatsächlich genutzt werden. 

Ausblick – Was kommt als Nächstes?

Das Projekt hat die Basis gelegt, nun geht’s weiter:

  • Weitere Terminologie soll extrahiert und mit Metadaten angereichert werden.
  • Auch bestehende Begriffe sollen um Definitionen und andere Metadaten ergänzt werden, um die gesamte Termbank auf ein neues Niveau zu heben.
  • Und langfristig soll der KI-gestützte Prozess skaliert werden – für kontinuierliche Terminologiepflege im großen Stil.

Wir freuen uns auf die nächsten Schritte – und darauf, Terminologieprojekte auch in Ihrem Unternehmen auf ein neues Level zu heben!

Neugierig, wie ein solcher Prozess auch in Ihrem Unternehmen aussehen könnte? Sprechen Sie uns an!

 

Related Posts