Glossar

  • Alignment

    Das Alignment ist ein Textordnungsverfahren. Hierbei werden Sätze in einem Ausgangstext den korrespondierenden Sätzen in der Übersetzung des Textes zugeordnet. Ein Alignment muss immer dann durchgeführt werden, wenn Text in einem un-segmentierten Fließtext vorliegen. Das Ergebnis wird dann in ein Translation Memory überführt oder als Basis für eine Maschinellen Übersetzungsengine verwendet. Das Alignment un-segmentierter Sprachdaten ist ein wesentlicher Vorverarbeitungsschritt für das Training maschineller Übersetzung.

  • Begriff

    Ein Begriff ist eine Wissenseinheit, die durch eine eindeutige Kombination von Merkmalen erzeugt wird (siehe auch: DIN EN ISO 18104:2014-05). In der Terminologie ist ein Begriff durch eine oder mehrere Benennungen textuell repräsentiert. Ein gutes Beispiel hierfür sind die Benennungen "Personenkraftwagen" und "Pkw", die den Begriff "Fahrzeug" repräsentieren. In einer begriffsbasierten Terminologiedatenbank legt man pro Begriff einen Eintrag an.

  • Benennung

    Eine Benennung ist ein Wort oder mehrere Wörter zur Bezeichnung eines Begriffs (DIN ISO 26162:2016-12). In einer begriffsbasierten Terminologiedatenbank werden z.B. pro Begriff bei Bedarf mehrere Benennungen hinterlegt. In der Regel sollte dabei immer eine bevorzugte Benennung angegeben werden, die einheitlich verwendet wird (z. B. "Pkw"). Wenn möglich sollten zugelassene Benennungen nur bei dringendem Bedarf ergänzt werden (z. B. "Personenkraftwagen").

  • CAT-Tool

    Unter CAT-Tool (aus dem Englischen: computer-assisted/computer-aided translation) versteht man alle computer-gestützten Hilfssysteme des Übersetzers, also Wörterbücher, Referenztexte, Translation Memories usw. Heute verwendet man CAT-Tool häufig synonym zu Translation Memory System, einem System zur Verwaltung und Wiederverwendung von Übersetzungen. Es gibt Cloud-basierte und lokale Varianten (siehe auch Translation Memory oder Translation Memory System).

  • Fehlermetriken

    Fehlermetriken messen in der Qualitätsevaluierung (QE), ob die zuvor vereinbarte Sprachqualität erreicht wurde. Es gibt verschiedene Metriken (MQM, DQF, SAEJ2450, LISA). Alle Metriken bieten Fehlerkriterien, Fehlerpunkte und Schweregrade, die im Vorfeld kalibriert werden sollten. Darüberhinaus kann man mit Fehlermetriken wie z.B. dem Dynamic Quality Framework  (DQF) von TAUS verschiedene Prüfprofile erstellen, je nach Textinhalt, Zielpublikum usw. (siehe auch Übersetzungsqualität, Qualitätsevaluierung).

  • Internationalisierung

    Internationalisierung beschäftigt sich mit der formalen Lokalisierung einer Software oder einer Webseite an die Gegebenheiten und Vorgaben der Zielkultur/des Ziellandes. Hier geht es vorrangig darum, Zahlen, Daten, Formate, Einheiten, Kalender zielkulturgerecht aufzubereiten und darzustellen.

  • Kompositum

    Ein Kompositum ist ein zusammengesetztes Wort, meistens bestehend aus zwei oder mehr Substantiven. Die häufigste Gruppe ist im Deutschen das Determinativkompositum (Beispiel Erdball, Erdapfel, Erdumrundung). Neben den reinen Substantiv-Verbindungen gibt es auch Adjektiv-Verbindungen (Bsp. schwarz-weiß), und Substantiv-Adjektiv-Komposita (Bsp. Schöngeist). Die Bestimmungen zur Kompositabildung von Fachwörtern sind in Termbildungsleitfäden festzulegen.

  • Korpus

    Ein Korpus ist eine digitalisierte Sammlung von Textdaten, die zur computergestützten Verarbeitung natürlicher Sprache herangezogen werden. Zum Beispiel in der Maschinellen Übersetzung werden alignierte, zweisprachige Parallelkorpora als Basis für statistische Analysen und für das MT-Engine-Training verwendet.

  • Lokalisierung

    Bei der Lokalisierung passt ein Bearbeiter einen Text und dessen Bestandteile an Sprache und Kulturspezifika eines Ziellands an. Diese Anpassung erfolgt häufig im Rahmen einer Übersetzung. Das Ergebnis der Lokalisierung ist ein Produkt (wie z.B. Text, Software, Webseite), das auf den Zielmarkt und die Zielkultur zugeschnitten ist. Der Begriff der Lokalisierung wird synonym zum Begriff der Übersetzung verwendet, das ist aber nicht korrekt.

  • MÜ-Engine

    Eine MÜ-Engine (MÜ=Maschinelle Übersetzung, auch: MT-Engine) ist ein systemgebundenes Modell zur automatischen unidirektionalen Übersetzung einer Sprache in eine weitere Sprache. Die Verfahren sind entweder regelbasiert (RBMÜ), statistisch (SMÜ) oder neuronal (NMÜ). Um statistische und neuronale MÜ-Engines zu trainieren, sind große Mengen bilingualer Korpora in sehr guter sprachlicher Qualität erforderlich.
    Wenn man von MÜ spricht ist zurzeit in der Regel die NMÜ gemeint. RBMÜ und SMÜ sind nur noch in speziellen Anwendungsfällen im Einsatz.

  • Named Entity Recognition

    Named Entity Recognition (NER) bezeichnet Methoden zur Erkennung von Spracheinheiten in der natürlichen Sprachverarbeitung. Mit Methoden der NER werden Angaben wie Namen, Orte und Produkte in Text-Korpora erkannt und gekennzeichnet. Durch neuste Entwicklungen im Bereich der Künstlichen Intelligenz (KI) werden NER-Routinen zunehmend exakter (siehe auch Natural Language Processing).

  • Natural Language Processing

    Natural Language Processing (NLP) ist die computergestützte Verarbeitung natürlicher Sprache. Beispielsweise die Datenbereinigung für digitale Sprachverarbeitung oder maschinelle Übersetzung mittels Segmentierung, Tokenisierung, Textstatistik, Anonymisierung und Erkennung von Entitäten (NER). NLP ist ein wichtiger Kernbereich der Computerlinguistik und wird mit steigender Automatisierung und Digitalisierung im Sprachumfeld immer wichtiger.

  • Neuronale Maschinelle Übersetzung

    Die Neuronale Maschinelle Übersetzung (auch NMÜ, NMT) ist eine Methode der maschinellen Übersetzung, die mit rekurrenten neuronalen Netzen (RNN) durchgeführt wird. Hierbei verschlüsselt ein Kodierer Sequenzen von Wörtern im Ausgangstext in Vektoren. Anschließend entschlüsselt ein Dekodierer diese Vektoren und dekodiert Wort für Wort den Zieltext. Durch stärkere Berücksichtigung des Gesamtkontexts der Wörter werden grammatikalisch und stilistisch wohlgeformte Übersetzungen generiert, die nicht immer inhaltlich korrekt sind.

  • NMT

    Das Akronym NMT steht für neural machine translation (auch NMÜ) und ist eine Methode der maschinellen Übersetzung, die mit rekurrenten neuronalen Netzen (RNN) durchgeführt wird. Hierbei verschlüsselt ein Kodierer Sequenzen von Wörtern im Ausgangstext in Vektoren. Anschließend entschlüsselt ein Dekodierer diese Vektoren und dekodiert Wort für Wort den Zieltext. Durch stärkere Berücksichtigung des Gesamtkontexts der Wörter werden grammatikalisch und stilistisch wohlgeformte Übersetzungen generiert, die nicht immer inhaltlich korrekt sind.

  • NMÜ

    Das Akronym NMÜ steht für neuronale maschinelle Übersetzung (auch NMT) und ist eine Methode der maschinellen Übersetzung, die mit rekurrenten neuronalen Netzen (RNN) durchgeführt wird. Hierbei verschlüsselt ein Kodierer Sequenzen von Wörtern im Ausgangstext in Vektoren. Anschließend entschlüsselt ein Dekodierer diese Vektoren und dekodiert Wort für Wort den Zieltext. Durch stärkere Berücksichtigung des Gesamtkontexts der Wörter werden grammatikalisch und stilistisch wohlgeformte Übersetzungen generiert, die nicht immer inhaltlich korrekt sind.

  • Ontologie

    Eine Ontologie ist eine anerkannte, formale Modellierung von Wissen über eine Domäne (siehe auch unter DIN EN 62656-5 und VDE 0040-8-5:2018-05). Sie wird in Form von Ontologiesprachen repräsentiert, die Klassen, Objekte, Relationen und Attribute abbilden. Die Quintessenz einer Ontologie ist, die hierarchischen und nicht-hierarchischen Beziehungen (Relationen) für Folgeprozesse durch Maschinen verwertbar zu machen (z.B. semantische Suchen).

  • Posteditieren

    Das Posteditieren (Englisch: Post-Editing, PE) ist die Tätigkeit, eine maschinell erstellte Übersetzung zu editieren und korrigieren (ISO-Norm PE 18587). Hierbei unterscheidet man zwischen leichtem (light) und vollständigem (full) Posteditieren. Das leichte Posteditieren hat zum Ziel, einen verständlichen Text zu erhalten. Das vollständige Posteditieren hat das Ziel, ein Produkt zu erhalten, das mit dem Ergebnis einer Humanübersetzung vergleichbar ist. Menschen, die diese Tätigkeit durchführen, sind Posteditoren.

    Mehr Info:

    [...]

    Unter Post-Editing versteht man – vereinfacht gesagt – das Nachbessern maschineller Übersetzungsergebnisse. Es ist der Prozess, bei dem eine maschinell erstellte Übersetzung durch einen Menschen geprüft und angepasst wird, sodass sie eine akzeptable Qualität erreicht. Hierbei unterscheidet man zwischen leichtem und vollem Post-Editing. Je nach Qualitätsanforderungen und Textsorte entscheidet man sich für ein leichtes Post-Editing, bei dem nur das allernötigste korrigiert wird, oder für ein volles Post-Editing, nach dem man unter Umständen nicht mehr unterscheiden kann, ob die Übersetzung durch einen Menschen oder eine Maschine erstellt wurde.

    Was macht einen Post-Editor aus?

    Viele Fähigkeiten und Eigenschaften, die bei einem Übersetzer Voraussetzung oder üblich sind, finden sich auch bei Post-Editoren wieder. Doch was unterscheidet nun einen Post-Editor von einem Übersetzer? Im Idealfall verfügt der Post-Editor über Kenntnisse im Bereich maschineller Übersetzung und versteht ihre Funktionsweise.

    Schnelle Entscheidungen treffen

    Außerdem sollte ein Post-Editor auch stets die Wirtschaftlichkeit seiner Tätigkeit im Blick behalten. Vor allem wenn es bei einem Post-Editing-Auftrag nicht um lupenreine, sondern „nur“ um verständliche Texte geht, muss der Bearbeiter Abstriche bei der Qualität machen, seinen Perfektionismus beiseitelegen und schnelle Entscheidungen darüber treffen, was korrigiert werden muss und was nicht.

    Dieser Bereich wird meist gemeinsam mit dem Kunden definiert, was bedeutet, dass man als Post-Editor ggf. die eigenen „Wünsche“ oder „Impulse“ etwas zu korrigieren, ignorieren muss. Ein hoher Grad an Professionalismus ist hier mehr gefragt, als Perfektionismus. [...]

    Hier weiterlesen

  • Qualitätsevaluierung

    Mit einer Qualitätsevaluierung (QE) wird die Erreichung einer zuvor definierten Übersetzungsqualität beurteilt. Hierbei stellt man fest, ob Texte und Übersetzungen diese Qualitätsziele erreichen. Hierbei werden diverse Fehlermetriken eingesetzt. In der maschinellen Übersetzung sind Qualitätsevaluierungen durch Menschen (auch: Humanevaluation) zusätzlich zu statistischen Evaluationen mittels BLEU oder TER maßgeblich für die Verbesserung von MÜ-Engines.

  • Qualitätsmessung

    Eine Qualitätsmessung (QM) ist eine Maßnahme zur laufenden Erhebung der Sprachqualität. Das ist vor allem beim Einsatz Maschineller Übersetzung sehr wichtig. Hier wird mit Produktivitätsmessverfahren (z.B. time-to-edit, siehe auch TAUS, DQF) die Geschwindigkeiten des Posteditierens gemessen. So weiß man, wann man Engines neu trainieren oder austauschen sollte. Idealerweise laufen Qualitätsmessungen automatisch bei der Übersetzung und dem Post-Editing-Prozess mit (siehe auch Post-Editing, Übersetzungsqualität).

  • Qualitätssicherungstools

    Qualitätssicherungstools sichern die Sprachqualität bei Texterstellung (z.B. Congree), Übersetzung (z.B. QA Distiller) und der Pflege der Sprachressourcen, wie Terminologie (z.B. quickTerm). Hierdurch werden Fehler vor der Veröffentlichung von Texten oder der Verwendung von Ressourcen aufgefunden und korrigiert. Der konkrete Einsatz der unterschiedlichen Tools hängt stark vom individuellen Sprachproduktionsprozess ab (siehe auch Sprachqualitätssicherung, Übersetzungsqualität).