Glossar

  • Alignment

    Das Alignment ist ein Textordnungsverfahren. Hierbei werden SĂ€tze in einem Ausgangstext den korrespondierenden SĂ€tzen in der Übersetzung des Textes zugeordnet. Ein Alignment muss immer dann durchgefĂŒhrt werden, wenn Text in einem un-segmentierten Fließtext vorliegen. Das Ergebnis wird dann in ein Translation Memory ĂŒberfĂŒhrt oder als Basis fĂŒr eine Maschinellen Übersetzungsengine verwendet. Das Alignment un-segmentierter Sprachdaten ist ein wesentlicher Vorverarbeitungsschritt fĂŒr das Training maschineller Übersetzung.

  • Begriff

    Ein Begriff ist eine Wissenseinheit, die durch eine eindeutige Kombination von Merkmalen erzeugt wird (siehe auch: DIN EN ISO 18104:2014-05). In der Terminologie ist ein Begriff durch eine oder mehrere Benennungen textuell reprĂ€sentiert. Ein gutes Beispiel hierfĂŒr sind die Benennungen "Personenkraftwagen" und "Pkw", die den Begriff "Fahrzeug" reprĂ€sentieren. In einer begriffsbasierten Terminologiedatenbank legt man pro Begriff einen Eintrag an.

  • Benennung

    Eine Benennung ist ein Wort oder mehrere Wörter zur Bezeichnung eines Begriffs (DIN ISO 26162:2016-12). In einer begriffsbasierten Terminologiedatenbank werden z.B. pro Begriff bei Bedarf mehrere Benennungen hinterlegt. In der Regel sollte dabei immer eine bevorzugte Benennung angegeben werden, die einheitlich verwendet wird (z. B. "Pkw"). Wenn möglich sollten zugelassene Benennungen nur bei dringendem Bedarf ergÀnzt werden (z. B. "Personenkraftwagen").

  • CAT-Tool

    Unter CAT-Tool (aus dem Englischen: computer-assisted/computer-aided translation) versteht man alle computer-gestĂŒtzten Hilfssysteme des Übersetzers, also WörterbĂŒcher, Referenztexte, Translation Memories usw. Heute verwendet man CAT-Tool hĂ€ufig synonym zu Translation Memory System, einem System zur Verwaltung und Wiederverwendung von Übersetzungen. Es gibt Cloud-basierte und lokale Varianten (siehe auch Translation Memory oder Translation Memory System).

  • Fehlermetriken

    Fehlermetriken messen in der QualitĂ€tsevaluierung (QE), ob die zuvor vereinbarte SprachqualitĂ€t erreicht wurde. Es gibt verschiedene Metriken (MQM, DQF, SAEJ2450, LISA). Alle Metriken bieten Fehlerkriterien, Fehlerpunkte und Schweregrade, die im Vorfeld kalibriert werden sollten. DarĂŒberhinaus kann man mit Fehlermetriken wie z.B. dem Dynamic Quality Framework  (DQF) von TAUS verschiedene PrĂŒfprofile erstellen, je nach Textinhalt, Zielpublikum usw. (siehe auch ÜbersetzungsqualitĂ€t, QualitĂ€tsevaluierung).

  • Internationalisierung

    Internationalisierung beschÀftigt sich mit der formalen Lokalisierung einer Software oder einer Webseite an die Gegebenheiten und Vorgaben der Zielkultur/des Ziellandes. Hier geht es vorrangig darum, Zahlen, Daten, Formate, Einheiten, Kalender zielkulturgerecht aufzubereiten und darzustellen.

  • Kompositum

    Ein Kompositum ist ein zusammengesetztes Wort, meistens bestehend aus zwei oder mehr Substantiven. Die hĂ€ufigste Gruppe ist im Deutschen das Determinativkompositum (Beispiel Erdball, Erdapfel, Erdumrundung). Neben den reinen Substantiv-Verbindungen gibt es auch Adjektiv-Verbindungen (Bsp. schwarz-weiß), und Substantiv-Adjektiv-Komposita (Bsp. Schöngeist). Die Bestimmungen zur Kompositabildung von Fachwörtern sind in TermbildungsleitfĂ€den festzulegen.

  • Korpus

    Ein Korpus ist eine digitalisierte Sammlung von Textdaten, die zur computergestĂŒtzten Verarbeitung natĂŒrlicher Sprache herangezogen werden. Zum Beispiel in der Maschinellen Übersetzung werden alignierte, zweisprachige Parallelkorpora als Basis fĂŒr statistische Analysen und fĂŒr das MT-Engine-Training verwendet.

  • Lokalisierung

    Bei der Lokalisierung passt ein Bearbeiter einen Text und dessen Bestandteile an Sprache und Kulturspezifika eines Ziellands an. Diese Anpassung erfolgt hĂ€ufig im Rahmen einer Übersetzung. Das Ergebnis der Lokalisierung ist ein Produkt (wie z.B. Text, Software, Webseite), das auf den Zielmarkt und die Zielkultur zugeschnitten ist. Der Begriff der Lokalisierung wird synonym zum Begriff der Übersetzung verwendet, das ist aber nicht korrekt.

  • MÜ-Engine

    Eine MÜ-Engine (MÜ=Maschinelle Übersetzung, auch: MT-Engine) ist ein systemgebundenes Modell zur automatischen unidirektionalen Übersetzung einer Sprache in eine weitere Sprache. Die Verfahren sind entweder regelbasiert (RBMÜ), statistisch (SMÜ) oder neuronal (NMÜ). Um statistische und neuronale MÜ-Engines zu trainieren, sind große Mengen bilingualer Korpora in sehr guter sprachlicher QualitĂ€t erforderlich.
    Wenn man von MÜ spricht ist zurzeit in der Regel die NMÜ gemeint. RBMÜ und SMÜ sind nur noch in speziellen AnwendungsfĂ€llen im Einsatz.

  • Named Entity Recognition

    Named Entity Recognition (NER) bezeichnet Methoden zur Erkennung von Spracheinheiten in der natĂŒrlichen Sprachverarbeitung. Mit Methoden der NER werden Angaben wie Namen, Orte und Produkte in Text-Korpora erkannt und gekennzeichnet. Durch neuste Entwicklungen im Bereich der KĂŒnstlichen Intelligenz (KI) werden NER-Routinen zunehmend exakter (siehe auch Natural Language Processing).

  • Natural Language Processing

    Natural Language Processing (NLP) ist die computergestĂŒtzte Verarbeitung natĂŒrlicher Sprache. Beispielsweise die Datenbereinigung fĂŒr digitale Sprachverarbeitung oder maschinelle Übersetzung mittels Segmentierung, Tokenisierung, Textstatistik, Anonymisierung und Erkennung von EntitĂ€ten (NER). NLP ist ein wichtiger Kernbereich der Computerlinguistik und wird mit steigender Automatisierung und Digitalisierung im Sprachumfeld immer wichtiger.

  • Neuronale Maschinelle Übersetzung

    Die Neuronale Maschinelle Übersetzung (auch NMÜ, NMT) ist eine Methode der maschinellen Übersetzung, die mit rekurrenten neuronalen Netzen (RNN) durchgefĂŒhrt wird. Hierbei verschlĂŒsselt ein Kodierer Sequenzen von Wörtern im Ausgangstext in Vektoren. Anschließend entschlĂŒsselt ein Dekodierer diese Vektoren und dekodiert Wort fĂŒr Wort den Zieltext. Durch stĂ€rkere BerĂŒcksichtigung des Gesamtkontexts der Wörter werden grammatikalisch und stilistisch wohlgeformte Übersetzungen generiert, die nicht immer inhaltlich korrekt sind.

  • NMT

    Das Akronym NMT steht fĂŒr neural machine translation (auch NMÜ) und ist eine Methode der maschinellen Übersetzung, die mit rekurrenten neuronalen Netzen (RNN) durchgefĂŒhrt wird. Hierbei verschlĂŒsselt ein Kodierer Sequenzen von Wörtern im Ausgangstext in Vektoren. Anschließend entschlĂŒsselt ein Dekodierer diese Vektoren und dekodiert Wort fĂŒr Wort den Zieltext. Durch stĂ€rkere BerĂŒcksichtigung des Gesamtkontexts der Wörter werden grammatikalisch und stilistisch wohlgeformte Übersetzungen generiert, die nicht immer inhaltlich korrekt sind.

  • NMÜ

    Das Akronym NMÜ steht fĂŒr neuronale maschinelle Übersetzung (auch NMT) und ist eine Methode der maschinellen Übersetzung, die mit rekurrenten neuronalen Netzen (RNN) durchgefĂŒhrt wird. Hierbei verschlĂŒsselt ein Kodierer Sequenzen von Wörtern im Ausgangstext in Vektoren. Anschließend entschlĂŒsselt ein Dekodierer diese Vektoren und dekodiert Wort fĂŒr Wort den Zieltext. Durch stĂ€rkere BerĂŒcksichtigung des Gesamtkontexts der Wörter werden grammatikalisch und stilistisch wohlgeformte Übersetzungen generiert, die nicht immer inhaltlich korrekt sind.

  • Ontologie

    Eine Ontologie ist eine anerkannte, formale Modellierung von Wissen ĂŒber eine DomĂ€ne (siehe auch unter DIN EN 62656-5 und VDE 0040-8-5:2018-05). Sie wird in Form von Ontologiesprachen reprĂ€sentiert, die Klassen, Objekte, Relationen und Attribute abbilden. Die Quintessenz einer Ontologie ist, die hierarchischen und nicht-hierarchischen Beziehungen (Relationen) fĂŒr Folgeprozesse durch Maschinen verwertbar zu machen (z.B. semantische Suchen).

  • Posteditieren

    Das Posteditieren (Englisch: Post-Editing, PE) ist die TĂ€tigkeit, eine maschinell erstellte Übersetzung zu editieren und korrigieren (ISO-Norm PE 18587). Hierbei unterscheidet man zwischen leichtem (light) und vollstĂ€ndigem (full) Posteditieren. Das leichte Posteditieren hat zum Ziel, einen verstĂ€ndlichen Text zu erhalten. Das vollstĂ€ndige Posteditieren hat das Ziel, ein Produkt zu erhalten, das mit dem Ergebnis einer HumanĂŒbersetzung vergleichbar ist. Menschen, die diese TĂ€tigkeit durchfĂŒhren, sind Posteditoren.

    Mehr Info:

    [...]

    Unter Post-Editing versteht man – vereinfacht gesagt – das Nachbessern maschineller Übersetzungsergebnisse. Es ist der Prozess, bei dem eine maschinell erstellte Übersetzung durch einen Menschen geprĂŒft und angepasst wird, sodass sie eine akzeptable QualitĂ€t erreicht. Hierbei unterscheidet man zwischen leichtem und vollem Post-Editing. Je nach QualitĂ€tsanforderungen und Textsorte entscheidet man sich fĂŒr ein leichtes Post-Editing, bei dem nur das allernötigste korrigiert wird, oder fĂŒr ein volles Post-Editing, nach dem man unter UmstĂ€nden nicht mehr unterscheiden kann, ob die Übersetzung durch einen Menschen oder eine Maschine erstellt wurde.

    Was macht einen Post-Editor aus?

    Viele FĂ€higkeiten und Eigenschaften, die bei einem Übersetzer Voraussetzung oder ĂŒblich sind, finden sich auch bei Post-Editoren wieder. Doch was unterscheidet nun einen Post-Editor von einem Übersetzer? Im Idealfall verfĂŒgt der Post-Editor ĂŒber Kenntnisse im Bereich maschineller Übersetzung und versteht ihre Funktionsweise.

    Schnelle Entscheidungen treffen

    Außerdem sollte ein Post-Editor auch stets die Wirtschaftlichkeit seiner TĂ€tigkeit im Blick behalten. Vor allem wenn es bei einem Post-Editing-Auftrag nicht um lupenreine, sondern „nur“ um verstĂ€ndliche Texte geht, muss der Bearbeiter Abstriche bei der QualitĂ€t machen, seinen Perfektionismus beiseitelegen und schnelle Entscheidungen darĂŒber treffen, was korrigiert werden muss und was nicht.

    Dieser Bereich wird meist gemeinsam mit dem Kunden definiert, was bedeutet, dass man als Post-Editor ggf. die eigenen „WĂŒnsche“ oder „Impulse“ etwas zu korrigieren, ignorieren muss. Ein hoher Grad an Professionalismus ist hier mehr gefragt, als Perfektionismus. [...]

    Hier weiterlesen

  • QualitĂ€tsevaluierung

    Mit einer QualitĂ€tsevaluierung (QE) wird die Erreichung einer zuvor definierten ÜbersetzungsqualitĂ€t beurteilt. Hierbei stellt man fest, ob Texte und Übersetzungen diese QualitĂ€tsziele erreichen. Hierbei werden diverse Fehlermetriken eingesetzt. In der maschinellen Übersetzung sind QualitĂ€tsevaluierungen durch Menschen (auch: Humanevaluation) zusĂ€tzlich zu statistischen Evaluationen mittels BLEU oder TER maßgeblich fĂŒr die Verbesserung von MÜ-Engines.

  • QualitĂ€tsmessung

    Eine QualitĂ€tsmessung (QM) ist eine Maßnahme zur laufenden Erhebung der SprachqualitĂ€t. Das ist vor allem beim Einsatz Maschineller Übersetzung sehr wichtig. Hier wird mit ProduktivitĂ€tsmessverfahren (z.B. time-to-edit, siehe auch TAUS, DQF) die Geschwindigkeiten des Posteditierens gemessen. So weiß man, wann man Engines neu trainieren oder austauschen sollte. Idealerweise laufen QualitĂ€tsmessungen automatisch bei der Übersetzung und dem Post-Editing-Prozess mit (siehe auch Post-Editing, ÜbersetzungsqualitĂ€t).

  • QualitĂ€tssicherungstools

    QualitĂ€tssicherungstools sichern die SprachqualitĂ€t bei Texterstellung (z.B. Congree), Übersetzung (z.B. QA Distiller) und der Pflege der Sprachressourcen, wie Terminologie (z.B. quickTerm). Hierdurch werden Fehler vor der Veröffentlichung von Texten oder der Verwendung von Ressourcen aufgefunden und korrigiert. Der konkrete Einsatz der unterschiedlichen Tools hĂ€ngt stark vom individuellen Sprachproduktionsprozess ab (siehe auch SprachqualitĂ€tssicherung, ÜbersetzungsqualitĂ€t).