Glossar

  • Das Alignment ist ein Textordnungsverfahren. Hierbei werden Sätze in einem Ausgangstext den korrespondierenden Sätzen in der Übersetzung des Textes zugeordnet. Ein Alignment muss immer dann durchgeführt werden, wenn Text in einem un-segmentierten Fließtext vorliegen. Das Ergebnis wird dann in(...)
  • Ein Begriff ist eine Wissenseinheit, die durch eine eindeutige Kombination von Merkmalen erzeugt wird (siehe auch: DIN EN ISO 18104:2014-05). In der Terminologie ist ein Begriff durch eine oder mehrere Benennungen textuell repräsentiert. Ein gutes Beispiel hierfür sind die Benennungen(...)
  • Eine Benennung ist ein Wort oder mehrere Wörter zur Bezeichnung eines Begriffs (DIN ISO 26162:2016-12). In einer begriffsbasierten Terminologiedatenbank werden z.B. pro Begriff bei Bedarf mehrere Benennungen hinterlegt. In der Regel sollte dabei immer eine bevorzugte Benennung angegeben(...)
  • Unter CAT-Tool (aus dem Englischen: computer-assisted/computer-aided translation) versteht man alle computer-gestützten Hilfssysteme des Übersetzers, also Wörterbücher, Referenztexte, Translation Memories usw. Heute verwendet man CAT-Tool häufig synonym zu Translation Memory System, einem(...)
  • Fehlermetriken messen in der Qualitätsevaluierung (QE), ob die zuvor vereinbarte Sprachqualität erreicht wurde. Es gibt verschiedene Metriken (MQM, DQF, SAEJ2450, LISA). Alle Metriken bieten Fehlerkriterien, Fehlerpunkte und Schweregrade, die im Vorfeld kalibriert werden sollten.(...)
  • Internationalisierung beschäftigt sich mit der formalen Lokalisierung einer Software oder einer Webseite an die Gegebenheiten und Vorgaben der Zielkultur/des Ziellandes. Hier geht es vorrangig darum, Zahlen, Daten, Formate, Einheiten, Kalender zielkulturgerecht aufzubereiten und darzustellen.
  • Ein Kompositum ist ein zusammengesetztes Wort, meistens bestehend aus zwei oder mehr Substantiven. Die häufigste Gruppe ist im Deutschen das Determinativkompositum (Beispiel Erdball, Erdapfel, Erdumrundung). Neben den reinen Substantiv-Verbindungen gibt es auch Adjektiv-Verbindungen (Bsp.(...)
  • Ein Korpus ist eine digitalisierte Sammlung von Textdaten, die zur computergestützten Verarbeitung natürlicher Sprache herangezogen werden. Zum Beispiel in der Maschinellen Übersetzung werden alignierte, zweisprachige Parallelkorpora als Basis für statistische Analysen und für das(...)
  • Bei der Lokalisierung passt die bearbeitende Person einen Text und dessen Bestandteile an Sprache und Kulturspezifika eines Ziellands an. Diese Anpassung erfolgt häufig im Rahmen einer Übersetzung. Das Ergebnis der Lokalisierung ist ein Produkt (wie z.B. Text, Software, Webseite), das auf den(...)
  • Eine MÜ-Engine (MÜ=Maschinelle Übersetzung, auch: MT-Engine) ist ein systemgebundenes Modell zur automatischen unidirektionalen Übersetzung einer Sprache in eine weitere Sprache. Die Verfahren sind entweder regelbasiert (RBMÜ), statistisch (SMÜ) oder neuronal (NMÜ). Um statistische und(...)
  • Named Entity Recognition (NER) bezeichnet Methoden zur Erkennung von Spracheinheiten in der natürlichen Sprachverarbeitung. Mit Methoden der NER werden Angaben wie Namen, Orte und Produkte in Text-Korpora erkannt und gekennzeichnet. Durch neuste Entwicklungen im Bereich der Künstlichen(...)
  • Natural Language Processing (NLP) ist die computergestützte Verarbeitung natürlicher Sprache. Beispielsweise die Datenbereinigung für digitale Sprachverarbeitung oder maschinelle Übersetzung mittels Segmentierung, Tokenisierung, Textstatistik, Anonymisierung und Erkennung von Entitäten (NER).(...)
  • Die Neuronale Maschinelle Übersetzung (auch NMÜ, NMT) ist eine Methode der maschinellen Übersetzung, die mit rekurrenten neuronalen Netzen (RNN) durchgeführt wird. Hierbei verschlüsselt ein Kodierer Sequenzen von Wörtern im Ausgangstext in Vektoren. Anschließend entschlüsselt ein Dekodierer(...)
  • Das Akronym NMT steht für neural machine translation (auch NMÜ) und ist eine Methode der maschinellen Übersetzung, die mit rekurrenten neuronalen Netzen (RNN) durchgeführt wird. Hierbei verschlüsselt ein Kodierer Sequenzen von Wörtern im Ausgangstext in Vektoren. Anschließend entschlüsselt(...)
  • Das Akronym NMÜ steht für neuronale maschinelle Übersetzung (auch NMT) und ist eine Methode der maschinellen Übersetzung, die mit rekurrenten neuronalen Netzen (RNN) durchgeführt wird. Hierbei verschlüsselt ein Kodierer Sequenzen von Wörtern im Ausgangstext in Vektoren. Anschließend(...)
  • Eine Ontologie ist eine anerkannte, formale Modellierung von Wissen über eine Domäne (siehe auch unter DIN EN 62656-5 und VDE 0040-8-5:2018-05). Sie wird in Form von Ontologiesprachen repräsentiert, die Klassen, Objekte, Relationen und Attribute abbilden. Die Quintessenz einer Ontologie ist,(...)
  • Das Posteditieren (Englisch: Post-Editing, PE) ist die Tätigkeit, eine maschinell erstellte Übersetzung zu editieren und korrigieren (ISO-Norm PE 18587). Hierbei unterscheidet man zwischen leichtem (light) und vollständigem (full) Posteditieren. Das leichte Posteditieren hat zum Ziel, einen(...)
  • Mit einer Qualitätsevaluierung (QE) wird die Erreichung einer zuvor definierten Übersetzungsqualität beurteilt. Hierbei stellt man fest, ob Texte und Übersetzungen diese Qualitätsziele erreichen. Hierbei werden diverse Fehlermetriken eingesetzt. In der maschinellen Übersetzung sind(...)
  • Eine Qualitätsmessung (QM) ist eine Maßnahme zur laufenden Erhebung der Sprachqualität. Das ist vor allem beim Einsatz maschineller Übersetzung sehr wichtig. Hier wird mit Produktivitätsmessverfahren (z.B. time-to-edit, siehe auch TAUS, DQF) die Geschwindigkeiten des Posteditierens gemessen.(...)
  • Qualitätssicherungstools sichern die Sprachqualität bei Texterstellung (z.B. Congree), Übersetzung (z.B. QA Distiller) und der Pflege der Sprachressourcen, wie Terminologie (z.B. quickTerm). Hierdurch werden Fehler vor der Veröffentlichung von Texten oder der Verwendung von Ressourcen(...)