Glossar

  • Das Alignment ist ein Textordnungsverfahren. Hierbei werden SĂ€tze in einem Ausgangstext den korrespondierenden SĂ€tzen in der Übersetzung des Textes zugeordnet. Ein Alignment muss immer dann durchgefĂŒhrt werden, wenn Text in einem un-segmentierten Fließtext vorliegen. Das Ergebnis wird dann in(...)
  • Ein Begriff ist eine Wissenseinheit, die durch eine eindeutige Kombination von Merkmalen erzeugt wird (siehe auch: DIN EN ISO 18104:2014-05). In der Terminologie ist ein Begriff durch eine oder mehrere Benennungen textuell reprĂ€sentiert. Ein gutes Beispiel hierfĂŒr sind die Benennungen(...)
  • Eine Benennung ist ein Wort oder mehrere Wörter zur Bezeichnung eines Begriffs (DIN ISO 26162:2016-12). In einer begriffsbasierten Terminologiedatenbank werden z.B. pro Begriff bei Bedarf mehrere Benennungen hinterlegt. In der Regel sollte dabei immer eine bevorzugte Benennung angegeben(...)
  • Unter CAT-Tool (aus dem Englischen: computer-assisted/computer-aided translation) versteht man alle computer-gestĂŒtzten Hilfssysteme des Übersetzers, also WörterbĂŒcher, Referenztexte, Translation Memories usw. Heute verwendet man CAT-Tool hĂ€ufig synonym zu Translation Memory System, einem(...)
  • Fehlermetriken messen in der QualitĂ€tsevaluierung (QE), ob die zuvor vereinbarte SprachqualitĂ€t erreicht wurde. Es gibt verschiedene Metriken (MQM, DQF, SAEJ2450, LISA). Alle Metriken bieten Fehlerkriterien, Fehlerpunkte und Schweregrade, die im Vorfeld kalibriert werden sollten.(...)
  • Internationalisierung beschĂ€ftigt sich mit der formalen Lokalisierung einer Software oder einer Webseite an die Gegebenheiten und Vorgaben der Zielkultur/des Ziellandes. Hier geht es vorrangig darum, Zahlen, Daten, Formate, Einheiten, Kalender zielkulturgerecht aufzubereiten und darzustellen.
  • Ein Kompositum ist ein zusammengesetztes Wort, meistens bestehend aus zwei oder mehr Substantiven. Die hĂ€ufigste Gruppe ist im Deutschen das Determinativkompositum (Beispiel Erdball, Erdapfel, Erdumrundung). Neben den reinen Substantiv-Verbindungen gibt es auch Adjektiv-Verbindungen (Bsp.(...)
  • Ein Korpus ist eine digitalisierte Sammlung von Textdaten, die zur computergestĂŒtzten Verarbeitung natĂŒrlicher Sprache herangezogen werden. Zum Beispiel in der Maschinellen Übersetzung werden alignierte, zweisprachige Parallelkorpora als Basis fĂŒr statistische Analysen und fĂŒr das(...)
  • Bei der Lokalisierung passt ein Bearbeiter einen Text und dessen Bestandteile an Sprache und Kulturspezifika eines Ziellands an. Diese Anpassung erfolgt hĂ€ufig im Rahmen einer Übersetzung. Das Ergebnis der Lokalisierung ist ein Produkt (wie z.B. Text, Software, Webseite), das auf den(...)
  • Eine MÜ-Engine (MÜ=Maschinelle Übersetzung, auch: MT-Engine) ist ein systemgebundenes Modell zur automatischen unidirektionalen Übersetzung einer Sprache in eine weitere Sprache. Die Verfahren sind entweder regelbasiert (RBMÜ), statistisch (SMÜ) oder neuronal (NMÜ). Um statistische und(...)
  • Named Entity Recognition (NER) bezeichnet Methoden zur Erkennung von Spracheinheiten in der natĂŒrlichen Sprachverarbeitung. Mit Methoden der NER werden Angaben wie Namen, Orte und Produkte in Text-Korpora erkannt und gekennzeichnet. Durch neuste Entwicklungen im Bereich der KĂŒnstlichen(...)
  • Natural Language Processing (NLP) ist die computergestĂŒtzte Verarbeitung natĂŒrlicher Sprache. Beispielsweise die Datenbereinigung fĂŒr digitale Sprachverarbeitung oder maschinelle Übersetzung mittels Segmentierung, Tokenisierung, Textstatistik, Anonymisierung und Erkennung von EntitĂ€ten (NER).(...)
  • Die Neuronale Maschinelle Übersetzung (auch NMÜ, NMT) ist eine Methode der maschinellen Übersetzung, die mit rekurrenten neuronalen Netzen (RNN) durchgefĂŒhrt wird. Hierbei verschlĂŒsselt ein Kodierer Sequenzen von Wörtern im Ausgangstext in Vektoren. Anschließend entschlĂŒsselt ein Dekodierer(...)
  • Das Akronym NMT steht fĂŒr neural machine translation (auch NMÜ) und ist eine Methode der maschinellen Übersetzung, die mit rekurrenten neuronalen Netzen (RNN) durchgefĂŒhrt wird. Hierbei verschlĂŒsselt ein Kodierer Sequenzen von Wörtern im Ausgangstext in Vektoren. Anschließend entschlĂŒsselt(...)
  • Das Akronym NMÜ steht fĂŒr neuronale maschinelle Übersetzung (auch NMT) und ist eine Methode der maschinellen Übersetzung, die mit rekurrenten neuronalen Netzen (RNN) durchgefĂŒhrt wird. Hierbei verschlĂŒsselt ein Kodierer Sequenzen von Wörtern im Ausgangstext in Vektoren. Anschließend(...)
  • Eine Ontologie ist eine anerkannte, formale Modellierung von Wissen ĂŒber eine DomĂ€ne (siehe auch unter DIN EN 62656-5 und VDE 0040-8-5:2018-05). Sie wird in Form von Ontologiesprachen reprĂ€sentiert, die Klassen, Objekte, Relationen und Attribute abbilden. Die Quintessenz einer Ontologie ist,(...)
  • Das Posteditieren (Englisch: Post-Editing, PE) ist die TĂ€tigkeit, eine maschinell erstellte Übersetzung zu editieren und korrigieren (ISO-Norm PE 18587). Hierbei unterscheidet man zwischen leichtem (light) und vollstĂ€ndigem (full) Posteditieren. Das leichte Posteditieren hat zum Ziel, einen(...)
  • Mit einer QualitĂ€tsevaluierung (QE) wird die Erreichung einer zuvor definierten ÜbersetzungsqualitĂ€t beurteilt. Hierbei stellt man fest, ob Texte und Übersetzungen diese QualitĂ€tsziele erreichen. Hierbei werden diverse Fehlermetriken eingesetzt. In der maschinellen Übersetzung sind(...)
  • Eine QualitĂ€tsmessung (QM) ist eine Maßnahme zur laufenden Erhebung der SprachqualitĂ€t. Das ist vor allem beim Einsatz Maschineller Übersetzung sehr wichtig. Hier wird mit ProduktivitĂ€tsmessverfahren (z.B. time-to-edit, siehe auch TAUS, DQF) die Geschwindigkeiten des Posteditierens gemessen.(...)
  • QualitĂ€tssicherungstools sichern die SprachqualitĂ€t bei Texterstellung (z.B. Congree), Übersetzung (z.B. QA Distiller) und der Pflege der Sprachressourcen, wie Terminologie (z.B. quickTerm). Hierdurch werden Fehler vor der Veröffentlichung von Texten oder der Verwendung von Ressourcen(...)