Maschinelle Übersetzung im Unternehmen

Die Einführung maschineller Übersetzung (MT) im Unternehmen ist ein Schritt, der viele Fragen aufwirft im Hinblick auf technische Umsetzung, generelle Nutzbarkeit im bestehenden Übersetzungsworkflow, Datensicherheit und Wirtschaftlichkeit. Trotz der einfachen Integrationswege über cloud-gehostete Systeme und PlugIns in Translation Management Systemen (TMS) bestehen häufig Unsicherheiten zum richtigen Vorgehen vor, bei und nach der MT-Integration. Leitfrage: Lohnt sich das überhaupt?

Klare Erwartungen – Was soll maschinelle Übersetzung können?

NMT (Neuronale Maschinelle Übersetzung) wurde in kürzester Zeit zum dominierenden MT-Ansatz. Kein MT-Anbieter kann es sich heute noch leisten, nicht auf neuronale Verfahren zur maschinellen Übersetzung zu setzen. Trotz etlicher MT-Anbieter auf dem Markt unterscheiden sich die zugrundeliegenden Techniken zur neuronalen Übersetzung nicht wesentlich voneinander. Bei der Frage nach dem richtigen MT-System geht es daher primär um den MT-Anwendungsfall, die damit verbundene Qualitätserwartung und den Grad der Autonomie, den der Nutzer in Bezug auf Training und Evaluation der MT-Engines haben möchte.

Generische, also nicht mit eigenen Daten trainierbare Systeme, bieten sich vor allem dort an, wo Nutzer die Engine für das schnelle Verständnis von Inhalten nutzen wollen. Für zu publizierende Inhalte ist es ratsam, MT-Engines mit eigenen Daten zu trainieren. Viele etablierte Systeme bieten hierzu z.B. eine grundlegende Infrastruktur mit simplen ‚One click‘ Trainingsoptionen an. Möchte man flexibel Übersetzungsressourcen wie Terminologien und Translation Memories (TMs) in selbst gesteuerten Trainings nutzen, gibt es Systeme mit einem erweiterten Funktionsumfang. Um diesen nutzen zu können, sind Kenntnisse und Analysen der verfügbaren Sprachressourcen vor dem Training von Vorteil. Sind Trainings in Eigenregie nicht gewünscht oder möglich, liegt der Fokus auf den Services, die der Anbieter hierzu zusammengestellt hat.

Ganz gleich, für welchen Weg man sich entscheidet: MT-Output mit sehr hohem Qualitätsanspruch erfordert weiteren Optimierungs- und Analyseaufwand, welcher in der Regel durch einen Korrekturprozess, wie z.B. Pre- und Post-Editing ergänzt werden muss, um Texte in Publikationsqualität (z.B. für Broschüren, Anleitungen und Websites) zu erzeugen. Im gesamten MÜ-Prozess kann Terminologie eine entscheidende Rolle spielen. Je mehr Terminologie für die im MÜ-Workflow eingesetzten Sprachen vorliegt, desto verlässlicher werden zentrale Unternehmensbegriffe mit der korrekten Übersetzung in den Zieltext übernommen (→ Domänenanpassung).

Ob Terminologie optimierend eingesetzt werden kann, hängt sowohl vom verwendeten Verfahren als auch von der Konsistenz der Terminologie-Verwendung in den Ausgangstexten ab. Deshalb ist die Verwendung von Authoring-Tools im Redaktionsprozess eine sinnvolle Grundlage für den MÜ-Prozess, denn: Mit Hilfe der Qualitätssicherung im Rahmen der Texterstellung wird gleichzeitig auch die Qualität der potenziellen MT-Trainingstexte sichergestellt. Die so erzeugten Übersetzungen werden qualitativer und stellen wiederum die Grundlage neuer MT-Trainings dar – der Kreis schließt sich.

Kurz & knackig: Hohe MÜ-Qualität ist über sorgfältige Aufbereitung und Zusammenstellung der Trainingstexte sowie über den Einsatz von gut gepflegten Terminologien zu erreichen – insbesondere dann, wenn in spezifischen Themenfeldern (Domänen) übersetzt werden soll.

Und die Kosten?

Wie auch im humanen Übersetzungsworkflow entscheiden die Anzahl der benötigten Sprachpaare und das geplante Übersetzungsvolumen über die Effizienz des Einsatzes. Das bei vielen Anbietern kostenfreie Volumen pro Monat ist für größere Volumina nicht ausreichend. Neben dem Zeichen/Wortvolumen entscheiden die Sprachrichtungen darüber, wie viele Engines hinzugekauft werden müssen. Soll in verschiedenen Domänen (Inhaltsarten) übersetzt werden, multipliziert sich die Anzahl der Engines um die Anzahl der vorhandenen Domänen.

Die monatlichen Kosten variieren in Abhängigkeit der verschiedenen Preismodelle, die nicht selten schon eine feste Anzahl an Engines umfassen oder sich nur über das Übersetzungsvolumen finanzieren. Die Kosten für ein Re-Training hängen vom Turnus und Umfang der inhaltlichen Änderungen in den zu übersetzenden Texten ab. Ein klar definierter Anforderungskatalog, der Qualitätserfordernisse und Datenlage erfasst, führt zu einem aussagekräftigen Proof-Of-Concept, das klare Evaluationsbedingungen festlegt und Ihnen durch eine transparente Machbarkeitsaussage spätere Überraschungen erspart und mit falschen Management-Erwartungen aufräumt.

Kurz & knackig: Mit zunehmender Anzahl der Sprachpaare und abnehmender Qualität und Verfügbarkeit von Trainingsdaten nehmen Aufbereitungsaufwand und somit die Kosten für ein MÜ-System zu.

Welches MÜ-System ist wirklich sicher?

Ist die Entscheidung für den MÜ-Einsatz gefallen, bleibt die Besorgnis um die Datensicherheit, denen die Anbieter von Cloud-Services mit militärischen Verschlüsselungsstandards und wählbaren Serverstandorten entgegentreten. Kommen Cloud-Services aus Compliance-Gründen für den MT-Einsatz nicht in Frage, besteht bei einigen Anbietern auch die Möglichkeit einer On-Premise-Lösung beim Kunden. Hierbei ist zu beachten, dass der Hardware- und Integrationsaufwand für ein performantes On-Premise-System nicht zu unterschätzen ist und regelmäßiger Hardware-Updates bedarf, um mit den Anbieterstandards mithalten zu können.

Bei der Einschätzung der Datensicherheit auf dem Übertragungsweg der Daten empfiehlt sich ein Vergleich mit den unternehmenseigenen Sicherheitsstandards, in denen der Mensch in der Regel eine größere Fehlerquelle für Datenlecks darstellt als die eingesetzte Verschlüsselungstechnik. Bestehen darüber hinaus Bedenken bezüglich der Übertragung sensibler Daten (personenbezogene Daten, Termini) im MÜ-Workflow, können Anonymisierungsoptionen die Angst vor gezielten Datenangriffen nehmen.

Kurz & knackig: Die Sicherheitsstandards von MÜ-Services in der Cloud sind sehr hoch und die Anforderungen der Unternehmenslandschaft werden in zunehmend personalisierbaren Angeboten berücksichtigt.

Ja, ich will! Aber wen überhaupt?

Bei der zunehmenden Vielfalt von Anbietern, die sich unterschiedlichen Fachexpertisen, Sprachkombinationen und Zusatzfunktionen brüsten, ist es nicht einfach, den passenden Kandidaten zu finden. Oftmals verfügen Unternehmen nicht über ausreichend spezialisiertes Personal, um die Entscheidung für einen Anbieter von ausgiebigen Tests der Services abhängig zu machen. Hier ist es ratsam, den objektiven Entscheidungsprozess von Experten begleiten zu lassen, die vor der Evaluation der MÜ-Qualität auch den Use-Case für den MÜ-Einsatz klar umreißen und somit die Erwartungen an die Ergebnisse in realistische Bahnen lenken, denn: MÜ ist kein Allheilmittel, kann aber Wunder wirken, wenn sie richtig eingesetzt wird.

Der Blog ist Ihnen noch nicht genug? Am 14. März hält Christian Eisold einen Vortrag zu diesem Thema auf der GALA in Dublin.