Maschinelle Übersetzung im Unternehmen – Lohnt sich das?

Maschinelle Übersetzung im Unternehmen – Lohnt sich das?

Die Einführung maschineller Übersetzung im Unternehmen ist ein Schritt, der viele Fragen aufwirft im Hinblick auf technische Umsetzung, generelle Nutzbarkeit im bestehenden Übersetzungsworkflow, Datensicherheit und Wirtschaftlichkeit. Aufgrund des durch die NMT (Neuronale Maschinelle Übersetzung) neu angefachten Interesses an der generellen Einsetzbarkeit maschineller Übersetzung haben wir dem Thema einen längeren Beitrag gewidmet, der Einstiegsfragen beantworten und eine erste Einschätzung erleichtern soll.

Die eingangs erwähnten Fragen und damit einhergehenden Unsicherheiten sind nur ein Grund, weshalb sich die MÜ erst jetzt – zögerlich –  den Weg in deutsche Unternehmen bahnt. Ein anderer Grund liegt darin, dass die personalisierte Nutzung von MÜ-Services über Programmierschnittstellen (APIs) erst in den letzten Jahren allmählich Verbreitung fand und somit erleichterte Bedingungen für die die Integration in bestehende Infrastrukturen schaffte, was lokale, kostenintensivere On-Premises-Lösungen in vielen Anwendungsszenarien überflüssig macht.

Trotz erleichterter Integrationsbedingungen bleibt für viele Entscheider die Frage: Warum sollten wir MÜ einsetzen? Lohnt sich das überhaupt?

Maschinelle Übersetzung: Verschiedene Szenarien
MÜ-Szenarien

Klare Erwartungen – Was soll maschinelle Übersetzung können?

Die Antworten auf diese Fragen lassen sich leichter finden, wenn feststeht,  wozu der MÜ-Output verwendet werden soll, denn: MÜ ist nicht gleich MÜ. Auch wenn der ‚Goldstandard‘ selbstverständlich eine Übersetzung ist, die inhaltlich wie stilistisch nicht von einer Humanübersetzung zu unterscheiden ist, so gibt es Anwendungsfälle für die MÜ, die mit verhältnismäßig wenig Integrations- und Erstellaufwand verbunden sind und einen Mehrwert außerhalb des klassischen Übersetzungsworkflows bieten. So lässt sich MÜ in der Anwendungsentwicklung nutzen, wo lokalisierte Inhalte zu Testzwecken vor dem finalen Produktivgang nicht tadellos sein müssen. Bereits hier ergeben sich große Einsparpotenziale, da sich die Humanübersetzung und mit ihr verbundene Kommunikationswege  durch den Zwei-Wege-Dialog mit dem MÜ-Server erübrigen. Soll die MÜ im Rahmen interner Kommunikation verwendet werden, ist schon etwas mehr Optimierungsaufwand für die MÜ-Engines nötig. Interne Kommunikation soll verständlich sein, verzeiht aber einzelne Fehler, solange der Informationsgehalt für alle Kommunikationsteilnehmer erhalten bleibt (→ ‚Gisting‘). Dieser Aufwand, der in verschiedenen Graden die Zusammenstellung und Bereinigung der Trainingsdaten, die Anreicherung der Daten mit weiterem Sprachmaterial sowie eine Fehleranalyse beinhalten kann, ist zwar hoch. Nach einer Einführungsphase, deren Resultat dann produktive Engines für die benötigten Sprachpaare sind, ist  ein erneutes Training der Engines (das sogenannte Re-Training) aber erst wieder nötig, wenn umfassende Änderungen im Textmaterial vorgenommen wurden.

MÜ-Output mit sehr hohem Qualitätsanspruch erfordert weiteren Optimierungs- und Analyseaufwand, welcher in der Regel durch einen Korrekturprozess, wie z.B. Pre- und Post-Editing ergänzt werden muss, um Texte in Publikationsqualität (z.B. für Broschüren und Websites) zu erzeugen. Im gesamten MÜ-Prozess kann Terminologie eine entscheidende Rolle spielen. Je mehr Terminologie für die im MÜ-Workflow eingesetzten Sprachen vorliegt, desto verlässlicher werden zentrale Unternehmensbegriffe mit der korrekten Übersetzung in den Zieltext übernommen (→ Domänenanpassung). Ob Terminologie optimierend eingesetzt werden kann, hängt sowohl vom verwendeten Verfahren als auch von der Konsistenz der Terminologie-Verwendung in den Ausgangstexten ab. Deshalb ist die Verwendung von Authoring-Tools im Redaktionsprozess eine sinnvolle Grundlage für den MÜ-Prozess.

In Kürze: Hohe MÜ-Qualität ist über sorgfältige Aufbereitung und Zusammenstellung der Trainingstexte sowie über den Einsatz von gut gepflegten Terminologien zu erreichen – insbesondere dann, wenn in spezifischen Themenfeldern (Domänen) übersetzt werden soll.

SMT vs. NMT – Robustheit oder Eleganz?

Auch wenn es keinen Zweifel mehr gibt, dass neuronale maschinelle Übersetzung in Zukunft den MÜ-Zug antreiben wird, so kann es sich doch lohnen, einen genaueren Blick auf die individuellen Stärken der Verfahren zu werfen. Ein wichtiges Kriterium, das trotz überzeugender NMT-Ergebnisse für die SMT spricht, ist die Kontrollierbarkeit des Outputs. Aufgrund der leichter analysierbaren Beziehungen zwischen Ausgangs- und Zielphrasen lassen sich einzelne Übersetzungen in der SMT gezielter steuern als in der NMT. Auch die Nutzung von Terminologie stellt für die NMT noch eine Hürde dar, die aber zunehmend von Systemen überwunden wird. Ganz klar für die NMT spricht die Verarbeitung des Satzes als Ganzes, was der korrekten Wortfolge und Lesbarkeit der Übersetzung zugutekommt. Aufgrund der internen Verarbeitung der Netze sind spezifische Übersetzungen jedoch nicht steuerbar und Fehler schwieriger zu analysieren. In Bezug auf das Training sind SMT-Systeme robuster gegenüber fehlerhaften Trainingsdaten, benötigen hierzu aber auch mehr Daten als die NMT.

In Kürze: Die Entscheidung SMT vs. NMT sollte davon abhängig gemacht werden, wie die Verfahren im spezifischen Use Case abschneiden. Trotz guter Lesbarkeit ist NMT in manchen Szenarios nicht uneingeschränkt zu empfehlen!                                                       

Und die Kosten?

Wie auch im humanen Übersetzungsworkflow entscheiden die Anzahl der benötigten Sprachpaare und das geplante Übersetzungsvolumen über die Effizienz des Einsatzes. Das bei vielen Anbietern kostenfreie Volumen von bis zu 2 Mio. Zeichen im Monat ist für größere Volumina bei weitem nicht ausreichend, umfasst aber immerhin über 1300 Normseiten a 1500 Zeichen (Leerzeichen nicht mitgerechnet). Neben dem Zeichen/Wortvolumen entscheiden die Sprachrichtungen darüber, wie viele Engines hinzugekauft werden müssen. Soll in verschiedenen Domänen übersetzt werden, multipliziert sich die Anzahl der Engines um die Anzahl der vorhandenen Domänen. Die monatlichen Kosten variieren in Abhängigkeit der verschiedenen Preismodelle, die nicht selten schon eine feste Anzahl an Engines umfassen oder sich nur über das Übersetzungsvolumen finanzieren. Die Entscheidung SMT oder NMT schlägt sich aktuell auch in der Bepreisung der Angebote nieder. Die Kosten für ein Re-Training hängen vom Turnus und Umfang der inhaltlichen Änderungen in den zu übersetzenden Texten ab. Ein klar definierter Anforderungskatalog, der Qualitätserfordernisse und Datenlage erfasst, führt zu einem aussagekräftigen Proof-Of-Concept, das klare Evaluationsbedingungen festlegt und Ihnen durch eine transparente Machbarkeitsaussage spätere Überraschungen erspart und mit falschen Management-Erwartungen aufräumt.

In Kürze: Mit zunehmender Anzahl der Sprachpaare und abnehmender Qualität und Verfügbarkeit von Trainingsdaten nehmen Aufbereitungsaufwand und somit die Kosten für ein MÜ-System zu.

Welches MÜ-System ist wirklich sicher?

Ist die Entscheidung für den MÜ-Einsatz gefallen, bleibt die Besorgnis um die Datensicherheit, denen die Anbieter von Cloud-Services mit militärischen Verschlüsselungsstandards und wählbaren Serverstandorten entgegentreten. Kommen Cloud-Services aus Compliance-Gründen für den MT-Einsatz nicht in Frage, besteht bei einigen Anbietern auch die Möglichkeit einer On-Premise-Lösung beim Kunden. Hierbei ist zu beachten, dass der Hardware- und Integrationsaufwand für ein performantes On-Premise-System  nicht zu unterschätzen ist und regelmäßiger Hardware-Updates bedarf, um mit den Anbieterstandards mithalten zu können. Bei der Einschätung der Datensicherheit auf dem Übertragungsweg der Daten empfiehlt sich ein Vergleich mit den unternehmenseigenen Sicherheitsstandards, in denen der Mensch in der Regel eine größere Fehlerquelle für Datenlecks darstellt als die eingesetzte Verschlüsselungstechnik. Bestehen darüber hinaus Bedenken bezüglich der Übertragung sensibler Daten (personenbezogene Daten, Termini) im MÜ-Workflow, können Anonymisierungsoptionen die Angst vor gezielten Datenangriffen nehmen.

In Kürze: Die Sicherheitsstandards von MÜ-Services in der Cloud sind sehr hoch und die Anforderungen der Unternehmenslandschaft werden  in zunehmend personalisierbaren Angeboten berücksichtigt.

Ja, ich will! Aber wen überhaupt?

Bei der zunehmenden Vielfalt von Anbietern, die sich zudem mit verschiedenen Ausprägungen der eingesetzten MÜ-Verfahren brüsten,  ist es nicht einfach, den passenden Kandidaten zu finden. Oftmals verfügen Unternehmen nicht über ausreichend spezialisiertes Personal, um die Entscheidung für einen Anbieter von ausgiebigen Tests der Services abhängig zu machen. Hier ist es ratsam, den objektiven Entscheidungsprozess von Experten begleiten zu lassen, die vor der Evaluation der MÜ-Qualität auch den Use-Case für den MÜ-Einsatz klar umreißen und somit die Erwartungen an die Ergebnisse in realistische Bahnen lenken, denn: MÜ ist kein Allheilmittel, kann aber Wunder wirken, wenn sie richtig eingesetzt wird.

Related Posts