MÜ

Schreiben für die Maschinelle Übersetzung

Die Technologie im Bereich der maschinellen Übersetzung macht große Sprünge (siehe Neuronale MÜ), und doch sind viele Systeme noch immer weit von dem perfekten Output entfernt. Oft liegt das aber nicht unbedingt am verbesserungswürdigen Algorithmus, sondern eventuell am verbesserungswürdigen Ausgangstext. Sie als Redakteur oder Redakteurin können auf die Übersetzungsergebnisse maßgeblich Einfluss nehmen, indem Sie Ihre Ausgangstexte so verfassen, dass sie von der maschinellen Übersetzung gut verarbeitet werden können. Wir zeigen Ihnen wie.

Alles eine Frage der Qualität

Im Zuge der Digitalisierung möchten viele Unternehmen die maschinelle Übersetzung einsetzen. Doch MÜ ist nicht gleich MÜ. Auf den Anwendungsfall kommt es an. Für Texte, die eines Tages gedruckt werden sollen und daher eine einwandfreie Qualität haben müssen, ist nach der maschinellen Übersetzung noch einiges an Post-Editing durch einen Menschen erforderlich.

Andererseits gibt es auch Textsorten, bei denen eine geringe Qualität ausreicht und es genügt, wenn der Leser den Sinn erfassen kann (Stichwort: gisting). Prädestinierte Szenarien dafür wären zum Beispiel eine unternehmensinterne Kommunikation mit Geschäftsstellen im Ausland via Email oder Chat, sowie Supportanfragen. Hierfür setzen immer mehr Unternehmen ein (eigens für sie eingerichtetes) maschinelles Übersetzungssystem ein.

Wenn ein Mensch bereits Schwierigkeiten hätte, wie soll es dann eine Maschine schaffen?

Nehmen wir einmal an, Sie verschicken eine Nachricht an Ihren Kollegen im Ausland. Er versteht kein Deutsch und wird die Nachricht kopieren und in die maschinelle Übersetzung einfügen. Sie können beim Verfassen Ihrer Nachricht dazu beitragen, dass die Maschine und schließlich auch Ihr Kollege verstehen, was Sie sagen wollen.

Zwar fallen die Problematiken bei den einzelnen maschinellen Übersetzungssystemen unterschiedlich ins Gewicht, doch ob regelbasiert, statistisch oder neuronal – auf die folgenden Punkte können Sie bei allen achten.

Hier ein paar  Tipps zur Erstellung guter Ausgangstexte:

Aktivieren Sie die Rechtschreibprüfung

Klingt ziemlich „basic“, aber eine korrekte Rechtschreibung ist für die MÜ essentiell. Wir Menschen sind in der Lage, auch verdrehte oder fehlende Wörter zu erkennen oder „aufzufüllen“. Wir können z. B. folgenden Satz problemlos lesen:

Die Bshcuteban kenönn ttoal druchenianedr sein und man knan es tortzedm onhe Poreblme lseen, weil das mneschilhce Gherin nhcit jdeen Bcuhstbaen enizlen leist, snodren das Wort als gnazes.

Das maschinelle Übersetzungssystem kann das jedoch nicht, weshalb die Sprache absolut korrekt sein muss.

Verwenden Sie eine einfache grammatikalische Struktur

Die Sätze sollten vollständig sein, mit einem Großbuchstaben beginnen, einen Hauptsatz beinhalten und mit einem Punkt enden. Vermeiden Sie verschachtelte Relativsätze und VERSALIEN.

Fassen Sie sich kurz

Auch wenn es MÜ-Systeme gibt, die gut mit langen Sätzen zurechtkommen, können Sie folgende Regel im Hinterkopf behalten: pro Gedanke ein Satz. 5-20 Wörter können von einer Maschine gut verarbeitet werden. Teilen Sie lange Sätze wenn möglich in zwei kurze.

Vermeiden Sie Umgangssprache und Abkürzungen

„Insider“ und „Slang“ sowie Klischees, Umgangssprache und Abkürzungen können problematisch für die MÜ sein. Solche Textpassagen werden eventuell falsch oder gar nicht übersetzt. Davon abgesehen werden (im Hinblick auf die internationale Kommunikation) idiomatische Ausdrücke nicht auf der ganzen Welt verstanden.

Vermeiden Sie Ambiguitäten

Manche Ausdrücke oder auch ganze Sätze, können auf verschiedene Arten gedeutet werden. Ein bekanntes Beispiel:

Der Mann sah das Mädchen mit dem Fernrohr.

Hat er sie nun mithilfe des Fernrohrs gesehen, oder sah er, wie das Mädchen ein Fernrohr in der Hand hielt? Achten Sie also darauf, dass Sie sich nicht vage ausdrücken und alle Beziehungen innerhalb eines Satzes eindeutig sind.

MÜ
Eindeutigkeit ist das A und O

Es gibt auch lexikalische Ambiguitäten. Je nach Kontext kann ein Wort mehrere Bedeutungen haben. Handelt es sich bei dem Polysem „Virus“ um ein Computervirus oder um einen Begriff aus der Medizin? Ein statistisches maschinelles Übersetzungssystem ist nicht immer in der Lage, den korrekten Kontext zu erkennen, da es Satz für Satz übersetzt und nicht den Text als Ganzes „sieht“. Die neuronalen Ansätze der MÜ haben da einen Vorteil aufgrund ihrer kontextuellen Auslegung.

Benutzen Sie bestimmte Artikel

Bestimmte Artikel machen es der MÜ leichter, Substantive und (je nach Sprache) ihr Genus korrekt zu identifizieren. Je mehr Artikel-Substantiv-Kombinationen desto mehr Informationen hat das System als Grundlage für die korrekte Übersetzung.

Verwenden Sie aktive statt passive Formulierungen

Dadurch werden die Beziehungen innerhalb eines Satzes eindeutiger und für die MÜ weniger vage, denn durch die Verwendung von Aktivformulierungen werden Subjekte identifiziert, was wiederum mehr Informationen für die MÜ bedeutet.

Verwenden Sie konsistente Terminologie

Wir können es nicht oft genug betonen: Die einheitliche Verwendung von Terminologie ist nie verkehrt. Sie erleichtert nicht nur die Kommunikation innerhalb eines Unternehmens und vermeidet Missverständnisse, sie ermöglicht auch die korrekte und konsistente Übersetzung von Texten entweder durch eine maschinelle Übersetzung oder auch mithilfe eines Translation Memory Systems. Für die Ausgangstext-, bzw. Terminologieprüfung kann es sinnvoll sein, Authoring-Systeme wie Acrolinx oder Congree einzusetzen.

Bringen Sie die Maschine zum Lernen!

Natürlich ist das Verfassen von korrekten Ausgangstexten nicht die einzige Möglichkeit, bessere, maschinell übersetzte Texte zu erhalten. Weitere Methoden sind das Training bzw. Tuning der MÜ mit unternehmensspezifischen Texten und eigener (fachspezifischer) Terminologie und das Post-Editing. Durch diese Maßnahmen „lernt“ die Maschine dazu und wird nach und nach besser.

Achten Sie also bereits beim Verfassen Ihrer Texte auf die oben aufgeführten Punkte und reduzieren Sie dadurch Missverständnisse und Korrekturaufwände nach der maschinellen Übersetzung.

Related Posts