Maschinelle Übersetzung

Ihr Übersetzungsvolumen und die verbundenen Kosten steigen?

Beherrschen Sie Ihr Übersetzungsvolumen und senken Sie die Kosten mit einer eigenen MÜ-Engine, die die Sprache Ihres Unternehmens spricht! Wir helfen Ihnen dabei, die passende MÜ-Engine zu wählen und zu trainieren, damit Ihre Daten sicher sind.

Maschinelle Übersetzung erobert die Welt des Übersetzungsmanagements.

Maschinelle Übersetzung erobert die Welt des Übersetzungs-managements.

Dank der rasanten Fortschritte im Bereich des Maschinellen Lernens stellt sich heute nicht mehr die Frage, ob neuronale maschinelle Übersetzung (NMÜ) grundsätzlich Sinn macht. Dafür ergeben sich in Unternehmen viele neue Fragen: Haben wir genug Daten für eine Engine? Wollen wir maschinelle Übersetzung im produktiven Modus einsetzen? In welchen Sprachrichtungen kann trainiert werden? Die wachsende Systemvielfalt stellt Kund:innen zudem vor die schwierige Wahl des richtigen NMÜ-Systems.

Die neuronale maschinelle Übersetzung bleibt für Endanwender:innen meist eine Black-Box. Umso wichtiger ist hier eine objektive, System-unabhängige und kompetente Beratung. Unsere Computerlinguist:innen und Daten-Expert:innen unterstützen Sie bei der Auswahl der richtigen NMÜ-Systeme und dem effizienten Einsatz in Ihren Unternehmensprozessen. Lesen Sie selbst, welche die wichtigsten Schritte sind und auf welche Faktoren es ankommt.

Wir stehen Ihnen bei allen Schritten sehr gerne beratend zur Seite.

Mit unserer Expertise beherrschen Sie
die Datenflut.

Wie sollen immer größere Datenbestände übersetzt werden? Mit neuronaler maschineller Übersetzung natürlich!
Natürlich benötigt maschinelle Übersetzung für den effizienten Einsatz eine gut gepflegte Datenbasis, die im Rahmen der Sprachdatenaufbereitung abgesichert wird. Wir unterstützen Sie bei der Analyse der vorhandenen Daten sowie ihrer Optimierung. So sind Sie für das Training mit den NMÜ-Engines perfekt vorbereitet. Darüber hinaus unterstützen wir Sie bei der Analyse von Anwendungsszenarien für maschinelle Übersetzung. Aber auch beim Training, Testing und Optimieren der NMÜ-Engines lassen wir Sie nicht alleine.
Kontaktieren Sie uns gerne, falls Sie Unterstützung brauchen.

Was ist eigentlich maschinelle Übersetzung?

Einfach erklärt ist die maschinelle Übersetzung eine automatisierte Übersetzung. Für große Mengen von Ausgangstexten generiert die MÜ in kürzester Zeit Texte in der gewünschten Zielsprache. Es wird zwischen verschiedenen Verfahren der maschinellen Übersetzung unterscheiden. So gibt es beispielsweise die regelbasierte, statistische und neuronale maschinelle Übersetzung. Die genannten Verfahren funktionieren unterschiedlich, die Gemeinsamkeit ist die Generierung von Texten in Zielsprachen. Aber wie funktionieren die unterschiedlichen Verfahren der maschinellen Übersetzung?

Regelbasierte maschinelle Übersetzung

Die regelbasierte maschinelle Übersetzung, auch RBMÜ genannt, übersetzt Texte mittels linguistischer Regeln vollautomatisch. Im Grunde bildet dieses Verfahren mit direktem Ansatz die Ursprungsform der maschinellen Übersetzung. Dieser Ansatz überträgt Texte mithilfe von Wörterbüchern und sprachspezifischen grammatikalischen Regeln Wort für Wort in die Zielsprache. Die Erstellung und Anpassung von RBMÜ-Systemen erfordert syntaktisch-lexikalisches Hintergrundwissen zu den involvierten Sprachen. Der RBMÜ-Ansatz kommt heute nur noch für vereinzelte Sprachpaare zum Einsatz.

Statistische maschinelle Übersetzung

Bei der statistischen maschinellen Übersetzung, auch SMÜ beziehungsweise PMBÜ (Phrasenbasierte Maschinelle Übersetzung) genannt, wird ein zweisprachiges Textkorpus analysiert. So ermittelt die SMÜ die Wahrscheinlichkeit einer Übersetzung. Die SMÜ analysiert möglichst viele Texte sowohl in der Ausgangssprache als auch in der Zielsprache. Anschließend generiert sie die optimalste Übersetzungsalternative für einen Ausgangssatz. Dies geschieht anhand einer Wahrscheinlichkeit, die auf Basis des gemeinsamen Auftretens von Phrasen in Ausgangs- und in der Zielsprache berechnet wird. Dieses Verfahren der maschinellen Übersetzung kommt mittlerweile nur noch selten zum Einsatz.

Neuronale maschinelle Übersetzung

Die Neuronale maschinelle Übersetzung (NMÜ) ist das neuste Verfahren der maschinellen Übersetzung. Häufig stößt man in diesem Kontext auf die Abkürzung NMT, die für ‘Neural Machine Translation’ steht. Die NMÜ basiert wie die statistische maschinelle Übersetzung auf der Analyse von umfangreichen zweisprachigen Texten. Im Gegensatz zur SMÜ nutzt die NMÜ jedoch sogenannte ‘Word Embeddings’: Diese abstrakten Repräsentationen von Wörtern werden anhand der Kontexte gelernt, in denen die Wörter im Text auftreten. Die Verarbeitung der Word Embeddings in neuronalen Netzen ermöglicht es der NMÜ, Sätze zu produzieren, die sehr viel näher an der menschlichen Sprachproduktion sind, als die vorausgegangenen Verfahren. Für das Training einer guten NMÜ-Engine sind sehr viele Trainingsdaten erforderlich. Da kaum ein Nutzer derart große Textmengen besitzt, werden die meisten Engines mithilfe von vortrainierten ‘Basis-Engines’ erstellt, die mit eigenen Daten angereichert bzw. spezialisiert werden.

Eine ausführlichere Einführung in neuronale Netze erhalten Sie im Beitrag “Neuronale maschinelle Übersetzung –Mysterium?“.

Wir helfen Ihnen dabei, maschinelle Übersetzung richtig einzusetzen.

Scoping für die maschinelle Übersetzung

Erfassen und definieren Sie von vornherein alle Vorbedingungen, Erwartungen und Schritte bis zur Einführung der maschinellen Übersetzung. Nur dann kann die Integration maschineller Übersetzung erfolgreich sein. Berücksichtigen Sie von Anfang an die Anforderungen aller Prozessverantwortlichen und Stakeholder. Suchen Sie das Gespräch mit Projektmanagement, IT, Übersetzer:innen und Nutzerkreisen. Sind sich alle über Anwendungsfälle und Ressourcen der maschinellen Übersetzung im Klaren, können Sie konkrete Schritte zur MÜ-Systemauswahl vornehmen. Wir von blc unterstützen unsere Kund:innen im Scopingprozess bei der Projektplanung. Wir führen Interviews mit Stakeholdern durch und bieten Beratungsleistungen zu allen relevanten Kernbereichen der maschinellen Übersetzung vor und nach der Systemintegration an.

Vorverarbeitung

Nach dem Scoping erfolgt die Eignungsprüfung der zur Verfügung stehenden Trainingsressourcen für das Training der maschinellen Übersetzung. Nach der Extraktion aller relevanten Daten aus den verschiedenen Dateiformaten geht es mit der Datenbereinigung weiter. Neben der linguistischen und formalen Korrektheit der bilingualen Übersetzungseinheiten prüfen wir auch terminologische Ressourcen. Gegebenenfalls ziehen wir diese Ressourcen per Termextraktion hinzu. Für datensensible Anwendungsfälle können Sie ein Anonymisierungsverfahren anwenden. Nach der Sicherstellung der Datenqualität sollten Sie domänenspezifische Inhalte zusammenfassen und für das MÜ-Training vorbereiten. Dabei sollten Sie besonders auf die Erstellung von repräsentativen Testsets achten. Mit diesen Testsets können Sie anschließend die Qualität der trainierten Engines pro System evaluieren.

Training

Mithilfe der Nutzerdaten trainieren Sie MÜ-Engines in den anbieterspezifischen Cloud-Systemen. Diese unterscheiden sich hinsichtlich der verfügbaren Sprachrichtungen, Trainingsressourcen, Konfigurationsmöglichkeiten und vortrainierten Basis-Engines, die mithilfe der Nutzerdaten spezialisiert werden können. Beachten Sie, dass das Training in Abhängigkeit der Datenvolumina ein bis mehrere Tage in Anspruch nehmen kann. Die frisch trainierten Engines übersetzen dann die zuvor erstellten Testsets. Diese Übersetzungen stellen die Basis der Systemevaluation dar.

Evaluation

Die Bewertung der MÜ-Qualität zählt zu den wichtigsten Schritten im MÜ-Auswahlprozess. Die automatische Evaluation vergleicht die maschinellen Übersetzungen einer Menge von Ausgangssätzen mit den Humanübersetzungen derselben Satzmenge. Das Ergebnis der vollautomatischen Evaluation ist ein Score, der die Ähnlichkeit zwischen der maschinellen Übersetzung und der Humanübersetzung ausdrückt. Der bekannteste dieser Scores ist BLEU (bilingual evaluation understudy).

BLEU und vergleichbare Metriken sind nicht in der Lage, die tatsächliche lexikalische Varianz im neuronalen MÜ-Text adäquat zu bewerten. Daher stellt die Humanevaluation aktuell immer noch das präziseste Mittel der MÜ-Bewertung dar. Die Humanevaluation kann entweder holistisch, analytisch oder auf beide Arten erfolgen. Die holistische Evaluation erfasst Lesbarkeit und Akkuratheit der maschinellen Übersetzung mithilfe von Skalen. Sie liefert einen schnellen, qualifizierten Mittelwert über alle Sätze im Testset. Weitaus detailliertere Informationen liefert die analytische Evaluation. Ausgehend von einer festgelegten Fehlermetrik annotieren die Evaluatoren hier individuelle Fehlertypen in der maschinellen Übersetzung. Die Zusammenfassung der Ergebnisse liefert zudem wertvolle Informationen für die Optimierung von MÜ-Engines.

Ein weiteres Kriterium der Evaluation ist die Erfassung von Post-Editing-Aufwänden. Als Bestandteil der MÜ-Evaluation gibt die sogenannte Edit-Distanz Aufschluss über den Bearbeitungsaufwand der MÜ-Segmente durch Übersetzer:innen beziehungsweise Post-Editor:innen. Je kleiner die Edit-Distanz für einen Satz, desto mehr Material können die Übersetzer:innen unverändert aus einem MÜ-Vorschlag übernehmen. Zusammen mit der automatischen und der Humanevaluation liefert die Edit-Distanz ein umfassendes Bild der Qualität und Eignung von MÜ-Engines.

Systemauswahl

Sie fragen sich bestimmt, wie Sie nun den richtigen Systemanbieter aussuchen. Als Grundlage für die Auswahl des für Sie geeigneten Systemanbieters dienen zum einen die Ergebnisse der MÜ-Evaluation. Zum anderen spielen auch die Anforderungsprofile und die finanziellen Rahmenbedingungen eine wichtige Rolle bei der Entscheidung. In dieser Phase ist die objektive Gegenüberstellung und Präsentation relevanter Systemaspekte und Evaluationsergebnisse ein wichtiges Mittel. Es kann Ihnen bei der Entscheidungsfindung von großer Hilfe sein. Die Kostenaufstellung in detaillierten Business Cases sowie Interviews mit Systemherstellern und Referenzkund:innen komplettieren den bisher gewonnenen Eindruck der jeweiligen Anbieter. Sind alle fachlichen und technischen Fragestellungen beantwortet, können Sie die Systemauswahl mit fundierten Informationen und gutem Gewissen vornehmen.

Integration & Post-Editing

Nachdem Sie sich für ein System entschieden haben, geht es nun an die Umsetzung der MÜ-Anwendungsfälle. Zentral geht es hierbei darum, die Maschinelle Übersetzung in die bestehende Systemlandschaft zu integrieren: Translation- und Content-Management-Systeme werden an das Cloud-System angebunden, MÜ-Webportale für den unternehmensweiten MÜ-Einsatz eingerichtet und Workflows für einen reibungslosen Post-Editing-Prozess konfiguriert. Damit das MÜ-System up-to-date bleibt, unterstützen wir unsere Kund:innen bei der Etablierung von MÜ-Retrainingsprozessen. Wir stellen auf Wunsch auch weiterhin Support für den laufenden MÜ-Prozess bereit.

Use-Case “Maschinelle Übersetzung in der Pharma-Branche”

Herausforderung: Ein großes Pharma-Unternehmen wollte wissen, ob sich der Einsatz maschineller Übersetzung im Unternehmen lohnen könnte. Sie wollten zudem wissen, wie sie die maschinelle Übersetzung angehen können.

Lösung: Wir haben User-Szenarien gesichtet, Stakeholder interviewed, Daten analysiert und einen Business Case erstellt. Auf Basis dieser Daten haben wir ein Projekt zur Einführung maschineller Übersetzung gestartet. Das Projekt stellt eine Ressource im produktiven Übersetzungsprozess als auch in Form eines ‘Selbstbedienungsportals’ für die Mitarbeiter:innen. Das Projekt ist sehr erfolgreich.

Use Case “Maschinelle Übersetzung in der Entwicklung”

Herausforderung: Im Rahmen eines strategischen Projekts für einen großen deutschen Automobilhersteller sollten wir untersuchen, welche Voraussetzungen erfüllt sein müssen, damit maschinelle Übersetzung effektiv in einen bestehenden Dokumentationsprozess eingebunden werden kann.

Lösung: Im Rahmen des Projekts hat berns language consulting einen funktionstüchtigen Piloten erstellt und folgende Aspekte beleuchtet:

  • Integration bestehender Terminologie
  • Vorverarbeitung von Texten und Behandlung für möglichst präzise Ergebnisse
  • Einbinden der Engine in den bestehenden Übersetzungsworkflow
  • Gewährleisten der Datensicherheit, Anonymisierungs-Szenarien

Wir sind Ihr treuer Begleiter bei all diesen Schritten auf Ihrem Weg zur maschinellen Übersetzung.

Anforderungen bestimmen und Daten erheben

  • Definition des idealen Einsatz-Szenarios für maschinelle Übersetzung
  • Bestimmen und Priorisieren der Anforderungen: Sprachpaare, Verfügbarkeit, Qualität, Sicherheit
  • Analysieren und Bereinigen Ihrer Textdaten für das Training

MÜ-System auswählen, Engines trainieren

  • Extraktion von Texten und Terminologie für das Training der Engines
  • Trainieren von Engines verschiedener Anbieter zu Vergleichszwecken, Proof-of-Concepts
  • Evaluation der Ergebnisse und Auswahl des besten MÜ-Systems für den Einsatzfall

MÜ-Engines optimieren & integrieren

  • Optimieren der NMÜ-Engines durch Re-Trainings, Datenanreicherung
  • Zukunftssichere Integrationder MÜ-Systeme in die Systemlandschaft
  • Schulungen der Mitarbeiter
  • Erstellen von Leitfäden für das Post-Editing

Wie kann maschinelle Übersetzung meinem Unternehmen helfen?

Maschinelle Übersetzung kann Ihrem Unternehmen dabei helfen, das Übersetzungsmanagement effizienter zu gestalten. Konkret bedeutet das, dass der Vorübersetzungsprozess mithilfe von Translation Memories um die MÜ-Komponente ergänzt wird. Das wiederum heißt: Die Übersetzungen sind somit früher verfügbar. Die Zeitersparnis kann zudem durch einen weiteren positiven Faktor des MÜ-Einsatzes bedingt sein: Mit den richtigen Trainingsvoraussetzungen liefert die NMÜ auch domänenspezifische Übersetzungen, die Ihre Fachterminologie berücksichtigt und somit aufwendige terminologische Nachbearbeitungen überflüssig macht.

Durch die Integration der maschinellen Übersetzung in zentrale Übersetzungsportale, Erstell- und Produktsysteme profitieren alle Mitarbeiter sowohl in der internen als auch in der B2B- und B2C-Kommunikation von schnell verfügbaren Übersetzungen in all ihre Unternehmenssprachen. Ihr Unternehmen kann durch die optimale Implementierung von maschineller Übersetzung nur profitieren.

Wie sieht ein ideales
Übersetzungsmanagement aus?

Wie sieht ein ideales
Übersetzungs-management aus?

Ideales Übersetzungsmanagement zeichnet sich durch sorgfältige Analysen von MÜ-Anwendungsfällen und MÜ-Trainingsvoraussetzungen aus. Anwendungsfälle werden auf Machbarkeit geprüft und Erwartungen an den MÜ-Prozess und die MÜ-Qualität werden gemanagt. Die Systemauswahl erfolgt anhand von kundenspezifischen Testsets und einem detaillierten Abgleich von Systemfunktionen und Integrationsfähigkeiten.

Business Cases werden erstellt, Stakeholder mit einbezogen und Entscheidungen werden in jeder Prozessphase unterstützt. Nach der Systemauswahl erfolgt die Integration in enger Abstimmung mit dem MÜ-Dienstleister, um einen optimalen Langzeit-MÜ-Produktiveinsatz zu gewährleisten. Interne MÜ-Verantwortlichkeiten sind geklärt und verteilt. Die Kund:innen werden mit Workshops zu Kernthemen des MÜ-Einsatzes während der gesamten Projektlaufzeit begleitet und informiert.

Finden Sie, dass Ihr Unternehmen ein effizienteres Übersetzungsmanagement vertragen könnte? Wir helfen Ihnen dabei, Ihre Übersetzungsprozesse durch maschinelle Übersetzung zu verkürzen. Wir beraten Sie auch gerne zu professioneller Übersetzungssoftware. Sprechen Sie uns direkt an, wir helfen gerne weiter!.

Möchten Sie mit Maschineller Übersetzung Ihre Übersetzung effizienter machen? Wir helfen Ihnen dabei!

 

Automatisieren Sie mit uns Ihre Übersetzungen!