Prag

BLC auf der EAMT 2017 in Prag – Zusammenfassung

Im Herzen der Kleinseite im wunderschönen Prag fand in diesem Jahr vom 28. bis zum 31. Mai die 20. Konferenz der ‚European Association of Machine Translation‘ (EAMT) statt. Vertreter aus Forschung und Industrie stellten Ihre Forschungsergebnisse und Anwendungsszenarien zur Evaluation, Praxistauglichkeit und Integration von MT-Verfahren in etlichen Vorträgen und Postersessions vor.

Im Mittelpunkt stand selbstverständlich das heiße Eisen ‚NMT‘ (neuronale maschinelle Übersetzung) und die Frage, wie Qualität und Nutzen des Verfahrens gegenüber etablierten statistischen Verfahren einzuschätzen ist. Folgend ein Ausschnitt aus der Vortragsreihe.

Kantan MT stellte Evaluationsergebnisse zum Vergleich von NMT und phrasenbasierter SMT vor. Die Universität Stuttgart stellte in Zusammenarbeit mit Kantan weitere Untersuchungen zum Nutzen der Vorverarbeitung von Wortstellungsmustern in NMT und PBMT vor. Weitere Evaluationsergebnisse zum Vergleich von NMT mit etablierten Verfahren über linguistische Kategorien sowie ein Framework zur Evaluation von MT-Output ohne Referenzmaterial stellten Vivien Macketanz und Eleftherios Avramidis vom DFKI (Deutsches Forschungszentrum für Künstliche Intelligenz) vor.  Aus dem Anwenderbereich stellte der LSP beo seine Erfahrungen mit dem Einsatz von NMT im Vergleich zur SMT auf  Basis von Kundendaten im Sprachpaar EN-DE vor. Nishikant Danuka von Booking.com präsentierte Ergebnisse zur MT-Lokalisierung von Angebotsbeschreibungen und Nutzer-Reviews auf dem bekannten Buchungsportal.

Neben vielen spannenden Vorträgen bot auch der Austausch mit Vortragenden und Teilnehmern in Kaffepausen und Postersessions eine gute Möglichkeit, die Arbeit von BLC vorzustellen und aus erster Hand Problemfelder und Möglichkeiten im Umfeld der sich wandelnden MT-Landschaft zu erörtern.

Prag
Prag

 

Terminologie & NMT-Post-edits

BLC befasste sich in den letzten Monaten eingehend mit dem Terminologie-Einsatz in der MT und stellte dabei fest, dass die Übersetzung in  und aus morphologisch ‚reichen‘ Sprachen (z.B. Finnisch, Türkisch, zum Teil auch Deutsch ) immer noch ein  Problem für bestehende  SMT-Systeme darstellt. Daher war es sehr erfreulich, hierzu auch Beiträge auf der EAMT zu sehen. So stellte Franck Burlot von der Université Paris-Saclay ein Verfahren zur Normalisierung von morphologischen Varianten vor, die auf der automatischen Gruppierung (clustering) von Wortformen und der morphologischen Generierung mithilfe neuraler Netze basiert. Auch die mit dem Einsatz von Terminologie verbundene Benennungskonsistenz auf Dokumentebene wurde von Eva Martínez Garcia von der Universitat Politècnica de Catalunya thematisiert.

Ein weiteres Thema, dem im Rahmen der CAT-Tool-Nutzung zunehmend Bedeutung zukommt, ist die Optimierung von MT-Engines durch nutzerkorrigierte MT-Vorschläge. Das Update von SMT-Systemen auf der Basis von Post-edits im CAT-Tool-Kontext hat seinen Weg in die praktische Anwendung bereits gefunden. Methoden zur Optimierung von NMT-Engines auf Basis von Post-Edits wurden von Marco Turchi (Fondazione Bruno Kessler) vorgestellt.

EAMT 2017 Prag - Vortrag: "Can out-of-the-box NMT Beat a Domain-trained Moses on Technical Data?"
Vortrag: „Can out-of-the-box NMT Beat a Domain-trained Moses on Technical Data?“

 

Schauen Sie auch in den nächsten Wochen auf unserem Blog vorbei, um mehr über ausgewählte Beiträge der EAMT sowie Berichte zum praktischen MT-Einsatz aus Anwendersicht zu erfahren.

[twitter_buttons display=tweet,follow,]


Außerdem interessant:

Related Posts