Das META-FORUM 2017  – von schlauen Netzwerken und aussterbenden Daten

Das META-FORUM 2017  – von schlauen Netzwerken und aussterbenden Daten

Am 13. und 14.11.2017 kamen auf dem META-FORUM 2017 in Brüssel zum 7. Mal Vertreter aus Wissenschaft, Forschung, Verwaltung und Industrie zusammen, um gemeinsam darüber zu diskutieren, wie ein multilingual vernetztes Europa aussehen kann und welche Hürden dabei zu nehmen sind. Da die maschinelle Übersetzung als eines der Kernthemen von blc auch im Fokus der Veranstaltung stand, waren dabei und haben die wichtigsten Einblicke in das vielschichtige Programm für Sie zusammengefasst.

Sprache als Schlüssel zur EU-Wettbewerbsfähigkeit

Das übergeordnete Ziel des META-FORUM und weiterer Koordinationsinitiativen ist ein von Sprachbarrieren befreites Europa und die damit einhergehende Steigerung der Wettbewerbsfähigkeit über den EU-weiten Ausbau des Digital Single Market. Dies soll mithilfe einer Reihe von industriellen und akademischen Initiativen erreicht werden, die sich unter dem finanziellen Mantel des 80 Mrd. schweren EU-Förderprojekts Horizon 2020 tummeln. Hierzu gehören beispielsweise die Netzwerke/Projekte META-NET, Cracker und das Human Language Project (HLP). Die Beiträge von Vertretern aus EU Parlament, Ministerien und Universitäten der EU-Mitgliedsländer zeigten die Bemühungen auf, die primär maschinell erzeugte Multilingualität auf nationaler und regionaler Ebene voranzutreiben: Der Aufbau von linguistischen Infrastrukturen, Ressourcen und Technologien – zunächst in wichtigen administrativen Sektoren wie Medizin, Biologie, Recht und Sicherheit – spielt eine große Rolle für die sozioökonomische Zukunft Europas. Hierzu ist es nötig, die mitunter unterschiedliche politische Awareness der regionalen Verwaltungen und Förderungen für die Erhaltung von Sprachdaten und den Fortschritt von Sprachtechnologien zu schärfen. Ein Blick auf die USA macht deutlich, wie das Wegfallen von Sprachbarrieren eine Arbeitsmobilität begünstigt, von der Europa noch recht weit entfernt ist, da hier das Englische praktisch als Pivot-Sprache für den EU-Binnenmarkt nicht in Frage kommt, da es nur von etwa 60% der Europäer gesprochen wird.

META-FORUM 2017

Große Beachtung wurde selbstverständlich auch den neuronalen Netzen gewidmet, denen neben der neuronalen maschinellen Übersetzung (NMT) auch in vielen anderen Forschungs- und Industriebereichen eine stark zunehmende Relevanz zukommt. Besonders beeindruckend war hier die Präsentation von iHEARu , einem System zur Analyse und Klassifizierung gesprochener Sprache, welches Sprechercharakteristika wie z.B. Stimmungsmodalitäten oder gar Krankheitsbilder aus den empfangenen Daten ableiten kann. Als Vertreter der Übersetzungsdienstleiter stellten SDL und Systran ihre neuronalen Übersetzungskomponenten vor. Auch KantanMT und Tilde, die sich zusammen mit weiteren MÜ-Dienstleistern maßgeblich an der Transformation des MT-Projekts der europäischen Kommission zum System eTranslations beteiligen, gaben interessante Einblicke in die Entwicklung der NMT und die Zukunft der maschinellen Übersetzung. Die Ausführungen der MÜ-Dienstleister bestätigten zudem unsere Erfahrungen mit den Anforderungen der Industrie an die domänenspezifische MÜ: Das auf EU-Ebene gelebte Multi Vendor Modell ist die konsequente Antwort auf die Bedürfnisse der Großindustrie und ihre spezialisierten Geschäftsprozesse.

Daten, mehr Daten, noch mehr Daten – aber woher?

Ein sprachlich vernetztes Europa braucht Daten – viele Daten. Auch wenn sich Initiativen wie das HLP um die Archivierung umfassender Sprachdaten kümmert, ist es für spezifische industrielle Teilbereiche nicht immer ganz klar, woher die Daten für den gigantischen EU-Babelfisch  stammen sollen, da Großunternehmen oftmals aus datenschutzrechtlichen Bedenken heraus nur sehr zögerlich bereit sind, ihre Texte zur Verfügung zu stellen. So arbeiten viele akademische Projekte seit geraumer Zeit mit Sprachdaten, die wenig repräsentativ für wichtige Industriezweige sind. Einen weiteren Aspekt des Datenproblems stellen unterrepräsentierte Sprachen und regionale Dialekte dar, für welche entweder keine oder nicht ausreichende digitale Ressourcen für das Training von MÜ-Engines vorhanden sind. Für das Sprachdatensterben hat sich daher bereits der Begriff digital extinction durchgesetzt – ein Zustand, dem das Human Language Project entgegenwirken will.

META-FORUM 2018? Wir sind dabei!

Das META-FORUM war vor dem Hintergrund der zunehmenden Relevanz der MÜ für viele unserer Kunden eine sehr interessante Erweiterung unseres Blickwinkels auf die gesamtgesellschaftlichen Anforderungen an den MÜ-Prozess im übergeordneten sozio-politischen Gesamtkontext, aus dem sich doch einige Erkenntnisse auch auf den Unternehmensprozess übertragen lassen. Die Veranstaltung bietet darüber hinaus einen einmaligen Rahmen, um die akademisch-wirtschaftlichen Beziehungen auf dem Gebiet der Sprachtechnologien zu knüpfen und auszubauen. Auch 2018 sind wir daher sicher wieder dabei!

Bei all den insgesamt vielversprechenden Ausblicken auf eine erleichterte Verständigung muss jedoch eine Hoffnung zunächst enttäuscht werden: Pläne, die resultierenden MT-Dienste auch für die Öffentlichkeit zugänglich zu machen, bestehen bis jetzt nämlich nicht.

Related Posts