Facebook Seite
Sprachressourcenportal Österreichs

Maschinelle Übersetzung

Neuronale maschinelle Übersetzung

Maschinelle Übersetzung konnte große Fortschritte in den vergangenen Jahren verzeichnen. Der aktuellste Ansatz in der maschinellen Übersetzung sind neuronale maschinelle Übersetzungssysteme, die auf künstlichen neuronalen Netzwerken beruhen. Neuronale maschinelle Übersetzungssysteme können (in manchen Sprachrichtungen) durch natürlichsprachlich klingende Übersetzungen überzeugen und erfreuen sich daher zunehmender Beliebtheit. Allerdings können diese flüssig lesbaren Übersetzungen über inhaltliche Fehler, die die Botschaft eines Textes gänzlich ändern können, hinwegtäuschen. Daher sollten (neuronale) maschinelle Übersetzungssysteme nicht als Ersatz von professionellen ÜbersetzerInnen betrachtet werden. Sie können allerdings als ein hilfreiches Werkzeug in der übersetzerischen Tätigkeit eingesetzt werden.

Die Qualität der neuronalen maschinellen Übersetzung hängt von der Menge und der Qualität der Sprachressourcen ab, mit denen das System trainiert wurde. Das bedeutet auch, dass neuronale maschinelle Übersetzungssysteme unterschiedlich gute Qualität für verschiedene Sprachrichtungen liefern.

Arten von maschinellen Übersetzungssystemen

Grundsätzlich kann man maschinelle Übersetzungssysteme aufgrund ihres Ansatzes unterscheiden:

  • regelbasierte maschinelle Übersetzungssysteme beruhen auf Sprachalgorithmen und Wörterbüchern, die unter anderem semantische, grammatische und morphologische Angaben enthalten. Die Ergebnisse sind konsistent, d.h. derselbe Satz wird immer auf dieselbe Art und Weise übersetzt, und grammatikalisch richtig. Allerdings sind die Übersetzungen in manchen Fällen relativ holprig zu lesen.
  • statistische maschinelle Übersetzungssysteme werden mit großen Datenmengen, sogenannten Parallelkorpora, trainiert. Das System berechnet Häufigkeiten und die Nähe von bestimmten Strukturen. Die Ergebnisse sind relativ gut lesbar, allerdings weniger konsistent.
  • neuronale maschinelle Übersetzungssysteme basieren auf künstlichen neuronalen Netzen, die auf Grundlage von großen Datenmengen (ähnlich wie die statistischen maschinellen Übersetzungssysteme) selbst "lernen". Da dieser Prozess allerdings intransparent ist, spricht man auch von einer Black Box. Die Ergebnisse sind sehr gut lesbar und weniger konsistent.

Andere Unterscheidungsmöglichkeiten von maschinellen Übersetzungssystemen sind:

  • kostenlos oder kostenpflichtig: Bei der Verwendung von kostenlosen maschinellen Übersetzungssystemen (wie Google Translate oder DeepL) gilt es die jeweiligen Nutzungsbedingungen zu beachten. Sämtliche Nutzungsrechte des Ausgangstextes und dessen Übersetzung werden in vielen Fällen an die jeweiligen Anbieter abgetreten. Dies kann nicht nur bei vertraulichen Inhalten zu rechtlichen Konsequenzen führen, sondern auch gegen die Datenschutzgrundverordnung (DSGVO) verstoßen, wenn Texte mit personenbezogenen Daten eingegeben werden. Die Verwendung dieser Systeme bedeutet also eine Weitergabe von Daten an Dritte. Bei kostenpflichtigen Systemen gibt es die Möglichkeit, das maschinelle Übersetzungssystem auf dem eigenen Server zu installieren oder Lizenzen bzw. Software as a Service (SaaS) zu erwerben.
  • generische oder angepasste Systeme: Generische Systeme bzw. Universalsysteme werden mit vielen verschiedenen Textsorten aus unterschiedlichsten Sach- und Fachgebieten trainiert. Angepasst bzw. domänadaptierte Systeme wiederum werden auf ein bestimmtes Fachgebiet (und dessen typischen Textsorten) trainiert, damit der korrekte Stil (und idealerweise auch die korrekte Terminologie) in dem jeweiligen Bereich in der Übersetzung verwendet wird.

Ein Beispiel für ein angepasstes System ist der EU Council Presidency Translator, der für den österreichischen EU-Ratsvorsitz 2018 entwickelt wurde.