Als Google kürzlich die Pixel Buds – kabellose Ohrhörer mit Google Assistent – vorstellte, sorgte vor allem ein Feature für große Aufregung: Die Pixel Buds ermöglichen eine gesprochene Echtzeit-Übersetzung in viele Sprachen! Dabei ist dieses Feature nicht wirklich neu und nur ein Höhepunkt von vielen, die momentan im Bereich der maschinellen Übersetzung zu beobachten sind. Wir betrachten deshalb, was aktuell schon möglich ist – und was nicht.

Der persönliche Simultanübersetzer für die Hosentasche

Um noch einmal auf Googles Ohrhörer zurückzukommen: Google bietet mit Google Translate schon lange eine automatische Übersetzung von Texten, wobei die Ergebnisse bislang eher mittelmäßig waren. Diese Übersetzungen ließen sich wenig später auch vorlesen. Mit dem sprachgesteuerten Google Assistent kam die Möglichkeit hinzu, nicht nur geschriebenen Text einzugeben, sondern auch Gesprochenes erkennen und übersetzen zu lassen. In der Summe gibt es die Möglichkeit, Texte zu sprechen und von Google in Echtzeit übersetzen und vorlesen zu lassen, also schon eine Weile. Neu an den Pixel Buds ist eigentlich nur, dass dieses Feature hier geschickt mit Hardware kombiniert und mit einigem Marketingaufwand der Öffentlichkeit vorgestellt wurde. Verdenken kann man es Google aber natürlich nicht, dass sie dieses fraglos beeindruckende Feature nun auch als eigenständiges Produkt verkaufen.

Maschinen lernen Verstehen und Sprechen

Wenden wir uns wieder der geschriebenen Sprache zu: Die Entwicklungen dort mögen zwar auf den ersten Blick nicht so spektakulär sein, sind bei näherer Betrachtung aber noch beeindruckender. Denn die allgegenwärtigen Zauberworte “KI“, “neurale Netze” und “Deep Learning” sind auch im Bereich der Machine Translation (maschinellen Übersetzung) angekommen und haben dort – wie überall – zu einem echten Entwicklungssprung geführt.

Bestes Beispiel ist das Kölner Start-up DeepL, das schon seit Jahren mit der Übersetzungs-Website Linguee im Internet aktiv ist. DeepL hat einen eigenen Deep Learning-Ansatz entwickelt und verwendet sogenannte Convolutional Neural Networks (Convnets). Dazu betreibt die Firma in Island (wo der Strom günstig ist) einen extrem leistungsstarken Supercomputer. Mit 5,1 Petaflops kann dieser Rechner eine Million Worte in weniger als einer Sekunde übersetzen. Das war aber nur der erste Schritt. Im nächsten musste die Software die verschiedenen Sprachen lernen. Dazu wurde eine riesige Menge mehrsprachiger Texte benötigt, anhand derer das Programm lernen konnte, wie Sprache funktioniert, Grammatik und Satzstrukturen zu analysieren und Textinhalte unabhängig von der Sprache zu verstehen sind. DeepL konnte dabei auf die Ressourcen von Linguee zurückgreifen, wo bereits große Mengen mehrsprachiger Texte vorhanden waren. Das Ergebnis ist ein kostenloses Tool ähnlich Google Translate, mit dem Text in beliebigen Sprachpaarungen zwischen Englisch, Deutsch, Französisch, Spanisch, Italienisch, Niederländisch und Polnisch übersetzt werden kann. Weitere Sprachen (Mandarin, Japanisch und Russisch) sollen demnächst folgen.

Was bringt es in der Praxis?

Hat sich dieser enorme technische Aufwand gelohnt? Vergleicht man die Übersetzungsqualität von DeepL mit der maschinellen Übersetzung von Google Translate, ist der Unterschied enorm. Google übersetzt (zumindest gefühlt) Wort für Wort und erzeugt damit Texte, die je nach Qualität des Ausgangstextes zwischen verständlich und völlig wirr rangieren. Fehlerfrei sind die Übersetzungen selten, von einer natürlichen, menschlichen Sprache sind sie weit entfernt. Bei einfachen Texten ist es mit Google Translate möglich, sich einen Überblick über den Inhalt zu machen, anspruchsvolle bleiben meist unverständlich. Für mehr reicht die Qualität einfach nicht aus.

google
Bei einfachen Texten liefert Google verständliche, wenn auch nicht optimale Ergebnisse. © Screenshot translate.google.com

 

Demgegenüber sind die Übersetzungen von DeepL, zumindest mit den von uns getesteten Texten, wesentlich besser. Die Satzstrukturen wirken natürlicher, es fließen Floskeln und sehr menschliche Formulierungen in den Text ein und Fachtermini werden korrekt übertragen. Natürlich sind auch diese Übersetzungen nicht frei von Fehlern: Gerade wenn es um Aufzählungen oder Stichpunkte geht, finden sich häufig Begriffe, die zwar eine mögliche Übersetzung sind, in diesem Kontext aber nicht passen. Sobald es sich aber um längere Texte handelt, scheint DeepL, ähnlich wie ein menschlicher Übersetzer, den Kontext zu verstehen und verwendet die korrekten Übersetzungen.

deepl
Die Unterschiede zwischen Google und Deepl sind bei diesem einfachen Beispiel gering. Interessant wird es bei anspruchsvolleren Texten. © Screenshot deepl.com

Ein spannendes Thema. Ein heikles Thema.

DeepL ist nicht der einzige Versuch, lernende Computerprogramme für Übersetzungen zu nutzen. Google, Microsoft und Facebook versuchen damit ihren Anwendungen ein besseres Textverständnis anzutrainieren. Auch in der Übersetzungsbranche arbeiten einzelne Firmen bereits mit dieser Technik. So gibt es mittlerweile die Möglichkeit, moderne MT-Systeme mithilfe einer API an professionelle CAT-Tools wie memoQ und SDL Trados anzubinden. Das ermöglicht Übersetzungsdienstleistern, die Machine Translation reibungslos in bestehende Übersetzungs-Workflows zu integrieren,  inkl. dem Einbezug von Fachübersetzern, Terminologiedatenbanken und Qualitätssicherungsverfahren.

Was kann Machine Translation? Und was nicht?

Eine menschliche Fachübersetzung ist einer geprüften MT-Übersetzung qualitativ nach wie vor klar überlegen. Machine Translation eignet sich auf dem aktuellen Entwicklungsstand nur für bestimmte Textsorten. Dazu zählen beispielsweise umfangreiche Produktbeschreibungen oder Texte zur firmeninternen Kommunikation. Wichtig ist, dass die Texte möglichst neutral und emotionslos geschrieben sind und auch ohne Kontext verstanden werden können. Hier entfaltet MT seinen Nutzen: Umfangreiche Textmengen können schnell übersetzt werden, und das zu deutlich geringeren Kosten. In jedem Fall muss die Übersetzung durch einen geeigneten Linguisten geprüft werden. Das passiert mithilfe softwaregestützter QA- & Term-Checks oder einem Korrektorat, das offensichtliche Fehler sucht und behebt.

Aber: wer viel Zeit in hochwertigen Content steckt, sollte diesen nicht maschinell übersetzten lassen. Gerade hier sind erfahrene menschliche Übersetzer gefragt, die Texte sprachlich und fachlich korrekt übertragen und dabei auch an die Erwartungen und Gewohnheiten der Zielmärkte anpassen – Stichwort zielgruppengerechte Ansprache. Sprachlich anspruchsvolle Texte, die kreativ mit Sprache umgehen, emotionale Werbetexte oder Texte, die rechtliche Themen behandeln oder sicherheitsrelevant sind, sollten ausschließlich von Menschen übersetzt werden. Denn ein Mensch kann ganz bewusst den Stil eines Textes beeinflussen: Handelt es sich um einen werblichen Text, der den Leser emotional ansprechen und mitreißen soll? Oder eher um einen Gebrauchstext, der neutral und präzise formuliert werden muss? Gibt es eine bestimmte Zielgruppe, sollen Fachtermini verwendet werden, hat der Text einen Nutzen, der über die reine Kommunikation hinausgeht? Wird eine Botschaft „zwischen den Zeilen“ versteckt? Wird jemand zitiert oder auf etwas Bestimmtes Bezug genommen? Wird Sprache kreativ gebraucht, zum Beispiel für Wortspiele oder Wortneuschöpfungen, die gerade im Marketingbereich weit verbreitet sind? Um das zu erkennen, ist es zwingend notwendig, die Unter- und Zwischentöne des Textes zu verstehen.

Jaroslaw Kutylowski, Chief Technology Officer von DeepL, hat dazu in einem Interview gesagt, dass unter anderem auch journalistische Texte eine große Herausforderung darstellen, weil diese häufig Metaphern und andere Stilmittel enthalten, die sich nur schwer übersetzen lassen. Denn in all diesen Fällen sind Transferleistungen notwendig, die von Computern momentan noch nicht erbracht werden können.

Wo geht die Reise hin?

Machine Translation ist gerade dabei, sich bestimmte Nischen zu erschließen. Wie schon erwähnt, kann es dazu genutzt werden, einfache und umfangreiche Texte zu übersetzen, um sie anschließend von einem professionellen Übersetzer freigeben zu lassen. Dieser Trend wird mit zunehmender Qualität sicher noch weiter zunehmen. Wer allerdings anspruchsvolle Texte übersetzen lassen möchte und bei sicherheits- oder haftungsrelevanten Textsorten Wert auf Fehlerfreiheit legt, wird auch auf absehbare Zeit mit einem muttersprachlichen Fachübersetzer am besten beraten sein.

Wie steht Eurotext zum Thema Machine Translation?

Wir beobachten die Entwicklungen mit großem Interesse, aber auch mit einer gesunden Portion Skepsis. Für geeignete Textsorten und in Rücksprache mit unseren Kunden setzen wir diese Technik ein, jedoch immer in Kombination mit unseren Linguisten und innerhalb der Eurotext-Übersetzungsumgebung. Unser Hauptaugenmerk liegt weiterhin auf menschlichen Fachübersetzungen mithilfe unserer serverbasierten Übersetzungsumgebung, bewährten Translation-Memory-Technologien und Fach- und Keyword-Termbanken, mit denen unsere muttersprachlichen und kundenspezifisch konsolidierten Länderteams arbeiten.

Quellen:

 

autor_eurotext_100Autor: Eurotext Redaktion

Wir erklären, wie Internationalisierung funktioniert, geben Tipps zu Übersetzungsprojekten und erläutern Technologien und Prozesse. Außerdem berichten wir über aktuelle E-Commerce-Entwicklungen und befassen uns mit Themen rund um Sprache.