Das Translation Memory ist zentraler Bestandteil der softwareunterstützten Übersetzung und aus dem modernen Übersetzungs-Workflow nicht mehr wegzudenken. Im Grunde handelt es sich beim Translation Memory (auch “Übersetzungsspeicher” oder “Übersetzungsarchiv” genannt) um eine Datenbank, in der alle Texte eines Projekts oder eines Kunden gespeichert sind. TMs sind jeweils bilingual, enthalten also den Text in der Ausgangssprache und einer Zielsprache. Bei Übersetzungen in mehrere Sprachen kommt für jede Sprachkombination ein separates TM zum Einsatz.
Analyse und Segmentierung
Um das TM sinnvoll nutzen zu können, ist es notwendig, den Ausgangstext vor dem Speichern zu segmentieren. Hierfür analysiert die Übersetzungssoftware den Text und zerlegt ihn in die kleinsten Bestandteile, die sich sinnvoll übersetzen lassen – also Sätze, Überschriften, Tabellenzellen, Listeneinträge etc. Das Programm sucht anhand einstellbarer Segmentierungsregeln nach bestimmten Kriterien und unterteilt den Text beispielsweise dort, wo auf einen Punkt ein Leerzeichen folgt oder wo ein Umbruch einen neuen Absatz einleitet. Die so entstandenen Segmente werden in der Datenbank einzeln gespeichert.
Dieses Verfahren lässt sich natürlich nicht nur für normale Sprache anwenden, sondern auch für Code wie z.B. HMTL- oder XML-Daten. Dort kann nach bestimmten Tags segmentiert werden, die den Code in sinnvolle Einheiten gliedern, wie zum Beispiel </p>, </h1> oder </td>.
Zeit- und Kostenersparnis
Warum dieser Aufwand? Der Vorteil der Segmentierung ist, dass dadurch kleine Übersetzungseinheiten entstehen, die sich in zukünftigen Texten oder Projekten wiederverwenden lassen. Wenn in einer Anleitung wiederholt identische Warnhinweise stehen oder sich in einer Broschüre bestimmte Produktgruppenbezeichnungen wiederholen, wäre es unnötig und auch fehlerträchtig, diese immer und immer wieder übersetzen zu lassen.
Mithilfe des Translation Memorys können Texte vorübersetzt werden. Das heißt, das Programm überprüft, ob Teile des neuen Textes aus einer alten Übersetzung übernommen werden können. Hierzu wird ein Übereinstimmungswert (Match Rate) ermittelt. Dieser besagt, ob die Übersetzung gut oder schlecht passt. Wenn zum Beispiel ein Satz übersetzt werden soll, der in einem früheren Projekt schon einmal exakt so übersetzt wurde, einschließlich aller Formatierungen und Satzteichen, dann hat er eine Matchrate von 100% und kann bei der automatischen Vorübersetzung verwendet werden.
Der vorübersetzte Text wird dem Fachübersetzer vorgeschlagen und dieser muss ihn nur noch kontrollieren. Auf die Weise können einzelne Überschriften bis hin zu ganzen Kapiteln bei der Übersetzung ausgespart bleiben. Bei einem gut gepflegten TM lassen sich so durchschnittlich 30% der Textmenge in hoher Qualität vorübersetzen. Das spart nicht nur Zeit sondern auch Geld.
Natürlich kommt es bei Übersetzungen auch immer auf den Kontext an, in dem ein Satz oder ein Segment steht. Eine Übersetzung, die im einen Kontext korrekt ist, ist in einem anderen möglicherweise sinnentstellend. Deshalb betrachtet die Software auch immer das vorhergehende und nachfolgende Segment und berücksichtigt das bei der Bestimmung der Match Rate. Wenn ein Satz in einem früheren Projekt exakt so vorhanden war, und auch der vorhergehende und der nachfolgende identisch sind, beträgt die Match Rate 101%.
Ein Translation Memory – viele Formate
Translation Memorys lassen sich nicht nur für Textdokumente nutzen, sondern für alle Dokumente, die übersetzt werden können. Layoutdateien (z.B. INDD), Grafikdaten mit Textelementen (z.B. PSD, EPS), Tabellen und Datenbankexporte (XLS, CSV, XML) und auch Präsentationen (PPT). Für jedes Format kommen geeignete Filter zum Einsatz, die alle Elemente erkennen, die nicht übersetzt werden sollen oder nicht verändert werden dürfen (Bildelemente, Formatierungen, Programmcode…). Bestimmte Formatierungs-Elemente werden dem Übersetzer als Tags angezeigt, so dass er sie bei der Übersetzung berücksichtigen und ggf. an die richtige Position verschieben kann.
Auf die Weise profitieren Sie immer vom TM, egal in welchem Format die Daten vorliegen. Katalogtexte können für den Online-Shop wiederverwendet werden, Werbetexte von der Homepage werden für die Unternehmensbroschüre “recycelt”.
Datenpflege zahlt sich aus
Wie überall ist konsequente Datenpflege unerlässlich. Die Ausgangstexte müssen immer nach dem gleichem Schema segmentiert und gespeichert werden, um hohe Trefferquoten zu garantieren. Änderungen oder Korrekturen an Übersetzungen müssen zuverlässig ins TM übernommen werden, um zukünftige Fehler zu vermeiden. Außerdem sollte nicht vergessen werden, dass auch alte Übersetzungen von früheren Übersetzungsdienstleistern in das TM importiert werden können, sofern die Qualität stimmt. Bei Bedarf kann eine Analyse mit Lektorat zur Qualitätssicherung vorgenommen werden.
Fazit
Translation Memorys sind ein mächtiges Instrument, um hohe Qualität und dauerhaft niedrige Preise zu ermöglichen. Gerade bei Kunden mit hohem Übersetzungsaufkommen und sich wiederholenden Texten (Onlineshops, Kataloge, Handbücher, Marketing- und Werbematerialien) kann ein gut gepflegter Übersetzungsspeicher seine Stärken ausspielen und die Übersetzung deutlich beschleunigen und kostengünstiger gestalten.
Wenn Sie Fragen haben oder wissen möchten, wie Sie profitieren können, beraten wir Sie gerne.
Autor: Eurotext Redaktion
Wir erklären, wie Internationalisierung funktioniert, geben Tipps zu Übersetzungsprojekten und erläutern Technologien und Prozesse. Außerdem berichten wir über aktuelle E-Commerce-Entwicklungen und befassen uns mit Themen rund um Sprache.
Bitte beachten Sie: Auch wenn wir in unseren Beiträgen gelegentlich Rechtsthemen ansprechen, stellen diese keine Rechtsberatung dar und können eine solche auch nicht ersetzen. Wenn Sie konkrete Fragen haben, lassen Sie sich bitte von einem Anwalt beraten.