{"id":8472,"date":"2017-02-13T08:10:23","date_gmt":"2017-02-13T07:10:23","guid":{"rendered":"https:\/\/eurotext-ecommerce.com\/?p=5462"},"modified":"2024-10-08T11:22:36","modified_gmt":"2024-10-08T09:22:36","slug":"wussten-sie-schon-wie-man-woerter-zaehlt","status":"publish","type":"post","link":"https:\/\/eurotext.de\/blog\/wussten-sie-schon-wie-man-woerter-zaehlt\/","title":{"rendered":"Wussten Sie schon\u2026 wie man W\u00f6rter z\u00e4hlt?"},"content":{"rendered":"
Immer wieder kommt es vor, dass uns Kunden fragen, wie eigentlich die W\u00f6rteranzahl<\/strong> berechnet wird, die auch die Grundlage f\u00fcr Angebote<\/strong> und Rechnungen<\/strong> bildet. H\u00e4ufig haben diese Kunden selbst nachgerechnet und sind zu abweichenden Ergebnissen gekommen. Warum? Wir bringen ein wenig Licht in dieses komplexe Thema.<\/p>\n <\/p>\n Es w\u00e4re nat\u00fcrlich am einfachsten, wenn man nur die Ausgangstexte<\/strong> in eine Word-Datei kopieren m\u00fcsste. Dort kann man sich die Zahl der enthaltenen W\u00f6rter direkt anzeigen lassen. Aber so einfach ist es nicht. F\u00fcr eine korrekte Z\u00e4hlung muss der Ausgangstext n\u00e4mlich mit fr\u00fcheren \u00dcbersetzungen abgeglichen werden.<\/p>\n Abgeschlossene \u00dcbersetzungen werden bei Eurotext in einem Translation Memory<\/strong> \u2013 einem \u00dcbersetzungsspeicher<\/strong> \u2013 gespeichert. Diese lernende Sprachdatenbank erm\u00f6glicht es, \u00dcbersetzungen bei sp\u00e4teren Projekten wieder zu verwenden. Um mit den Texten m\u00f6glichst effizient arbeiten zu k\u00f6nnen, werden sie dabei in der Datenbank nicht als komplette Dokumente oder gar einzelne W\u00f6rter gespeichert, sondern werden in kleinstm\u00f6gliche Sinneinheiten, sogenannte Segmente<\/strong> zerlegt. Ein Segment kann ein einzelner Satz sein, aber auch eine \u00dcberschrift, ein Aufz\u00e4hlungspunkt in einer Liste oder der Inhalt einer Tabellenzelle. Ein Beispiel f\u00fcr ein solches Segment ist “Batterien sind im Lieferumfang nicht enthalten”<\/em>.<\/p>\n\n <\/p>\n Wenn ein neuer Text \u00fcbersetzt werden soll, wird dieser zuerst mit den gespeicherten Segmenten abgeglichen. Findet die Software im Translation Memory ein passendes Segment, dann muss dieses nicht erneut \u00fcbersetzt werden. Und der Kunde muss daf\u00fcr nat\u00fcrlich auch nicht noch einmal den vollen Preis bezahlen.<\/p>\n Aber was bedeutet “passendes Segment”? Hier kommt moderne \u00dcbersetzungstechnologie ins Spiel und vergleicht die Segmente anhand verschiedener Kriterien. Dabei werden nicht nur die Buchstaben ber\u00fccksichtigt, sondern auch Text-Formatierungen oder andere Meta-Informationen. Also ob z. B. ob es sich um eine \u00dcberschrift handelt, bestimmte W\u00f6rter fett gedruckt sind, ob sie mit Links versehen sind etc.<\/p>\n Nehmen wir an, unser Beispiel “Batterien sind im Lieferumfang nicht enthalten”<\/em> wurde in einem fr\u00fcheren Dokument bereits \u00fcbersetzt. Wenn sich exakt der gleiche Satz auch in dem neuen\u00a0 Text findet, handelt es sich um einen sogenannten 100%-Treffer <\/strong>oder 100%-Match<\/strong>.<\/p>\n\n <\/p>\n \u00dcbrigens: Auch ein 100%-Treffer muss vom \u00dcbersetzer sicherheitshalber gepr\u00fcft werden. Denn auch wenn das Segment v\u00f6llig identisch ist, k\u00f6nnte es sein, dass es in einem anderen Kontext steht und die \u00dcbersetzung daran angepasst werden muss. Die Software pr\u00fcft deshalb nicht nur das jeweilige Segment, sondern auch die Segmente davor und danach. Wenn auch die beiden identisch sind, handelt es sich um einen sogenannten 101%-Treffer<\/strong>.<\/p>\n Aber was, wenn das Segment nicht exakt passt? Wenn der Satz z.B. “Batterien sind nicht im Lieferumfang enthalten”<\/em> \u00a0lautet. Also die gleichen W\u00f6rter, aber in minimal anderer Reihenfolge<\/strong>.<\/p>\n\n <\/p>\n In diesem Fall berechnet die Software, wie gro\u00df die Abweichung ist, also das sogenannte Delta<\/strong>. Daraus wird das Gegenteil, also die Trefferquote<\/strong> errechnet. Diese wird in Prozent ausgegeben, z.B. 95%. Je h\u00f6her die Trefferquote, desto h\u00f6her ist die Wahrscheinlichkeit, dass die vorhandene \u00dcbersetzung verwendet werden kann. Bei diesem Beispiel klappt das problemlos, die kleine \u00c4nderung in der Satzstellung \u00e4ndert nichts an der Aussage, die \u00dcbersetzung bleibt gleich.<\/p>\n Aber eine hohe Trefferquote stellt keine Garantie f\u00fcr eine korrekte \u00dcbersetzung dar. Nehmen wir die beiden Beispiele “Batterien im Lieferumfang nicht enthalten”<\/em> und \u00a0“Batterien sind im Lieferumfang enthalten”<\/em>.<\/p>\n\n <\/p>\n In beiden F\u00e4llen ist der Unterschied zum alten Text nur ein Wort. Beim ersten fehlt das “sind”<\/em>, beim zweiten das “nicht”<\/em>. Die formale Abweichung<\/strong> ist also sehr gering und rein rechnerisch fast identisch. Inhaltlich sieht es aber ganz anders aus: Die vorhandene \u00dcbersetzung w\u00e4re im ersten Fall korrekt, im zweiten komplett falsch. \u00a0Aus diesem Grund m\u00fcssen auch gute Treffer stets von einem Fach\u00fcbersetzer gepr\u00fcft und ggf. korrigiert werden.<\/p>\n Kommen wir wieder zur\u00fcck zum eigentlichen Thema W\u00f6rterz\u00e4hlung<\/strong>: Wie wirken sich die verschiedenen Trefferquoten darauf aus? Werden 90%-Treffer zu 90% mitgez\u00e4hlt?<\/p>\n Nein. Stattdessen sortiert die Software die Segmente nach Trefferquote. \u00a0Erst dann werden die W\u00f6rter der betreffenden Segmente gez\u00e4hlt. In der Auswertung findet sich die W\u00f6rterzahl dann aufgeschl\u00fcsselt f\u00fcr alle Segmente mit der gleichen Trefferquote.<\/p>\n Die Analyse sieht dann z.B. so aus:<\/p>\n\n <\/p>\n F\u00fcr jeden Trefferbereich gibt es entsprechende Preise. Neu\u00fcbersetzungen werden voll berechnet, W\u00f6rter mit einer hohen Trefferquote nur teilweise und “Volltreffer” unter Umst\u00e4nden gar nicht. F\u00fcr das Angebot oder die Rechnung muss die Anzahl der W\u00f6rter nur noch mit den passenden Wortpreisen multipliziert werden. Fertig.<\/p>\n Moderne Technologien haben \u00dcbersetzungen deutlich einfacher, schneller und auch g\u00fcnstiger gemacht. Im Bereich der W\u00f6rterz\u00e4hlung aber auch etwas komplexer. F\u00fcr den Kunden ist deshalb nicht immer auf den ersten Blick nachvollziehbar, wie diese Zahlen zustanden kommen. Wir hoffen, wir konnten trotzdem f\u00fcr ein bisschen Klarheit sorgen.<\/p>\nKosten sparen durch “\u00dcbersetzungs-Recycling”<\/h2>\n
Geringe Abweichung, hohe Qualit\u00e4t<\/h2>\n
Formaler Treffer, inhaltlicher Flop<\/h2>\n
Fazit<\/strong><\/h2>\n
Weitere Infos zu Translation Memorys:<\/strong><\/h2>\n