Am Marterpfahl der Polyseme

Januar 17, 2023

In diesem Artikel geht es unter anderem um Beispiele für schlechte maschinelle Übersetzungen. Schlechte Übersetzungen sind oft lustig. Das Lachen vergeht einem schnell, wenn man selbst Übersetzer ist.

Übersetzer fertigen heutzutage in vielen Fällen die Übersetzung nicht selbst an, sondern post-editieren sie. D. h. sie erhalten eine maschinell übersetzte Rohversion vom Kunden und bringen diese in die Endform.

Die Reaktionen von Übersetzern schwanken dabei erfahrungsgemäß zwischen Heiterkeit und Verzweiflung.

Am Ende erkunden wir, was schlechte maschinelle Übersetzungen (Machine Translation, MT) noch mit uns machen, außer für Heiterkeit zu sorgen.

Sehen wir uns zunächst eines der Probleme an: Polyseme.

Was sind Polyseme?

Polysemie bedeutet so viel wie Mehrdeutigkeit, d. h. eine Benennung kann mehrere Bedeutungen haben. Beispiele im Deutschen sind “Flügel”, “trocken” oder “Wurzel”.

 

In einer Studie zum Spracherwerb bei Kleinkindern im Hinblick auf Polyseme geben Forscher der Universität Princeton an, dass 40 bis 80 % aller Wörter im Englischen Polyseme sind. Beispiele sind “run”, “set” oder “through”.

Die konkrete Bedeutung eines Wortes leiten wir in der Regel aus dem Kontext und unserem Weltwissen ab.

Was bei einer maschinellen Übersetzung mit Polysemen geschehen kann, sehen wir uns in den folgenden Beispielen an.

Beispiele für MT-Pannen

Die MT hat hier mit der Mehrdeutigkeit von “caps”, “camel” und “casing” zu schaffen. Eine mögliche Übersetzung wäre “Großschrift oder Binnenmajuskel ist nicht zulässig.” “Camel casing” bedeutet übrigens, dass die einzelnen Bestandteile von Komposita groß geschrieben werden, z. B. “PowerPoint”.

Hier schon wieder: Polysemie. “Check in” kann im Englischen ziemlich viel bedeuten. Laut Merriam Webster bedeutet “to check in with” so viel wie “to talk with (someone) in order to report or find out new information”. In diesem Fall also so etwas wie “Zeit für sich nehmen”.

Hier ist der Satzbau einfach so simpel, dass er wieder schwierig ist. Irgendwie fehlt da was im Satz, und “denken” ohne Präposition geht zwar im Englischen, im Deutschen aber ganz und gar nicht. Merriam Webster schlägt hier für “think” die Bedeutung “to center one’s thoughts on” vor, und das trifft es ja auch ganz gut. Wem hier jetzt spontan eine idiomatische Übersetzung einfällt, sollte sich bei uns als freiberuflicher Mitarbeiter melden.

Dieser Fall ist ziemlich offensichtlich: “file” kann nicht nur Datei heißen, sondern auch “Feile”. Hieße es im Englischen “file size” anstatt “file weight”, hätte die MT es vielleicht hinbekommen.

Hier gibt es gleich zwei Baustellen: “Community” und “Feed”. In diesem Kontext bleibt beides auf Englisch und mit einem Bindestrich verbunden, Community-Feed, oder zusammengeschrieben, Communityfeed.

Community ist übrigens schwierig ins Deutsche zu übersetzen. Man kann sich in den meisten Situationen mit “Community”, “soziales Umfeld” oder ähnlichen Konstrukten aus der Affäre ziehen. “Gemeinde” oder “Kommune” ist fast nie richtig.

Hier sieht man eine Kombination aus Polysemie und nicht erkannter Redewendung. “jaw dropping” heißt hier so viel wie “außergewöhnlich” oder “einzigartig”.

Die MT scheint sich ziemlich gut in der Umgangssprache auszukennen.

“polish” heißt hier natürlich nicht “polnisch” sonder hat etwas mit einem Poliervorgang zu tun.

“resolution” kann Vieles heißes, “Entschlossenheit” ist aber garantiert unrichtig.

Polyseme lauern an völlig unverhofften Stellen, diesmal in der Türkei.

Als Bonus ein Satz, der aus mehreren Gründen völlig daneben ging:

Können Menschen es besser?

Kommen wir nun zum Wesentlichen.

Kann es sein, dass der verantwortungslose Konsum von maschinellen bzw. schlechten Übersetzungen dazu führt, dass wir irgendwann unser Sprachgefühl verlieren? Dass die künstliche Intelligenz unser Gespür für grammatische Regeln nachhaltig beeinflusst? Dass wir seltsame Satz- und Wortkonstrukte irgendwann ganz passabel finden, wenn wir sie nur oft genug sehen?

Hier ein Beispiel aus der deutschen Presselandschaft (2021):

  1. “Du machst den Unterschied”: Im Englischen gibt es die Redewendung “to make a difference”, was so viel heißt wie “dein Beitrag ist wichtig” oder “du kannst etwas bewegen”. 

2. “Hat er einen Punkt?”: Im Englischen gibt es die Redewendung “to have a point”, was so viel heißt wie, dass jemand Recht hat oder dass sein Argument nachvollziehbar ist.

3. “Venue” (ganz unten im Screenshot): Zugegeben, “Veranstaltungsort” oder “Austragungsort” ist etwas lang, aber ist das Grund genug, stattdessen ein Wort zu verwenden, dessen Bedeutung unklar ist bzw. bei dem man nicht weiß, ob es englisch oder französisch ausgesprochen wird?

Fazit

In diesem Artikel haben wir gesehen, was Polyseme sind und wie schwierig sich die maschinelle Übersetzung damit tut. Für eine künstliche Intelligenz gilt hier allerdings das gleiche wie für Menschen: Aus Fehlern wird man klug. 

Denn je effizienter ein Algorithmus im Rahmen von Machine-Learning-Projekten darauf trainiert wird, dass “Turkey” mehr als eine Bedeutung hat, desto wahrscheinlicher ist, dass wir in Zukunft keine lustigen Übersetzungen mehr sehen werden.

Weiterhin haben wir gesehen, wie kreativ Menschen mit Sprache umgehen und wie neue Sprachtrends in die Welt gesetzt werden, insbesondere wenn sie von führenden Medien stammen.

Bemerkungen

Schreibe einen Kommentar

¡VERGLEICH!