Machine Translation (MT) ist nicht neu, schon seit den 1960er Jahren sind maschinelle Übersetzungen ein Thema. Zu Beginn beschäftigte sich vor allem die Forschung damit, dann - mit Aufkommen von Google Translate und den damit erzeugten oft unbeabsichtigt unterhaltsamen Ergebnissen - auch die Medien. 2016 erfolgte der Durchbruch für anwendungsfähige neuronale Machine Translation. Eine rasante Entwicklung für Sprachen und Services kam in Gang.
Heute sind maschinelle Übersetzungen aus dem privaten Umfeld und auch dem Geschäftsalltag nicht mehr weg zu denken. Nutzer können beliebige Texte und sogar Office-Formate in frei verfügbare Machine-Translation-Systeme eingeben und erhalten innerhalb von Sekunden ein Ergebnis. Die maschinelle Übersetzung wird dabei immer häufiger in andere Business-Systeme integriert, um internationale Prozesse zu vereinfachen und Inhalte schnell weltweit zu distribuieren. Und auch für die schnelle Informationsgewinnung setzen immer mehr Unternehmen auf eine maschinelle Übersetzungslösung, beispielsweise durch Anbindung eines Tools ins firmeneigene Intranet.
Übersetzungs-Tools: Fallstricke
"Für Englisch reicht uns jetzt DeepL, da lesen wir nochmal drüber und dann passt das" - diesen Satz haben Sie sicher auch schon gehört. Mit Blick auf Zeit und Kosten nutzen Unternehmen diese und andere Übersetzungs-Tools mittlerweile eben auch für die offizielle Unternehmenskommunikation. Doch Vorsicht: Keinem Machine-Translation-System gelingt es bis heute, Präsentationen und Dokumentationen, Fach- und Produkttexte wirklich fehlerfrei und konsistent zu übersetzen.
Die Nutzung solcher Tools birgt also einige Risiken. Das gilt für das von vielen gut beherrschte Englisch, aber noch viel mehr für Texte in Sprachen, die man nicht kennt, also auch nicht überprüfen kann. Hier kann es zu groben Schnitzern kommen, die im schlimmsten Fall das Unternehmens-Image beschädigen. Außerdem entstehen dabei konkrete Fehlerquellen für Anwendungen und Produktionen. Angesichts der begeisternden Möglichkeiten durch DeepL und Co. sind sich die Nutzer dessen oft nicht bewusst. Die Sache mit den Online-Übersetzern hat gleich neun Haken:
Haken 1: Kleine, teils subtile Fehler. Ein ausgelassenes "nicht", ein falscher Bezug, unbekannte Wörter, die nicht übersetzt oder als Fantasiebegriffe ausgegeben werden: All das fällt oft nicht gleich ins Auge, ändert aber Kontext und Bedeutungen.
Haken 2: Manchmal werden Satzteile ausgelassen oder Texte frei ergänzt, was vor allem in komplett fremden Sprachen nicht auffallen wird.
Haken 3: Texte haben im Original oft Umbrüche (Hard Returns), die nicht gleich erkennbar sind. Für das Machine-Translation-System verändern sich damit aber Sinnzusammenhänge. Es versucht dann, jeden Textteil für sich sinnvoll zu übersetzen.
Haken 4: Unbeabsichtigte Missachtung von Datenschutzregeln. Nutzer geben arglos alles in frei verfügbare Machine-Translation-Systeme ein. Doch diese speichern die Texte, um sie für Re-Training und Lernen zu nutzen. Geht es um den Speiseplan in der Kantine, wird das keine Rolle spielen. Bei internen Informationen, Forschungsergebnissen und Patentanmeldungen kann es dagegen schnell kritisch werden.
Haken 5: Unternehmensspezifisch korrekte Übersetzungen sind auf entsprechend trainierte Maschinen angewiesen. Das setzt viel sauberes Trainingsmaterial und einen hohen Aufwand voraus, der in der Kosten-Nutzen-Relation stimmen muss. Frei verfügbare Maschinen liefern zwar schnell und günstig Ergebnisse, können aber keine Unternehmensspezifika oder individuellen Stilvorgaben abbilden.
Haken 6: Je mehr spezifische Fachtermini ein Text enthält, desto weniger geeignet sind allgemein verfügbare MT-Systeme. Terminologievorgaben können allerdings mittlerweile von einigen Systemen in Form eingebundener Glossare umgesetzt werden. Das erfordert eine Aufbereitung der Terminologie und vor allem natürlich überhaupt gezielte Vorgaben. Die meisten Systeme übersetzen einfach “wie gelernt” und damit eventuell völlig an den Unternehmenserwartungen vorbei.
Haken 7: Mangelnde Reproduzierbarkeit. Freie Machine-Translation-Systeme übersetzen heute anders als morgen, weil sie kontinuierlich lernen. Ein Unternehmenstext kann also in sechs Monaten anders ausgegeben werden, wenn er aufgrund einer Überarbeitung erneut gebraucht wird.
Haken 8: Sprachunterschiede. Systeme für maschinelle Übersetzungen liefern für einige Sprachen gute Ergebnisse, sind für andere aber kaum nutzbar. Je nach Größe des Trainingskorpus (Umfang verfügbarer Trainingsdaten) und Komplexität der Sprache können bei unterschiedlichen Machine-Translation-Anbietern unterschiedliche Ergebnisse entstehen.
Haken 9: Maschinelle Übersetzung liefert bei Mehrdeutigkeiten im Ausgangstext die statistisch wahrscheinlichste Übersetzung für einen eingegebenen Text. Anders formuliert: sie rät. Für ein geschlechtsneutrales “teacher” auf Englisch muss das MT-System für die deutsche Übersetzung zwischen “Lehrer” und “Lehrerin” unterscheiden. Für Grundschulen fällt die Wahl meist auf “Lehrerin”, für höhere Schulen auf “Lehrer”. Und schon ist man als eigentlich diverses und offenes Unternehmen tief drin in den Themen Gender Bias, tradierte Rollenbilder und Diskriminierung.
Machine Translation: DeepL vs. Systran vs. SDL
DeepL: Vergleicht man Anwendungen und Möglichkeiten, gibt es einige Genre-prägende Machine-Translation-Systeme, allen voran DeepL, den Gamechanger. Wie kein anderes System für maschinelle Übersetzungen hat DeepL den Markt umgekrempelt und schneidet in den meisten Vergleichen am besten ab. Das Übersetzungs-Tool lernt schnell und ist in einer Basisversion frei verfügbar. Es bietet eine Auswahl von aktuell 29 Sprachen, darunter je zwei Englisch- und Portugiesisch-Varianten (für UK und USA beziehungsweise Portugal und Brasilien). Es handelt sich um ein deutsches Unternehmen mit Servern in Europa. Datensicherheit wird erst in der Pro-Version als Kauf-Abo gewährleistet.
Systran: Als "Übersetzungstool für Fachleute" positioniert sich Systran, das schon seit 40 Jahren am Markt verfügbar ist und alle Entwicklungen mitgemacht hat. Systran bietet eine große Sprachvielfalt, auch wenn vieles über die Relaissprache Englisch geht. Kunden können die Maschine individuell trainieren lassen oder vorgefertigte domänenspezifische Maschinen nutzen, die mit bestimmten Sachgebietstexten trainiert wurden. Ähnlich aufgestellt sind zum Beispiel auch die Anbieter KantanMT, Globalese, Textshuttle oder Tilde.
RWS Language Cloud: Und dann gibt es Machine-Translation-Systeme, die aus der Übersetzungsbranche hervorgegangen sind, wie zum Beispiel RWS Language Cloud. Sie offerieren eine direkte Integration in marktführende CAT-Tools (Computer-Aided Translation), die von Übersetzern weltweit direkt und arbeitserleichternd genutzt werden können - aber auch die Gefahr bergen, dass maschinelle Übersetzung verdeckt im Hintergrund läuft und als klassische Übersetzung deklariert und verkauft wird.
Welche Unterschiede bei der Nutzung auftreten, veranschaulicht ein Vergleich der drei genannten Systeme für maschinelle Übersetzungen, mit denen jeweils die gleichen niederländischen Kurztexte aus dem Bereich Software übersetzt wurden. Schon die erste Überprüfung zeigt: Ausgelassene Inhalte, Schwierigkeiten mit Sonderzeichen, Platzhalter und Tags. Zwei von drei Maschinen mischen die Anredeform, insgesamt weicht der Output teilweise voneinander ab:
Maschinelle Übersetzung: Erfolgsfaktoren
Machine Translation ist auch bei Sprachdienstleistern angekommen. Sie hilft, Übersetzungen - vor allem in großer Stückzahl - schnell und günstig anbieten zu können. Entscheidend hierfür sind drei Faktoren.
Machine Translation + Post-Editing (MTPE): Für Ergebnisse, die mit der Humanübersetzung vergleichbar sind, braucht es ausgebildete Post-Editoren. Gemeint sind muttersprachliche Übersetzer und Linguisten, die maschinelle Vorübersetzungen prüfen und systematisch nachbearbeiten. Sie müssen mit dem Kontext vertraut sein und den Zeit- und Kostenaspekt im Blick behalten. Je nach Textsorte und Sprache fallen unterschiedliche Korrekturen an. Erfahrungsgemäß werden mindestens 25 Prozent, meistens aber bis zu zwei Drittel des maschinellen Ergebnisses angepasst beziehungsweise überarbeitet. Das gilt auch für Texte, die auf den ersten ungeübten Blick gut aussehen.
Terminologie-Management: Im Gegensatz zu trainierten Algorithmen kennen die allgemein verfügbaren Übersetzungsmaschinen keine unternehmensspezifische Terminologie. Sie geben Texte je nach gelerntem Wortschatz und Kontext von einem Satz zum anderen inkonsistent aus. Für eine konsistente und korrekte Kommunikation mit Kunden, Geschäftspartnern und Kollegen ist eine übergeordnete Instanz in Form einer Terminologie-Datenbank nötig, die die spezifische Sprache eines Unternehmens abbildet und klare Vorgaben macht.
Translation Memory: Sind Texte bereits übersetzt worden, oder sie liegen in ähnlichen Varianten vor, müssen sie nicht neu übersetzt, sondern lediglich im Kontext geprüft und überarbeitet werden. Übersetzungen werden dafür in Translation-Memory-Systemen (TMS) gespeichert und neue Texte mit diesen abgeglichen. Auch ähnliche Sätze, in denen vielleicht drei Wörter anders sind, werden aus dem TMS übernommen und angepasst. Um zu verhindern, dass vorhandene Texte, ältere Broschüren etwa, komplett anders aussehen, braucht es das produktive Zusammenspiel aus Übersetzungsspeicher und Abfrage ans Machine-Translation-System für alle Textpassagen.
Im Idealfall werden für die professionelle Verwendung maschineller Übersetzungen alle drei Komponenten genutzt - vor allem deren Synergien untereinander. Trotz dieser Fortschritte ist der menschliche Übersetzer keineswegs überflüssig. Fehlerfrei ist bis dato noch kein System für maschinelle Übersetzung, und Posteditoren nehmen immer noch eine Schlüsselrolle ein. Gute Übersetzungen in einem wirtschaftlichen Umfeld verlangen nicht nur sprachliches, sondern auch technisches und wirtschaftliches Know-how.
Was heißt all das für professionelle Übersetzerinnen und Übersetzer? Machine-Translation-Systeme sind nicht als Konkurrenz und Gefahr zu sehen, sondern als Produktivitätsfaktor und neues Betätigungsfeld. Unternehmen werden mit den kostenlosen Systemen in der professionellen Kommunikation schnell an ihre Grenzen stoßen. Sie sollten auf trainierte Maschinen und versierte Sprachdienstleister setzen. In der Geschäftskommunikation sollte nicht an der falschen Stelle gespart werden, es gilt vielmehr Sprachverwirrungen und Inkonsistenzen, Missverständnisse und folgenschwere Anwendungsfehler zu vermeiden. Deren Kosten sind im Zweifel um ein Vielfaches höher. (hv)