Maschinelle Übersetzung (MÜ) wird zur schnellen Verarbeitung großer Textmengen eingesetzt. Sie übersetzt nicht einfach Texte, sondern bietet auch die Möglichkeit, eine perfekt passende Botschaft für das Zielpublikum zu vermitteln. So wie ein Koch in einem renommierten Restaurant sorgfältig Zutaten und Techniken auswählt, um den Geschmack jedes Gastes zu treffen, muss die maschinelle Übersetzung den Anforderungen und kulturellen Nuancen des Zielpublikums gerecht werden.
Heutige Technologien ermöglichen es, maschinelle Übersetzung durch Personalisierung an die spezifischen Bedürfnisse der Menschen anzupassen. In diesem Artikel werden wir uns den Prozess der Personalisierung von MÜ-Engines genauer ansehen und wie Unternehmen davon profitieren können.

Aus welchen Gründen führt die maschinelle Übersetzung (MÜ) manchmal nicht zu zufriedenstellenden Ergebnissen?
Maschinelle Übersetzung ist für die allgemeine Textverarbeitung effektiv. Bei Fachtexten mit technischen, juristischen oder wirtschaftlichen Begriffen ist die Übersetzung jedoch wahrscheinlich ungenau. Dies liegt daran, dass dasselbe Wort in verschiedenen Kontexten mehrere Bedeutungen haben kann. Beispielsweise kann das Verb „ knacken “ im IT-Bereich ins Russische als „ hacken “ übersetzt werden und das Substantiv „ Bug “ kann sich auf ein Insekt oder einen Codierungsfehler beziehen. Die maschinelle Übersetzung hat Schwierigkeiten, die Bedeutung einer bestimmten Situation zu erfassen. Dies stellt eine erhebliche Herausforderung für Unternehmen dar, da sie ihre Aktivitäten häufig auf bestimmte Bereiche konzentrieren und ihre eigene Terminologie verwenden. Aus diesem Grund ist der Prozess der Anpassung der maschinellen Übersetzung notwendig.
Die Entwicklung der Anpassung der MÜ
Um die Vorteile der benutzerdefinierten maschinellen Übersetzung wirklich zu schätzen, ist es wichtig zu wissen, wie sie sich im Laufe der Zeit verändert hat. In der Vergangenheit waren für die Erstellung benutzerdefinierter neuronaler MÜ-Engines viele Ressourcen und technische Fähigkeiten erforderlich, was bedeutete, dass Unternehmen entweder viel Geld ausgeben oder sich auf externe Partner verlassen mussten.
Im Jahr 2017 begannen MT-Anbieter damit, die Anpassung für Sprachbegeisterte und Entwickler zugänglicher zu machen. Ein entscheidender Moment kam 2018, als Google AutoML einführte, das darauf abzielte, den Anpassungsprozess zu demokratisieren. Google-CEO Sundar Pichai betonte, dass AutoML einem größeren Kreis von Entwicklern die Entwicklung maßgeschneiderter neuronaler Netzwerke ermöglichen würde.
Heute hat sich die Situation geändert. Es gibt viele anpassbare Maschinenübersetzungs-Engines (MT), neben Basis-Engines, die eine gewisse Anpassung ermöglichen. Dies macht MT-Lösungen für Benutzer leichter zugänglich.
Definition der Anpassung maschineller Übersetzungen
Die Anpassung maschineller Übersetzungen ist ein Prozess der Anpassung maschineller Übersetzungs-Engines an spezifische Benutzeranforderungen, Kontexte und Vorlieben. Sie trägt dazu bei, die Qualität der Übersetzung in Spezialbereichen oder für bestimmte Aufgaben zu verbessern und die Übersetzung präziser, relevanter und auf die Bedürfnisse der Benutzer zugeschnitten zu machen.
Lassen Sie uns eine Analogie ziehen. Allgemeine maschinelle Übersetzung ist wie ein Student an einer Wirtschaftsuniversität. Sie haben ein Verständnis für das Fachgebiet, können grundlegende Aufgaben ausführen, aber es fehlt ihnen an einem tiefen Verständnis aller Prozesse. Eine kundenspezifische maschinelle Übersetzung ist wie ein erfahrener Business-Analyst, der sich an verschiedene Situationen und Kundenanforderungen anpassen kann. Dies ist eine genauere und effizientere Art der Übersetzung.
Was erfordert die MT-Anpassung?
Die MT-Anpassung umfasst mehrere Schlüsselkomponenten:
- Erstens stellt das Unternehmen sein eigenes Glossar mit Begriffen und deren Übersetzungen bereit.
- Zweitens ist eine Do Not Translate (DNT)-Liste erforderlich. Diese Liste muss den Namen des Unternehmens, Namen von Produkten oder Dienstleistungen sowie Wörter enthalten, die je nach Region unterschiedlich interpretiert werden können.
Der Anpassungsprozess erfordert die Übermittlung einer Liste mit Begriffen, die der MT-Engine Anweisungen gibt, wie sie diese genau übersetzen oder ob die Übersetzung vollständig vermieden werden soll, wodurch die Notwendigkeit zusätzlicher Bearbeitungen verringert wird.
Das Training für maschinelle Übersetzung (MT) ist eine fortgeschrittenere Stufe der MT-Anpassung.
Während sich das Anpassen von Modellen für die maschinelle Übersetzung auf die Verbesserung eines vorhandenen Modells konzentriert, umfasst das MT-Training die Erstellung eines neuen Modells und dessen Training anhand bestimmter Einstellungen. Für das erfolgreiche Training von Maschinenübersetzungs-Engines müssen mindestens 15.000 hochwertige, einzigartige, zweisprachige Segmente bereitgestellt werden. Dies ist ein deutlich teurerer Prozess, der sich auf lange Sicht auszahlen kann, obwohl er möglicherweise nicht für jedes Unternehmen geeignet ist.
Für das Training der MT-Engine werden zwei Arten von Daten verwendet: umfangreiche linguistische Korpora und Translation Memory.
Linguistische Korpora bestehen aus einer Vielzahl speziell aufbereiteter Texte, die in zwei oder mehr Sprachen vorliegen. Sie können verschiedene Genres und Stile abdecken, von literarischen Werken bis hin zur Umgangssprache.
Translation Memory (TM) ist ein Repository, in dem Texte in Segmenten gespeichert werden, die sowohl die Original- als auch die Zielsprachenversion enthalten. Die Software vergleicht ständig neue Segmente mit den bereits im Speicher gespeicherten und schlägt vor, vorhandene Übersetzungen zu verwenden.
Wie lange dauert der MT-Trainingsprozess?
Das Modell wird mehrmals mit denselben Daten trainiert, wobei jede Iteration die Ergebnisse des vorherigen Schritts verwendet, um den nächsten zu verbessern. Der Prozess selbst kann mehrere Tage bis mehrere Wochen dauern. Nach Abschluss des Trainings wird die Qualität des Modells anhand verschiedener Metriken und auch manuell von Experten bewertet. So lässt sich feststellen, wie effektiv das Modell seine Aufgabe erfüllt und ob es noch weiter optimiert werden muss. Der Erfolg des Trainings hängt von den Einstellungen, der Qualität und Vielfalt der Trainingsdaten und der Qualität der Verwaltung des Trainingsprozesses ab.
Welche Option soll man wählen: MT-Anpassung oder MT-Training?
Nehmen wir ein Beispiel: Sie benötigen ein maschinelles Übersetzungssystem für juristische Dokumente. In diesem Fall gibt es zwei Optionen:
MT-Anpassung: Sie beginnen mit einem vorab trainierten maschinellen Übersetzungssystem, das bereits über einige Übersetzungsfunktionen verfügt. Bei der Anpassung wird es an juristische Dokumente angepasst. Sie können die Modelleinstellungen anpassen, ein juristisches Wörterbuch hinzufügen und eine Liste Ihrer eigenen Begriffe einfügen, um die Genauigkeit der Ergebnisse zu verbessern. Da Sie mit einem vorhandenen Modell arbeiten, kann die Anpassung deutlich schneller sein als das Training eines ganz neuen Systems.
MT-Training: Sie bringen dem MT-System im Wesentlichen ein neues Sprachenpaar bei. Dies erfordert eine riesige Datenmenge und kann teuer und zeitaufwändig sein. Das Training umfasst komplexe Algorithmen, die die Daten untersuchen und lernen, wie man besser übersetzt. Dafür sind leistungsstarke Computer wie starke GPUs erforderlich, die viel Strom verbrauchen. Um die beste Trainingsmethode herauszufinden, einschließlich der Einrichtung und Einstellungen, müssen viele verschiedene Dinge ausprobiert und optimiert werden. Dies ist eine Aufgabe für Experten und kann lange dauern.
Einfacher ausgedrückt ist MT-Training wie der Bau eines ganz neuen Hauses, während der MT-Anpassung wie die Renovierung eines bestehenden Hauses ist. Die Wahl hängt von Ihren Zielen und Ressourcen ab. Wenn Ihrem Unternehmen ausreichend Daten für das Training sowie personelle und finanzielle Ressourcen fehlen, ist es besser, sich für MT-Anpassung zu entscheiden. Die laufenden Kosten für die Pflege des Glossars sind im Laufe der Zeit normalerweise günstiger als die mit dem MT-Training verbundenen Kosten.
Anpassung der maschinellen Übersetzung: Eine strategische Wahl für Unternehmen (Fazit)
Die Anpassung der maschinellen Übersetzung ist ein wichtiges Instrument, mit dem Unternehmen genauere und relevantere Übersetzungen erhalten und so die Kommunikation mit Kunden verbessern, die Betriebseffizienz steigern und das Gesamtimage des Unternehmens verbessern können. Die Entwicklung der maschinellen Übersetzungstechnologie hat die Anpassung zugänglicher gemacht, sodass Unternehmen zwischen der Anpassung bestehender Systeme oder der Investition in neue Schulungsprozesse wählen können.
Bei der Wahl zwischen den beiden Optionen ist es jedoch wichtig, die Fähigkeiten des Unternehmens realistisch einzuschätzen. Denn jede unvorsichtige Innovation kann nicht nur keinen Gewinn abwerfen, sondern auch zu Verlusten führen. Letztendlich hängt die Entscheidung zwischen maschineller Übersetzung und Schulung von den spezifischen Zielen, den verfügbaren Daten und dem Budget eines Unternehmens ab.