Kundenspezifische Engines für die Maschinelle Übersetzung

FAQs

Häufig gestellte Fragen (FAQs)

Was genau sind kundenspezifische Engines für die maschinelle Übersetzung von SDL Language Cloud?

Kundenspezifische MÜ-Engines für SDL Language Cloud werden über das SDL Language Cloud Translation Toolkit angeboten. Im Zentrum der Technologie für maschinelle Übersetzung von SDL steht SDL XMT.

Die SDL XMT-Baseline-Engines bilden den Ausgangspunkt für die Konfigurierbarkeit der kundenspezifischen MÜ-Engines in SDL Language Cloud. Dadurch können eigene Sprachpaare für bestimmte Projekte, Kunden oder Branchen festgelegt werden. Alle Sprachpaare werden in einem Standardzustand bereitgestellt, der mithilfe der Konfigurationstechnologie von SDL XMT erschaffen wurde. Dank des modularen Ansatzes von XMT kann das Konfigurationsverfahren für die einzelnen Sprachen optimiert werden. Die MÜ-Engine von SDL Language Cloud kann mithilfe relevanter Inhalte des Kunden oder eigener Übersetzungsressourcen so konfiguriert werden, dass das Übersetzungsergebnis weniger Post-Editing erfordert.

Was ist SDL XMT?

Die meisten MÜ-Engines verfolgen einen Universalansatz für alle unterstützten Sprachpaare. Im Laufe der Jahre hat SDL jedoch die Erfahrung gemacht, dass es verschiedene Möglichkeiten für den Umgang mit sprachlichen Besonderheiten gibt und dass einige Algorithmen für bestimmte Sprachpaare besser funktionieren als für andere. Aus dieser Erfahrung heraus haben wir SDL XMT entwickelt, eine modulare und flexible Technologie, die uns den Umgang mit genau solchen sprachlichen Herausforderungen ermöglicht. Sie geht über die monolithische, phrasenbasierte Struktur für maschinelle Übersetzung hinaus und bildet ein statistisches System mit Algorithmen, die abhängig von der Ausgangs- und Zielsprache kombiniert werden. Im Vergleich zu älteren Systemen wird so für die bestmöglichen Ergebnisse gesorgt. Dank SDL XMT kann maschinelle Übersetzung auch in neuen Domänen, wie etwa sozialen Netzwerken, eingesetzt werden, sofern die Module auf diese Art von Inhalt abgestimmt worden sind.

Wie konfiguriere ich eine kundenspezifische MÜ-Engine?

Sie können ganz einfach beginnen, indem Sie Ihre TMX-Dateien in unsere leistungsfähige Konfigurationsumgebung hochladen. Öffnen Sie dazu die Registerkarte „Custom Engines“ (Kundenspezifische Engines) im MÜ-Bereich Ihres SDL Language Cloud-Kontos. Die langjährige MÜ-Erfahrung von SDL bedeutet, dass Ihre Dateien automatisch bereinigt und vorbereitet werden, damit Sie bei der Konfiguration der Engine die bestmöglichen Ergebnisse erhalten. Es werden mindestens 90.000 Wörter Ausgangstext benötigt, um eine Engine zu konfigurieren. Zur Konfiguration einer Engine können mehrere TMX-Dateien hochgeladen werden. Zwar sind die TMX-Dateien jeweils auf eine Größe von 250 MB beschränkt, allerdings können mehrere TMX-Dateien zu einer ZIP-Datei zusammengefasst werden, um das Hochladen zu vereinfachen.

Wie sieht der Konfigurations-Workflow aus?

Die Konfiguration kundenspezifischer MÜ-Engines besteht aus vier Schritten:

  1. Sammeln von Offline-Daten: Es müssen Paralleldaten aus verfügbaren Quellen (gewöhnlich Translation Memorys) gesammelt und bewertet werden, um sicherzustellen, dass sie für das aktuelle Projekt geeignet sind (d. h., dass sie zum selben Fachgebiet, beispielsweise Touristik, gehören und denselben Inhaltstyp aufweisen, wie etwa Reisebroschüren).

    Es ist nicht erforderlich, den Inhalt vorzubereiten oder zu bereinigen, da dies automatisch erfolgt. Es geschieht anhand von Einstellungen, die auf jahrelanger Erfahrung von SDL auf dem Gebiet der maschinellen Übersetzung basieren und gewährleisten, dass für jede Engine optimale Ergebnisse erzielt werden. An dieser Stelle ist zu entscheiden, ob bestimmte Paralleldaten zu Testzwecken (d. h. zur Feineinstellung der Engine während der Konfiguration) zurückbehalten werden sollen. Werden keine Daten ausgewählt, geschieht dies im Rahmen der MÜ-Konfiguration automatisch.

  2. Konfiguration der Engine: Wenn die Daten für die Konfiguration erfasst wurden, klicken Sie auf der Registerkarte „Custom Engines“ (Kundenspezifische Engines) auf „Train a new engine“ (Neue Engine konfigurieren). Laden Sie einfach eine oder mehrere TMX-Dateien hoch und befolgen Sie zum Einstieg die Anweisungen des benutzerfreundlichen Assistenten. Laden Sie Evaluierungs- und Beispieldaten (mit UTF-8-Codierung) hoch und beginnen Sie mit der Konfiguration. Die Konfiguration erfordert eine Menge Rechenleistung. Abhängig von der aktuellen Auslastung des Rechnerverbunds wird die Konfiguration möglicherweise in die Warteschleife gestellt und später ausgeführt. Die Konfiguration kann mehrere Stunden in Anspruch nehmen. In der Benutzeroberfläche „Custom Engines“ (Kundenspezifische Engines) werden Statusberichte angezeigt, und bei Abschluss der Konfiguration wird eine E-Mail verschickt.

  3. Evaluierung der Engine: Die Engine wird entweder anhand der hochgeladenen Evaluierungsdaten oder – falls keine Evaluierungsdaten hochgeladen wurden – anhand von 1.000 zufällig ausgewählten Zeilen aus den Konfigurationsdaten überprüft. Hieraus ergibt sich der BLEU-Score, d. h. ein Wert, bei dem die Übereinstimmung zwischen maschinell und konventionell übersetzten Segmenten verglichen wird. Zur Überprüfung einer branchenspezifisch abgestimmten Engine muss diese für das betreffende SDL Language Cloud Translation Toolkit-Konto freigegeben werden.

    Nach der Freigabe kann die Engine über das SDL Language Cloud Translation Toolkit sowie über die API (und somit durch Tools wie SDL Trados Studio und Microsoft Office) genutzt werden. Die Ergebnisse der Engine-Konfiguration lassen sich in einer ZIP-Datei zusammenfassen, die folgende Inhalte in den Formaten CSV, XLIFF oder TMX enthält: Ausgangstext, durch die branchenspezifisch abgestimmte Engine ausgeführte Übersetzungen sowie über die Baseline ausgeführte Übersetzungen. Die ZIP-Datei kann zur Evaluierung an das Übersetzungsteam geschickt werden.

  4. Aktivierung der Engine: Bevor die branchenspezifisch abgestimmte Engine zu Produktionszwecken eingesetzt werden kann, muss sie „aktiviert“ werden. Dies erfolgt über ein paar Mausklicks in der Benutzeroberfläche.

Welche Sprachen können konfiguriert werden?

Die Konfiguration kundenspezifischer MÜ-Engines kann für beliebige unterstützte Sprachkombinationen erfolgen. Wenn jedoch keine entsprechende Baseline-Engine von SDL vorliegt, ist zu beachten, dass Sie bei der Konfiguration bei null anfangen müssen, anstatt inkrementell auf eine vorhandene Baseline aufzubauen. Eine vollständige Liste der Baseline-Engines finden Sie hier.

Wie lange dauert es, eine Engine zu konfigurieren?

Sobald Sie Ihre TMX-Datei übertragen haben, wird sie über eine Server-API an unser MÜ-Team geschickt. Die Dauer für die Erstkonfiguration einer Engine ist abhängig von der Größe der Warteschleife, die ihrerseits von der Anzahl der Konfigurationsanfragen abhängt. Ein zweiter Faktor sind das Sprachpaar und der Umfang der hochgeladenen Daten für die Konfiguration. Die Konfiguration einer Engine mit einer 200 MB großen TMX-Datei (ca. 2,5 Millionen Wörter) dauert ungefähr vier Stunden. Beachten Sie bitte, dass die Konfiguration einer Engine extrem viel Rechenleistung erfordert und daher bis zu 24 Stunden in Anspruch nehmen kann. Sie werden per E-Mail auf dem Laufenden gehalten – einmal, wenn Sie ein Zeitfenster erhalten und die Konfiguration beginnt, und ein weiteres Mal, wenn die Konfiguration abgeschlossen ist. Sollten bei der Konfiguration der Engine Fehler auftreten, werden Sie ebenfalls per E-Mail informiert.

Wie und wo können branchenspezifisch abgestimmte Engines eingesetzt werden?

Kundenspezifische MÜ-Engines können über das SDL Language Cloud Translation Toolkit verwendet werden. Die Engines unterscheiden sich nicht von Engines, die durch SDL erstellt wurden. Sie können auf dieselbe Art und Weise verwendet werden, z. B. über die API des SDL Language Cloud Translation Toolkit, online innerhalb von SDL Language Cloud, in SDL Trados Studio und Microsoft Office usw.

Beachten Sie jedoch, dass diese Engines nicht vom SDL Language Weaver Enterprise Translation Server oder von SDL BeGlobal genutzt werden können.

Kann ich meine branchenspezifisch abgestimmten Engines weitergeben?

Ihre branchenspezifisch abgestimmten Engines können durch die Weitergabe Ihres API-Schlüssels mit anderen Benutzern geteilt werden. Alternativ kann die Erlaubnis zur Weitergabe durch SDL veranlasst werden. Außerdem können Sie Ihre Evaluierungsdaten und die Dateien der branchenspezifisch abgestimmten Engine herunterladen (z. B. um Platz für die Konfiguration neuer Engines zu schaffen). SDL kann diese Daten später erneut bereitstellen, wenn Sie die branchenspezifisch abgestimmte Engine verwenden möchten.

Kann ich eine Engine von SDL für mich konfigurieren lassen?

Ja. Sie können Ihre Engine entweder selbst konfigurieren, indem Sie Ihre TMX-Daten hochladen, oder die Konfiguration dem Team von SDL iMT überlassen. Die Daten werden dann in Ihrem SDL Language Cloud-Konto bereitgestellt. Sie finden sie in der Spalte „SDL trained“ (Von SDL erstellt) auf der Registerkarte „Custom Engines“ (Kundenspezifische Engines) Ihres Kontos.

Sind die APIs des SDL Language Cloud Translation Toolkit öffentlich verfügbar?

Wie sicher ist SDL Language Cloud?

Bei der maschinellen Übersetzung mit SDL Language Cloud haben Sie die Gewissheit, dass Ihre Inhalte sicher sind. SDL garantiert, dass Ihre Daten nicht gespeichert oder verwendet werden. Weitere Informationen entnehmen Sie bitte den Geschäftsbedingungen für SDL Language Cloud.

Bei der Konfiguration einer MÜ-Engine werden die von Ihnen hochgeladenen Daten auf unseren sicheren Servern in San Jose, USA, gespeichert. Bei den Verschlüsselungsprotokollen halten wir uns an branchenübliche Best Practices, um Ihre Daten während der Übertragung zwischen den Benutzern und den Übersetzungs-Engines zu schützen. Selbst während der Anpassung („Konfiguration“) der Übersetzungs-Engine ist die Vertraulichkeit all Ihrer Daten gewährleistet. SDL verwendet diese Daten grundsätzlich niemals zur Optimierung oder Konfiguration eigener MÜ-Engines. SDL arbeitet nur mit Daten, die öffentlich zugänglich sind, und die verwendeten Daten werden nie in ihrer ursprünglichen Form reproduziert.

Weitere Informationen finden Sie in der Safe Harbour-Datenschutzrichtlinie und der Datenschutzrichtlinie für gehostete Produkte (diese enthält auch spezielle Informationen zu SDL Language Cloud), die hier eingesehen werden können.

Wo finde ich Hilfe?

Bei Problemen können Sie die Hilfe in Ihrem SDL Language Cloud Translation Toolkit-Konto aufrufen. Klicken Sie rechts oben auf dem Bildschirm auf das Fragezeichen und wählen Sie die Option „Help & Support“ (Hilfe und Support) aus.