Moteurs de traduction automatique personnalisés

FAQ

Forum Aux Questions

En quoi consistent les moteurs de traduction automatique personnalisés SDL Language Cloud ?

Les moteurs de traduction automatique personnalisés SDL Language Cloud sont proposés par le biais du compte SDL Language Cloud Translation Toolkit. La technologie de traduction automatique de SDL repose sur SDL XMT.

Les moteurs de base SDL XMT constituent le point de départ de l'entraînement des moteurs de traduction automatique personnalisés au sein de SDL Language Cloud. Cette étape vous permet de personnaliser et d'adapter vos paires de langues à un projet, un client ou un secteur d'activité spécifique. Toutes les paires de langues sont livrées dans un état standard, créé à l'aide de la technologie d'entraînement SDL XMT. L'approche modulaire de XMT permet d'optimiser le processus d'entraînement pour chaque langue. Grâce à la capacité d'entraînement de SDL Language Cloud, vous pouvez utiliser le contenu pertinent fourni par votre client ou vos propres ressources de traduction et entraîner le moteur de traduction automatique pour qu'il génère des résultats nécessitant moins de post-édition.

Qu'est-ce que SDL XMT ?

La plupart des moteurs de traduction automatique utilisent une approche identique pour toutes les paires de langues prises en charge. Au fil des années, SDL a appris qu'il existait plusieurs façons de gérer les spécificités linguistiques et que le recours à différents algorithmes en fonction des paires de langues fonctionnait plutôt bien. Nous avons tiré des leçons de cette expérience et développé SDL XMT, une technologie flexible et modulaire, qui nous permet de relever tous les défis linguistiques. Loin de la conception monolithique basée sur des tournures de phrases, cette approche repose sur un système de statistiques et d'algorithmes pouvant être associés en fonction des langues source et cible pour fournir une traduction de bien meilleure qualité par rapport aux systèmes antérieurs. La technologie SDL XMT permet également d'utiliser la traduction automatique dans de nouveaux domaines, comme les réseaux sociaux, grâce à des modules capables d'appréhender ce type de contenu.

Comment entraîner un moteur de traduction automatique personnalisé ?

L'entraînement est relativement simple. Il vous suffit de télécharger vos fichiers TMX dans notre puissant environnement d'entraînement sous l'onglet « Custom Engines » (Moteurs personnalisés) dans la section Machine Translation (Traduction automatique) de votre compte SDL Language. Grâce aux longues années d'expérience de SDL en matière de traduction automatique, vos fichiers sont automatiquement nettoyés et préparés afin d'optimiser l'entraînement du moteur en vue d'obtenir les meilleurs résultats possibles. L'entraînement d'un moteur nécessite au minimum 90 000 mots source. Pour entraîner un moteur, plusieurs fichiers TMX peuvent être téléchargés. Chaque fichier TMX ne peut excéder 250 Mo. Toutefois il est possible de télécharger des fichiers .zip afin de regrouper plusieurs fichiers TMX au sein d'un même téléchargement.

En quoi consiste le processus d'entraînement ?

L'entraînement d'un moteur de traduction automatique personnalisé se décompose en quatre phases :

  1. Collecte des données hors ligne : des données parallèles sont collectées à partir de toutes les sources disponibles (généralement, à partir de mémoires de traduction), puis évaluées pour vérifier qu'elles sont bien adaptées au projet d'entraînement (c'est-à-dire qu'elles relèvent du même domaine, par exemple le tourisme, et du même type de contenu, par exemple des brochures sur des séjours).

    Il est inutile de préparer ou de nettoyer le contenu, car ce processus sera effectué automatiquement sur la base de la configuration des paramètres, inspirée par les nombreuses années d'expérience de SDL en matière de traduction automatique, afin de produire des résultats optimaux avec chaque moteur. À ce stade, il convient de décider si un échantillon de données parallèles doit être prélevé afin de servir de données tests (et d'affiner au besoin le réglage du moteur au cours de l'entraînement). Si aucune donnée n'est prélevée, la fonctionnalité d'entraînement de la traduction automatique s'en chargera automatiquement.

  2. Entraînement du moteur : une fois les données collectées pour l'entraînement, sous l'onglet « Custom Engines » (Moteurs personnalisés), sélectionnez « Train a new engine » (Entraîner un nouveau moteur). Téléchargez au moins un fichier TMX et suivez les consignes très simples de l'assistant pour devenir rapidement opérationnel. Téléchargez des données d'évaluation et un échantillon de données (codées au format UTF-8) avant de démarrer l'entraînement. L'entraînement nécessite une puissance de calcul considérable. Par conséquent, si une certaine charge est déjà appliquée au réseau informatique, il est possible que l'entraînement soit mis en file d'attente afin d'être exécuté plus tard. Le cycle d'entraînement peut durer plusieurs heures. Sa progression est indiquée sur l'écran « Custom Engines » (Moteurs personnalisés). Une fois le cycle terminé, l'utilisateur est informé par e-mail.

  3. Évaluation du moteur : le moteur est automatiquement évalué à partir des données d'évaluation téléchargées ou sur la base d'une sélection aléatoire de 1 000 lignes provenant des données d'entraînement, si vous n'avez pas téléchargé de données. Cela permet d'établir un score BLEU, qui correspond à une mesure de la similarité entre les phrases produites par une traduction automatique et celles produites par une traduction humaine. Pour tester un moteur entraîné, vous devez déployer le moteur en question dans votre compte SDL Language Cloud Translation Toolkit.

    Une fois le moteur déployé, vous pouvez y accéder à partir de votre compte SDL Language Cloud Translation Toolkit et à partir de l'API (et donc à partir de différents outils tels que SDL Trados Studio et Microsoft Office). Le résultat d'un entraînement de moteur peut être compilé dans un fichier .zip contenant au format CSV, XLIFF ou TMX les éléments suivants : texte source, traductions effectuées à l'aide du moteur entraîné, traductions effectuées à l'aide de la référence. Ce fichier .zip peut alors être envoyé à des traducteurs à des fins d'évaluation.

  4. Activation du moteur : pour pouvoir utiliser le moteur entraîné en production, celui-ci doit être « activé ». L'activation du moteur se fait en quelques clics dans l'interface utilisateur.

Quelles sont les langues pouvant faire l'objet d'un entraînement ?

Il est possible d'entraîner un moteur de traduction automatique personnalisé quelle que soit la combinaison linguistique prise en charge. Notez qu'en l'absence de moteur SDL de base, l'entraînement commencera au niveau zéro au lieu d'enrichir un moteur de base existant. Une liste complète des moteurs de base est disponible ici.

Combien de temps dure l'entraînement d'un moteur ?

Une fois votre fichier TMX téléchargé, il est envoyé via l'API serveur à notre équipe de traduction automatique. Le temps nécessaire à l'entraînement du moteur dépend en premier lieu du délai d'attente, qui à son tour dépend du nombre de demandes d'entraînement soumises. Il dépend en second lieu de la paire de langues et du volume de données d'entraînement téléchargées. À titre d'exemple, l'entraînement d'un moteur à partir d'un fichier TMX de 200 Mo contenant près de 2,5 millions de mots dure environ 4 heures. Notez que l'entraînement d'un moteur mobilise le processeur dans des proportions importantes et peut durer jusqu'à 24 heures. Vous serez informé par e-mail dès qu'un créneau vous aura été attribué, que l'entraînement aura commencé et que le processus sera terminé. Vous recevrez également un message en cas d'erreur survenant lors du processus d'entraînement.

Où et comment les moteurs entraînés peuvent-ils être utilisés ?

Les moteurs de traduction automatique personnalisés sont utilisés à partir du compte SDL Language Cloud Translation Toolkit. Ces moteurs ne sont en aucun point différents de ceux créés par SDL. Ils peuvent être utilisés de la même manière, par exemple via l'API du compte SDL Language Cloud Translation Toolkit, en ligne sur SDL Language Cloud, à partir de SDL Trados Studio et de Microsoft Office, etc.

Notez que ces moteurs ne peuvent pas être utilisés sur le serveur SDL Language Weaver Enterprise Translation Server ni sur SDL BeGlobal.

Puis-je partager les moteurs que j'ai moi-même entraînés ?

Vous pouvez partager les moteurs que vous entraînez avec un autre utilisateur en lui communiquant votre clé d'API. Autre solution : un droit de partage peut également vous être accordé par SDL. Par ailleurs, vous pouvez télécharger vos données d'évaluation ainsi que les fichiers du moteur entraîné (par exemple, dans le but de libérer de l'espace afin d'entraîner de nouveaux moteurs). Ces données pourront être déployées ultérieurement par SDL au moment où vous souhaitez de nouveau utiliser le moteur entraîné.

Puis-je confier l'entraînement d'un moteur à SDL ?

Oui, vous pouvez soit entraîner vous-même votre moteur en téléchargeant vos données TMX, soit confier à l'équipe iMT de SDL le soin de l'entraîner à votre place et de le déployer sur votre compte SDL Language Cloud. Ces informations seront visibles dans la colonne « SDL trained » (Entraîné par SDL) sur l'onglet « Custom Engines » (Moteurs personnalisés) de votre compte.

Les API du compte SDL Language Cloud Translation Toolkit sont-elles disponibles ?

Quel est le niveau de sécurité de SDL Language Cloud ?

La traduction automatique de SDL Language Cloud vous donne la garantie d'un contenu protégé. SDL veille à ce que vos données ne soient ni sauvegardées ni utilisées. Pour plus d'informations, veuillez consulter les Conditions d'utilisation de SDL Language Cloud.

Lorsque vous entraînez un moteur de traduction automatique, les données que vous téléchargez pour entraîner ce moteur sont stockées sur nos serveurs sécurisés à San José, aux États-Unis. Nous appliquons les meilleures pratiques du secteur en matière de protocoles de chiffrement afin de protéger vos données lorsqu'elles passent des mains des utilisateurs aux moteurs de traduction. Toutes vos données restent protégées et confidentielles, même lors de l'entraînement du moteur de traduction. En aucun cas SDL n'utilisera ces données pour améliorer ou entraîner ses propres moteurs de traduction automatique. SDL utilise uniquement des données disponibles dans le domaine public, qui ne seront jamais reproduites sous leur forme originale.

Pour de plus amples informations, consultez la politique de confidentialité relative aux principes de la Sphère de sécurité (Safe Harbour), ainsi que celle relative aux produits hébergés (Hosted Products Privacy Policy), y compris les spécifications de Language Cloud, disponibles ici.

Où puis-je obtenir de l'aide ?

En cas de problème, vous pouvez obtenir de l'aide à partir de votre compte SDL Language Cloud Translation Toolkit. Cliquez sur l'icône en forme de point d'interrogation située en haut à droite de l'écran et sélectionnez « Help & Support » (Aide et support).