Motores de traducción automática personalizados

Preguntas frecuentes

Preguntas frecuentes

¿Qué son los motores de traducción automática personalizados de SDL Language Cloud?

Los motores de traducción automática personalizados de SDL Language Cloud se ofrecen a través de SDL Language Cloud Translation Toolkit. SDL XMT constituye el núcleo de la tecnología de traducción automática de SDL.

Los motores de referencia de SDL XMT representan el punto de partida de la capacidad de entrenamiento de motores de traducción automática personalizados de SDL Language Cloud. Esto te permite personalizar y adaptar tu propia combinación de idiomas a un proyecto, cliente o sector determinado. Todas las combinaciones de idiomas aparecen inicialmente en un estado estándar creado mediante la tecnología de entrenamiento de SDL XMT. El enfoque modular de XMT permite que el proceso de entrenamiento pueda optimizarse para cada idioma. Gracias a la capacidad de entrenamiento de SDL Language Cloud, podrás utilizar el contenido relevante suministrado por tu cliente o tus propios recursos de traducción para entrenar tu motor de traducción automática y obtener resultados que necesiten menos postedición.

¿Qué es SDL XMT?

La mayoría de los motores de traducción automática emplean un enfoque único para todas las combinaciones de idiomas admitidas. A lo largo de los años, SDL ha aprendido que existen formas distintas de gestionar las particularidades de cada idioma y que los distintos algoritmos funcionan bien según la combinación de idiomas. Hemos aprovechado esta experiencia para desarrollar SDL XMT, una tecnología flexible y modular que nos permite gestionar todos los desafíos que plantean los idiomas. Esta tecnología va más allá de un sistema de traducción automática rígido y basado en frases. Se trata de un método que se basa en estadísticas, con algoritmos diseñados de tal forma que pueden combinarse y mezclarse en función de los idiomas de origen y destino para ofrecer resultados de máxima calidad en comparación con sistemas anteriores. SDL XMT también permite emplear la traducción automática en nuevos campos, como las redes sociales, gracias a módulos que admiten este tipo de contenido.

¿Cómo puedo entrenar un motor de traducción automática personalizado?

Comenzar es fácil. Solo tienes que cargar tus archivos TMX en nuestro potente entorno de entrenamiento, en la ficha "Motores personalizados" de la sección Traducción automática que encontrarás en tu cuenta de SDL Language Cloud. Gracias a los años de experiencia en traducción automática de SDL, tus archivos se limpiarán y prepararán automáticamente con el fin de optimizar el entrenamiento de motores y obtener, así, los mejores resultados. Necesitarás un mínimo de 90 000 palabras en el idioma de origen para entrenar un motor. Se pueden cargar varios archivos TMX para entrenar un motor. Cada archivo TMX cuenta con una limitación de tamaño de 250 MBytes; sin embargo, pueden cargarse archivos .zip para incluir varios TMX en una carga.

¿Qué es el flujo de trabajo de entrenamiento?

El entrenamiento de motores de traducción automática personalizados se compone de cuatro fases:

  1. Recopilación de datos offline: deben recopilarse datos paralelos de cualquier fuente disponible (normalmente, memorias de traducción) y, posteriormente, evaluarse para garantizar que son adecuados para el proyecto de entrenamiento (es decir, pertenecen al mismo campo, por ejemplo, viajes, y representan el mismo tipo de contenido, como folletos de paquetes de vacaciones).

    No es necesario preparar o limpiar el contenido, ya que estas operaciones se realizarán de forma automática gracias a una serie de opciones que SDL ha configurado basándose en su experiencia en traducción automática, con el fin de generar resultados óptimos para cada motor. Llegados a este punto, se debe tomar una decisión con respecto a la necesidad de conservar determinados datos paralelos para su uso como datos de prueba (se utilizarán para ajustar el motor durante el proceso de entrenamiento). Si no se conserva ningún dato, el sistema de entrenamiento de traducción automática lo hará automáticamente.

  2. Entrenamiento del motor: una vez que se han recopilado los datos para el proceso de entrenamiento, selecciona "Entrenar un nuevo motor" en la ficha "Motores personalizados". Solo tienes que cargar uno o varios archivos TMX y seguir el intuitivo asistente para comenzar. Carga los datos de evaluación y los datos de ejemplo (codificación UTF-8) e inicia el proceso de entrenamiento. El entrenamiento requiere un gran nivel de potencia computacional; en función de la carga actual en el grid computacional, es posible que el proceso de entrenamiento se ponga en cola y se ejecute con posterioridad. La ejecución del entrenamiento puede tardar bastantes horas; las actualizaciones de estado se muestran en la interfaz de usuario de "Motores personalizados" y, además, se envía un correo electrónico al usuario una vez que el entrenamiento ha finalizado.

  3. Evaluación del motor: el motor será evaluado automáticamente empleando los datos de evaluación cargados, o bien seleccionando 1000 líneas de forma aleatoria de los datos de aprendizaje en el caso de que no se hayan cargado datos de evaluación. Este proceso se realiza para calcular una puntuación BLEU, que representa una medición de la similitud entre las traducciones humanas y automáticas. Para probar un motor entrenado, debe implementarse en tu cuenta de SDL Language Cloud Translation Toolkit.

    Una vez implementado, se puede acceder al motor a través de SDL Language Cloud Translation Toolkit y de la API (y, por tanto, a través de herramientas como SDL Trados Studio y Microsoft Office). Los resultados del entrenamiento del motor pueden compilarse en un archivo .zip que incluye los siguientes contenidos en formato CSV, XLIFF o TMX: texto de origen, traducciones realizadas con el motor entrenado y traducciones realizadas con el motor de referencia. A continuación, el archivo .zip puede enviarse a los traductores para su evaluación.

  4. Activación del motor: para comenzar a usar el motor entrenado en trabajos de producción, es necesario que esté "activado". Esta operación puede realizarse con un par de clics en la interfaz de usuario.

¿Qué idiomas pueden entrenarse?

El entrenamiento de un motor de traducción automática personalizado puede realizarse utilizando cualquier combinación de idiomas compatible. Ten en cuenta que, en el caso de que no haya ningún motor de referencia de SDL que se corresponda, el entrenamiento se realizará desde cero en lugar de desarrollarse gradualmente a partir del motor de referencia existente. Consulta una lista completa de los motores de referencia aquí.

¿Cuánto tiempo lleva entrenar un motor?

Una vez que has cargado tu archivo TMX, se envía a nuestro equipo de traducción automática a través de un servidor API. El tiempo que se tarda en entrenar un motor depende, en primer lugar, del tiempo en cola que, a su vez, depende del número de solicitudes de entrenamiento que se hayan enviado. En segundo lugar, depende de la combinación de idiomas y del tamaño de los datos de aprendizaje cargados. Se tarda aproximadamente 4 horas en entrenar un motor mediante la carga de un TMX de 200 MB que contiene aproximadamente 2,5 millones de palabras. Ten en cuenta que el entrenamiento de un motor requiere un uso intenso de la CPU y que es posible que llegue a tardar 24 horas. Se te notificará por correo electrónico cuando se te haya asignado un espacio y el proceso de entrenamiento se haya iniciado, así como cuando el proceso se haya completado. En el caso de que se produzca algún error durante el proceso de entrenamiento del motor, también se te avisará por correo electrónico.

¿Cómo y dónde pueden usarse los motores entrenados?

Los motores de traducción automática personalizados se utilizan a través de SDL Language Cloud Translation Toolkit. Estos motores no son distintos a los creados por SDL. Pueden usarse de la misma forma, por ejemplo, a través de la API de SDL Language Cloud Translation Toolkit, en SDL Language Cloud online, desde SDL Trados Studio y Microsoft Office, etc.

Ten en cuenta que esos motores no pueden utilizarse en el SDL Language Weaver Enterprise Translation Server ni en SDL BeGlobal.

¿Puedo compartir los motores autoentrenados?

Puedes compartir tus motores entrenados con otro usuario compartiendo tu clave API. Como alternativa, SDL puedes concederle el permiso de uso compartido. También puedes descargar tus datos de evaluación y tus archivos de motor entrenado (por ejemplo, para liberar espacio para entrenar nuevos motores). SDL puede implementar estos datos en el futuro si deseas utilizar dicho motor entrenado de nuevo.

¿Puede SDL entrenar un motor por mí?

Sí, puedes entrenar tu propio motor cargando tus datos en formato TMX, o bien el equipo de iMT de SDL puede encargarse de entrenarlo por ti e implementarlo en tu cuenta de SDL Language Cloud. Estos aparecerán en la columna "Entrenados por SDL" de la ficha "Motores personalizados" que encontrarás en tu cuenta.

¿Están disponibles las API de SDL Language Cloud Translation Toolkit?

¿En qué medida es seguro SDL Language Cloud?

Con la traducción automática de SDL Language Cloud, puedes tener la tranquilidad de que tu contenido está a salvo. SDL garantiza que no se guarda ni se utiliza ninguno de tus datos. Para obtener más información, consulta los términos y condiciones de SDL Language Cloud.

Cuando se entrena un motor de traducción automática, los datos que se cargan para hacerlo se almacenan en nuestros servidores seguros de San José (EE. UU.). Utilizamos prácticas recomendadas líderes del sector sobre protocolos de cifrado para proteger tus datos durante la transferencia entre los usuarios y los motores de traducción. Mantendremos la seguridad y la privacidad de todos tus datos, incluso durante el proceso de entrenamiento del motor de traducción. SDL nunca utilizará estos datos para mejorar o entrenar sus propios motores de traducción automática. SDL solo utiliza datos de dominio público que jamás se reproducen en su formato original.

Para obtener más información, consulta la política de privacidad "Safe Harbour" y la política de privacidad de productos hospedados (incluida la información específica sobre Language Cloud) aquí.

¿Dónde puedo buscar ayuda?

Si tiene algún problema, puede acceder a material de ayuda desde su cuenta de SDL Language Cloud Translation Toolkit. Haga clic en el icono de la interrogación situado en la parte superior derecha de la pantalla y seleccione "Ayuda y soporte técnico".