맞춤형 자동 번역 엔진

FAQ

FAQ

SDL Language Cloud 맞춤형 자동 번역 엔진이란 무엇인가요?

SDL Language Cloud 맞춤형 MT (자동 번역) 엔진은 SDL Language Cloud 번역 툴킷을 통해 제공됩니다. SDL 자동 번역 기술의 핵심은 SDL XMT입니다.

SDL XMT 기본 엔진은 SDL Language Cloud의 맞춤형 MT 엔진 트레이닝 기능을 구현하는 출발점입니다. 사용자는 특정 프로젝트, 고객사 또는 산업별로 원하는 언어쌍을 맞춤 구성할 수 있습니다. 모든 언어쌍은 SDL XMT 트레이닝 기술로 생성된 표준 상태로 제공됩니다. XMT는 모듈식 접근법을 사용하므로 언어마다 트레이닝 프로세스를 따로 최적화할 수 있습니다. SDL Language Cloud의 트레이닝 기능을 사용하면 고객사나 자사가 보유한 번역 자산에서 추출한 관련 컨텐츠로 MT 엔진을 트레이닝하여 포스트에디팅을 줄이는 동시에 보다 완성도가 높은 번역 결과물을 얻을 수 있습니다.

SDL XMT란 무엇인가요?

대부분의 MT 엔진은 지원되는 모든 언어쌍에 대해 천편일률적인 접근 방식을 적용하고 있습니다. SDL은 오랜 경험을 바탕으로, 언어쌍마다 최적화된 알고리즘으로 각 언어의 독특한 특징을 다루어야 한다는 것을 인식해 왔습니다. 이를 반영하여 개발된 SDL XMT는 유연한 모듈식 기술을 도입하여 언어별로 발생하는 모든 문제점을 처리해줍니다. 단조로운 문구 기반의 설계의 한계를 극복하여 소스 언어와 타겟 언어의 특징에 따라 조합 가능한 알고리즘을 갖춘 통계 기반 자동 번역 시스템으로서, 기존 시스템과 비교하여 월등한 품질의 결과물을 제공합니다. 또한 SDL XMT에는 소셜 미디어 등의 새로운 분야를 처리할 수 있는 모듈이 지원되어 컨텐츠 유형별로 자동 번역을 적용할 수 있습니다.

맞춤형 MT 엔진을 트레이닝하는 방법은 무엇인가요?

SDL Language 계정의 자동 번역(Machine Translation) 영역에 있는 '맞춤형 엔진(Custom Engines)' 탭에서 TMX 파일을 SDL의 트레이닝 환경에 간단히 업로드하여 작업을 시작할 수 있습니다. 풍부한 SDL의 MT 경험을 바탕으로 설계된 인터페이스에서 파일이 자동으로 정리 및 준비되어 원활한 엔진 트레이닝이 가능합니다. 엔진을 트레이닝하려면 최소 90,000 단어 이상의 소스가 필요합니다. 여러 TMX 파일을 업로드하여 엔진을 트레이닝할 수 있습니다. 각 TMX 파일의 크기는 250MB로 제한되지만, 여러 TMX를 압축한 .zip 파일을 한 번에 업로드할 수 있습니다.

트레이닝 과정은 어떻게 이루어지나요?

맞춤형 MT 엔진의 트레이닝 과정은 4단계로 구성됩니다.

  1. 오프라인 데이터 수집: 가용한 모든 소스(일반적으로 번역 메모리)에서 병렬 데이터를 수집하여 트레이닝 프로젝트에 적합한지 여부를 확인해야 합니다. 즉, 분야(예: 여행) 및 컨텐츠 유형(예: 여행 패키지 브로셔)이 동일해야 합니다.

    각 엔진에 대해 최적의 결과물을 산출하기 위한 컨텐츠 준비 또는 정리는 SDL의 풍부한 자동 번역 노하우가 집약된 설정 옵션에 따라 자동으로 이루어지므로 별도로 수행할 필요가 없습니다. 이 단계에서는 병렬 데이터 중 일부를 트레이닝 시 엔진 튜닝에 사용되는 테스트 데이터로 활용하도록 따로 확보할지 여부를 결정해야 합니다. 따로 확보할 데이터를 결정하지 않으면 MT 트레이닝 기능에서 자동으로 결정합니다.

  2. 엔진 트레이닝: 트레이닝에 사용할 데이터가 수집되었으면 '맞춤형 엔진(Custom Engines)' 탭에서 '새 엔진 트레이닝하기(Train a new engine)'를 선택합니다. 하나 이상의 TMX 파일을 업로드하고 마법사의 간단한 안내에 따라 작업을 시작합니다. 평가 데이터 및 예제 데이터(UTF-8 인코딩)를 업로드하고 트레이닝을 시작합니다. 트레이닝에는 상당한 연산 능력이 소요되며, 연산 그리드에 과부하가 걸린 경우 트레이닝이 나중에 실행되도록 예약될 수도 있습니다. 트레이닝은 몇 시간이 걸릴 수 있으며, '맞춤형 엔진(Custom Engines)' 사용자 인터페이스에 상태 업데이트가 표시되고 트레이닝이 완료되면 사용자에게 이메일이 전송됩니다.

  3. 엔진 평가: 업로드된 평가 데이터를 사용하여 엔진이 자동으로 평가되거나, 평가 데이터를 업로드하지 않은 경우 트레이닝 데이터에서 무작위로 1,000행을 선택하여 평가가 진행됩니다. 이를 통해 자동 번역 문장과 인력 번역 문장의 유사성을 측정하는 BLEU 점수를 계산합니다. 트레이닝된 엔진을 테스트하려면 SDL Language Cloud 번역 툴킷 계정에 해당 엔진을 배포해야 합니다.

    배포된 엔진은 SDL Language Cloud 번역 툴킷 및 API를 통해 액세스가 가능하며, 이를 통해 SDL Trados Studio 및 Microsoft Office 등의 툴에서도 사용할 수 있습니다. 엔진 트레이닝 결과물을 CSV, XLIFF 또는 TMX 형식으로 저장한 .zip 파일로 패키징할 수 있으며, 여기에는 원문, 트레이닝된 엔진의 번역 결과물 및 기본 엔진의 번역 결과물이 포함됩니다. 이 .zip 파일을 번역가에게 전송하여 평가할 수 있습니다.

  4. 엔진 활성화: 트레이닝된 엔진을 실무에 투입하려면 "활성화"가 필요합니다. 사용자 인터페이스에서 몇 번의 클릭만으로 활성화가 가능합니다.

트레이닝 가능한 언어는 무엇인가요?

지원되는 모든 언어 조합을 사용하여 맞춤형 MT 엔진을 트레이닝할 수 있습니다. 해당 언어쌍에 맞는 SDL 기본 엔진이 없을 경우, 기본 엔진에 누적되지 않고 완전히 처음부터 트레이닝이 진행됩니다. 기본 엔진의 전체 목록은 여기를 참조하세요.

엔진을 트레이닝하는 데 얼마나 걸리나요?

업로드가 끝난 TMX 파일은 서버 API를 통해 SDL의 MT 팀에 전송됩니다. 엔진 트레이닝에 걸리는 시간은 일차적으로 대기 시간에 좌우되며, 제출된 트레이닝 요청이 얼마나 많은지에 따라 달라집니다. 또한, 업로드된 트레이닝 데이터의 언어쌍과 크기에 따라서도 시간이 달라집니다. 약 250만 단어가 포함된 200MB 크기의 TMX를 업로드한 경우 엔진 트레이닝에 4시간 정도 소요됩니다. 엔진 트레이닝은 막대한 CPU 연산 능력을 필요로 하며 최대 24시간까지 걸릴 수도 있습니다. 요청이 접수되어 트레이닝이 시작될 때 및 트레이닝이 완료될 때 이메일로 안내를 드립니다. 엔진 트레이닝 과정에서 오류가 발생한 경우에도 이메일로 안내를 드립니다.

트레이닝된 엔진을 어디에, 어떻게 사용할 수 있나요?

SDL Language Cloud 번역 툴킷을 통해 맞춤형 MT 엔진을 사용할 수 있습니다. 이 엔진은 SDL이 제작한 기본 엔진과 사용상 차이가 없습니다. SDL Language Cloud 번역 툴킷 API, SDL Language Cloud 온라인, SDL Trados Studio, Microsoft Office 등을 통해 동일한 방법으로 사용할 수 있습니다.

단, SDL Language Weaver Enterprise Translation Server 또는 SDL BeGlobal에서는 이 엔진을 사용할 수 없습니다.

내가 트레이닝한 엔진을 공유할 수 있나요?

API 키를 공유하면 트레이닝된 엔진을 다른 사용자와 공유할 수 있습니다. 또는 SDL에서 공유 권한을 부여할 수 있습니다. 또한, 새 엔진을 트레이닝하기 위해 공간을 확보해야 하는 등의 목적으로 평가 데이터와 트레이닝된 엔진 파일을 다운로드할 수도 있습니다. 해당 트레이닝 엔진을 나중에 다시 사용하려는 경우 SDL에서 해당 파일을 배포해 드립니다.

SDL에서 엔진을 대신 트레이닝해 줄 수 있나요?

예. 사용자가 TMX 데이터를 업로드하여 엔진을 직접 트레이닝할 수도 있고, SDL iMT 팀에서 엔진을 트레이닝한 후 SDL Language Cloud 계정에 배포하도록 위탁할 수도 있습니다. 이것은 계정의 '맞춤형 엔진(Custom Engines)' 탭에서 'SDL 트레이닝(SDL trained)' 열에 표시됩니다.

SDL Language Cloud 번역 툴킷 API를 사용할 수 있나요?

SDL Language Cloud는 보안상 얼마나 안전한가요?

SDL Language Cloud의 자동 번역 기능은 사용자의 컨텐츠를 안전하게 보호합니다. SDL은 사용자의 그 어떤 데이터도 저장하거나 사용하지 않습니다. 자세한 내용은 SDL Language Cloud 이용 약관을 참조하시기 바랍니다.

MT 엔진을 트레이닝하기 위해 업로드한 데이터는 미국 산호세에 있는 SDL 보안 서버에 저장됩니다. SDL은 최고의 업계 표준 암호화 프로토콜로 사용자와 번역 엔진이 주고받는 데이터를 보호합니다. 번역 엔진을 트레이닝하는 중에도 모든 데이터는 보안상 안전하게 보호됩니다. 이러한 데이터는 어떠한 경우에도 SDL의 자체 MT 엔진을 개선하거나 트레이닝하는 데 사용되지 않습니다. SDL은 공개 영역의 데이터만을 사용하며, 사용되는 데이터는 절대 원래의 형태로 재생성되지 않습니다.

자세한 내용은 여기에서 공식 개인정보 보호정책 및 제품별 개인정보 보호정책(Language Cloud 관련 조항 포함)을 참조하세요.

도움이 필요한 경우 어떻게 해야 하나요?

문제가 발생할 경우 SDL Language Cloud 번역 툴킷 계정을 통해 지원을 받을 수 있습니다. 화면 오른쪽 상단에 있는 물음표 아이콘을 클릭하고 '도움말 및 지원(Help & Support)'을 선택하세요.