영상 현지화에 또 하나의 중요한 요소, 언어별 단위 변환
2022년 11월 개봉한 블랙팬서: 와칸다 포에버를 보신적이 있나요?
이 영화는 2018년 개봉한 블랙 팬서의 후속작으로, 슈리라는 캐릭터가 등장하는 마블 코믹스를 기반으로 하는 미국의 슈퍼히어로 영화입니다. 특히 첫 번째 블랙 팬서 영화에서 타이틀 캐릭터를 연기한 배우 고 채드윅 보스만에게 헌정하는 영화이기도 합니다.
내용을 간단히 살펴보면,
와칸다의 왕 티찰라는 불치병으로 죽고, 그의 여동생 슈리는 그를 구하기 위해 '하트 모양의 허브'를 재현하려고 합니다. 1년 후, 와칸다는 비브라늄을 공유하라는 국제사회의 압박을 받고, 이를 반대하는 네이머와 갈등을 겪게됩니다. 슈리는 오코예와 CIA 요원 에버렛 K. 로스의 도움을 받아 비브라늄 탐지기를 개발한 MIT 학생 리리 윌리엄스(아이언하트)를 찾아 협력하게 되죠. 와칸다와 네이머 군대 간의 전투 끝에 슈리는 새로운 블랙 팬서가 되었고, 전투 후반부에 네이머와 동맹을 맺으며 영화는 막을 내리게 됩니다.
영화 중반부에 슈리가 아이언하트와 같이 미국 정보국을 따돌리는 장면에서 감시 드론의 높이를 묻는 대사가 다음과 같이 나옵니다.
이것은 9,000m 혹은 3000 feet를 알려주는 같은 의미의 자막이지만, 언어별로 서로 다른 단위를 사용하는 것을 볼 수 있습니다. 이는 언어에 따른 고유한 단위를 사용하는 국가에 맞게 ‘현지화’(로컬라이제이션; Localization)*를 적용한 결과라고 할 수 있습니다. 만약 한국어 자막에 3,000피트 라고 나온다면, 아마도 대다수의 사람들은 직관적으로 이해하기 쉽지 않을 것입니다. 영상의 현지화를 위해서는 세계 각국의 언어에서 고유하게 사용하는 단위를 제대로 변환해주어야 하며, 이는 시청자가 작품을 감상하는 데 도움이될 수 있는 중요한 요소입니다.
- 로컬라이제이션(Localization) : 단순히 단어, 문장의 번역을 넘어 국가 별 문화와 언어의 특수성 및 맥락에 맞는 번역을 하는 것
언어에 맞는 단위, 국가에 맞는 단위 변환은 쉽지 않습니다. 위 자막을 보면 확인할 수 있듯이 각 국에서 사용하는 다양한 단위 외에도, 숫자 표현 형식과 띄어쓰기 여부, 그리고 문장의 표현 방식 등도 다른 것을 볼 수 있습니다. 위 자막을 자세히 살펴보면, 한국어의 경우에는 숫자와 단위 그리고 뒤에 이어지는 조사가 붙어서 문장을 형성합니다. 프랑스어의 경우에는 천의 자리 숫자를 구분할 때 “,”가 아닌 “ ”(공백)을 사용해서 구분합니다. 일본어의 경우에는 띄어쓰기를 하지 않습니다. 영어의 경우에는 문자로 숫자를 표현합니다.
이렇듯 현지화 된 번역을 하기 위해서는 다양한 요소들을 고려해야 합니다. 이 포스팅에서는 XL8이 어떠한 방법으로 각 언어의 단위를 이해하는 ‘현지화’된 번역을 제공할 수 있는지 소개합니다.
기계 번역 엔진에 언어와 국가에 맞는 단위 학습시키기
XL8는 기계 번역 정확도를 높이기 위해서, 언어별로 사용하는 단위를 번역 엔진에 추가했습니다. XL8의 엔진을 사용하는 고객들이 가장 많이 사용하는 32개의 언어를 우선적으로 학습시켰으며, 앞으로 다른 언어에 대한 단위들도 계속해서 늘려나갈 예정입니다. 단위를 추가할 때 각 언어를 사용하는 국가의 특성을 반영했습니다. 특히, 언어별 표현 방식을 보다 정확히 구현하였습니다. 단위의 경우, 대부분 “숫자 + 단위”의 형식으로 표현됩니다. 이러한 형식을 반영하여 정확하게 기계 번역이 될 수 있도록 하였습니다. 또한 실제 데이터를 살펴보면서, 현지인이 쓰고 있는 표현 방식을 이해하고, 이를 번역에 그대로 반영될 수 있게 하였습니다.
국가별 특성 반영
한국어의 근(“catty”)은 주로 동아시아에서 사용되는 단위입니다. 이를 중국어 간체자와 중국어 번체자에는 “斤”으로, 베트남어에는 “cân”으로, 그리고 말레이어에는 “kati” 으로 단위를 추가해주었습니다. 특히 해당 단위는 국가별로 무게가 조금씩 다른데, 중국 본토는 500g, 대만은 600g, 베트남은 605g 등 각 국가에 맞는 무게를 번역 엔진에 반영하였습니다. 같은 단위이지만 국가별 특성을 번역에 반영함으로써 시청자는 보다 ‘현지화’된 번역을 경험할 수 있습니다.
언어별 특성 반영
앞서 공유한 블랙팬서: 와칸다 포에버의 자막을 보면, 언어별 단위는 다양한 형태로 구성됩니다. 한국어처럼 중심 의미를 지닌 어근에 접사*를 붙여서 활용하는 형태가 있고, 일본어처럼 띄어쓰기를 하지 않는 언어들도 있습니다. 이러한 언어적 특성을 반영하지 않으면, 굴절된 단위는 반영하지 못하거나, 띄어쓰기 설정 여부에 따라 아예 단어 자체를 인식하지 못하는 경우가 생기게 됩니다. 따라서 각 언어를 교착어, 굴절어, 고립어 등으로 분류하고, 각각을 따로 처리하여 언어별로 특성을 반영하였습니다. 가령 교착어에 해당되는 경우, 단위 뒤에 접사가 붙는 경우를 인지하여 이를 현지에 맞도록 번역할 수 있게 학습시켰습니다. 굴절어의 경우에는 단위 형태가 변하는 경우에도 올바르게 인식할 수 있도록 하였습니다. 고립어의 경우에는 띄어쓰기가 없는 문장에서 단위를 정확하게 번역할 수 있도록 하였으며, 이 밖의 다른 언어들도 각각의 특성을 반영하여, 다양한 형태의 단위를 잘 이해할 수 있도록 학습시켰습니다.
- 접사 : 어근에 어떤 뜻을 더해 주거나 품사를 바꿈으로써 새로운 단어를 만드는 의존형태소
언어별 숫자 표기법 반영
언어별로 문자뿐 아니라 숫자도 차이를 보입니다. 예를 들어 숫자 “1200400.1”을 표현한다고 했을 때, 한국어는 천의 자리 구분 표시로 ","를, 소수점 구분 표시로 "."를 사용하여 "1,200,400.1"로 표기합니다. 이에 반해 프랑스어는 천의 자리 구분 표시로 “ “(공백)을 사용하고, 소수점 구분 표시로는 “,”을 사용하여 "1 200 400,1”로 표기합니다. 몇몇 언어의 경우에는 천의 자리를 구분하지 않거나, 혹은 자체 문자를 사용하여 표현하기도 합니다. XL8에서는 이러한 특성을 반영하기 위해서 각 언어별 숫자 포맷을 만들어 주었고, 해당 언어의 문장을 반영한 테스트를 통해서 언어별 숫자 특성을 정확히 반영하였습니다.
실제 데이터 반영
단위를 단순히 직역한다면, 좋은 기계 번역이 될 수 없습니다. 좋은 기계 번역은 실제 ’현지인‘들이 사용하는 말들을 반영해야 합니다. 예를 들어 “degree Celsius”를 반영한다고 했을 때, 한국어로 직역하게 되면 “섭씨 온도”로 나오게 됩니다. 영어에서는 화씨를 주로 사용하기에 섭씨 온도의 경우에는 “1 degree Celsius” 형태로 쓰는 경우가 많지만, 한국어의 경우에는 “1 섭씨 온도”라고 사용하지 않습니다. 보통은 “섭씨 1도”나 그냥 “1도”라고 쓰이는 경우가 많습니다. 이러한 다양한 단위의 쓰임을 실제 데이터에서 찾고, 빈번하게 사용되는 형태를 반영하여 ‘현지화’된 번역을 제공합니다.
완벽한 현지화를 위해 학습된 단위는 변환(conversion) 과정을 통해 재 확인
언어별 단위는 추가할 때 1차 확인 과정을 거칩니다. 다만, 단위의 경우에는 실제로 번역에 사용할 때 ‘변환’ 과정을 거쳐서 사용하게 됩니다. 따라서 이 과정이 잘 수행되는지 2차 확인 과정을 추가하여 진행하고 있습니다. 2차 확인 과정에는 다음이 포함됩니다. 숫자와 단위가 잘 들어가 있는지 확인합니다. 그리고 단위는 부피, 무게, 길이 등으로 분류되어 있는데, 변환하고자 하는 두 언어의 단위가 같은 분류로 되어 있는지 확인합니다. 그리고 단위 값을 잘 반영하여 변환하는지, 그 과정에서 오류가 없는 지를 검사합니다. 이 과정을 통해서 유닛들이 잘 추가되었는지, 그리고 실제 번역 과정에서 잘 쓰일 수 있는 지를 확인할 수 있습니다.
가장 정확한 영상 번역을 위한 XL8의 현지화 전략
XL8은 전 세계에서 유일하게 구어체를 기반으로하는 미디어 엔터테인먼트 콘텐트에 특화된 기계 번역 회사입니다. 저희는 많은 사람들로부터 번역 엔진이 어떻게 현지에 가장 최적화되어 콘텐트를 번역할 수 있는지 많은 질문을 받아왔습니다. XL8는 그동안 블로그를 통해 문맥 인식, 나이와 성별 추정, 글로서리 활용 등 다양한 기능에 대해 소개했으며, 오늘 포스팅에서는 언어별로 적용하는 단위 변환에 대해 소개 했습니다.
번역은 단순히 언어를 바꾸어 전달하는 것이 아닙니다. 해당 국가의 문화에 대한 깊은 이해가 수반되어야 창작자의 의도가 제대로 전달될 것이며, 시청자는 그 감동을 그대로 느낄 수 있을 것입니다. XL8은 지금까지 언어와 국가에 맞는 특성을 반영한 번역을 하기 위해서 다양한 노력을 기울여 왔습니다.
앞으로도 ‘현지화’된 번역, 시청자들이 원작의 감동을 그대로 느낄 수 있는 번역을 제공할 XL8의 행보를 기대해주세요!