방대한 양의 데이터에서 패턴을 찾아내는 AI의 핵심기술 딥러닝(심층학습)이 가장 잘할 수 있는 분야가 바로 번역이다. 인간이라면 불가능하지만 AI는 매일 쉬지 않고 번역을 학습하기 때문에 시간이 지날수록 똑똑해진다. 검색 데이터와 딥러닝 기술을 보유한 구글과 네이버와 같은 포털사업자가 번역기술을 갈고 닦는 이유다.
이 성과를 토대로 번역의 진화를 이끌고 있는 구글은 지난해 9월 ‘구글 신경망 기계번역(GNMT)' 기술을 공개하고 11월에 한국어를 포함한 8개 언어 조합에 적용했다.
신경망 기계번역(NMT)은 기존 구문 기반 기계번역이 문장을 단어와 구 단위로 쪼개 개별적으로 번역한 것과 달리, 전체 문장을 하나의 번역 단위로 간주해 한꺼번에 번역하는 방식이다. 문장 전체의 흐름을 파악하기 때문에 자연스러운 번역이 가능해졌다.
현재 인터넷과 애플리케이션으로 제공되는 ‘구글번역’은 103개 언어를 번역해 전 세계 온라인 인구의 99%를 커버한다. 이용자는 5억명에 달하고, 매일 1000억 회 이상의 번역이 이뤄지고 있다.
네이버도 올해 6월 신경망 기계번역 기술이 적용된 ‘파파고’를 선보이며 본격적인 NMT 기술경쟁에 뛰어든다.
네이버는 이에 앞서 지난해 10월 파파고 베타버전을 공개하고 200자 이내의 한국어와 영어 문장에 NMT를 먼저 적용했으며, 지금은 한국어와 중국어에도 NMT 번역이 이뤄지고 있다.
10년 전 서비스를 시작한 구글번역보다 뒤늦은 출발이었지만, 파파고의 번역 정확도는 상당하다. ‘나는 밤마다 밤을 먹는다’를 번역할 때 파파고는 밤을 먹는 밤으로 인식했지만 구글번역은 저녁의 의미로 인식했다. ‘세월호’라는 단어도 파파고는 ‘Ferry Sewol'이라고 정확하게 번역한 반면, 구글번역은 ’Time Lake’로 오역했다.
네이버 관계자는 “단순히 번역 사례 몇 개로 품질의 우열을 가릴 수 없다”면서 “파파고가 구글보다 잘되는 번역이 있고, 파파고보다 구글이 잘되는 번역이 있는데 그것은 각각의 AI가 학습한 데이터의 차이에서 오는 것”이라고 설명했다.
파파고는 현재 한국어, 영어, 일본어, 중국어 번역을 제공하고 있지만 올해 스페인어와 프랑스어, 인도네시아어 등 6개 언어를 추가할 예정이다. 앞으로도 파파고의 대응 언어는 계속해서 늘어날 전망이다.
IT업계 관계자는 "지난 10년 동안 구글의 번역기술은 크게 진화했고, 네이버도 번역기술의 개발을 본격화하고 있다"며 "신경망 기계번역이 아무리 발전해도 언어에는 복잡한 의미가 담겨 있기 때문에 인간처럼 번역하는 데 시간이 걸릴 것"이라고 말했다.
구글 관계자는 "구글도 번역의 정확도를 끌어 올리기 위해 노력하고 있으며, 번역에 대한 정보를 제공하는 구글번역 커뮤니티를 만들어 번역의 질을 높이는 데 힘쓰고 있다"고 말했다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지