바로가기 메뉴
본문 바로가기
대메뉴 바로가기

TECH M

구글, "머신러닝 적용한 번역 서비스로 언어 장벽 허물 것"

2016-11-29도강호 기자
버락 투로프스키 구글 번역 프로덕트 매니지먼트 총괄이 29일 서울 강남구 구글코리아에서 열린 기자간담회에서 영상 발표를 통해 머신러닝이 적용된 구글 번역 서비스에 대해 설명하고 있다.
(버락 투로프스키 구글 번역 프로덕트 매니지먼트 총괄이 29일 서울 강남구 구글코리아에서 열린 기자간담회에서 영상 발표를 통해 머신러닝이 적용된 구글 번역 서비스에 대해 설명하고 있다.)




"신경망 번역을 구글 번역이 지원하는 모든 언어에 제공하는 것, 구글 번역을 사용하는 지역에서 신경망을 사용할 수 있게 하는 것이 목표다."

버락 투로프스키 구글 번역 프로덕트 매니지먼트 총괄은 29일 서울 강남구 구글코리아에서 열린 기자간담회에서 "새로운 구글 번역 서비스를 통해 언어 장벽이 더 이상 장애물이 되지 않는 세계를 만들겠다"는 비전을 제시했다.

이날 기자간담회에서는 투로프스키 총괄과 함께 제임스 갤러거 구글 포토 소프트웨어 엔지니어링 디렉터, 알렉스 로 포토 검색 프로덕트 매니저가 화상 연결을 통해 새로워진 '구글 번역'과 '구글 포토' 서비스에 대해 설명했다. 구글은 지난 15일 머신러닝 기술을 적용해 성능을 향상시킨 구글 포토와 구글 번역 서비스를 선보였다.

투로프스키 총괄은 "신경망 기계번역 기술 덕분에 구글 번역 오류가 (언어별로) 55%에서 85%가량 감소했다"며 "이는 지난 10년 동안을 합친 것보다 큰 도약"이라고 설명했다. 투로프스키 총괄은 또 "신경망이 도입되면서 번역의 정확성뿐만 아니라 번역 내용이 자연스러워지는 성과가 있었다"고 설명했다.

새롭게 도입된 신경망 기계번역은 단어나 어절 단위로 번역하는 기존 방법과 달리 문장을 전체로 번역한다. 투로프스키 총괄은 "신경망 기계번역의 혁신적인 돌파구가 한 문장을 전체로 번역하는 것"이라며 "문맥을 중시하는 번역으로 자연스러운 번역이 가능해졌다"고 말했다.

현재 신경망 번역이 적용된 언어는 영어, 한국어, 일본어, 터키어, 중국어, 프랑스어, 독일어, 스페인어, 포르투갈어이다. 신경망 번역이 적용된 언어들은 각 언어 조합에 대해 신경망이 적용된 번역 서비스를 이용할 수 있다.

투로프스키 총괄은 또 "신경망은 여러 개의 언어를 한 번에 훈련할 수 있는 것이 장점"이라고 설명했다. 예를 들어 한국어와 일본어 번역에 대한 훈련 데이터가 없더라도 한국어와 영여, 일본어와 영어를 훈련할 수 있으면 한국어와 일본어 번역도 가능하다는 것이다. 투로프스키 총괄은 "인터넷에 공개되지 않은 언어의 경우 트레이닝 데이터를 확보하기 어려운데 신경망 번역을 통해 이런 문제를 해결할 수 있다"고 말했다.

번역의 품질을 크게 향상시킨 신경망 알고리즘은 구글 포토에도 적용되고 있다. 이미지를 올리면 자동으로 이미지를 분류하고 태깅하는데 신경망 알고리즘이 적용된다. 특별히 사진을 관리하지 않더라도 사람, 장소, 이벤트 등을 검색해 원하는 이미지만 볼 수 있는 것이다.

알렉스 로 매니저는 "방대한 양의 훈련 데이터를 통해 알고리즘을 만든다"며 "이 알고리즘은 고양이가 어떻게 생겼는지 일일이 알려주지 않아도 신경망으로 자동으로 고양이인지 개인지 안다"고 설명했다.

훈련에는 다양한 사진이 사용됐다. 로 매니저는 "인터넷에 공개된 방대한 이미지를 이용해 이미지들간의 유사점을 보면서 훈련했다"며 "구글 이미지 검색에서 단어와 이미지의 연관성에 대한 데이터도 훈련에 이용했다"고 설명했다.

머신러닝은 구글이 새로 출시한 '구글 포토스캐너'에도 사용됐다. 구글 포토스캐너는 종이 사진을 디지털 이미지로 변환해주는 서비스다.

제임스 갤러거 디렉터는 "디지털 카메라가 나오기 전에 종이에 인쇄된 사진은 정리돼 있지도 않고 기억에서 희미해지고 사라질 뿐만 아니라 다른 사람과 공유하기도 어렵다"고 지적했다. 그는 또 "디지털 솔루션은 무료가 아니거나 해상도도 만족스럽지 않고 시간이 오래걸리거나, 사진 경계선이 비뚤어지거나 반사광이 생기는 문제가 생긴다"며 "구글 포토스캐너는 이런 문제를 해결한다"고 강조했다.

갤러거 디렉터는 "정확하게 경계에 맞춰 사진을 자르는 것이 힘들다"며 "수십만장을 학습해 사진과 배경을 정확하게 구분해 자르기 위한 알고리즘을 개발했다"고 설명했다.

[테크M = 도강호 기자(gangdogi@techm.kr)]

(주)테크엠주소 : 서울시 강남구 테헤란로2길 27, 10층 (역삼동, 비젼타워)대표이사.발행인 : 김현기편집인 : 허준개인정보보호책임자 : 김현기청소년보호책임자 : 허준
사업자등록번호 : 553-81-01725대표전화 : 070-4513-1460보도자료 및 제보 : press@techm.kr