TECH M
×
TECH M
구글, "머신러닝 적용한 번역 서비스로 언어 장벽 허물 것"
2016-11-29도강호 기자

(버락 투로프스키 구글 번역 프로덕트 매니지먼트 총괄이 29일 서울 강남구 구글코리아에서 열린 기자간담회에서 영상 발표를 통해 머신러닝이 적용된 구글 번역 서비스에 대해 설명하고 있다.) |
"신경망 번역을 구글 번역이 지원하는 모든 언어에 제공하는 것, 구글 번역을 사용하는 지역에서 신경망을 사용할 수 있게 하는 것이 목표다."
버락 투로프스키 구글 번역 프로덕트 매니지먼트 총괄은 29일 서울 강남구 구글코리아에서 열린 기자간담회에서 "새로운 구글 번역 서비스를 통해 언어 장벽이 더 이상 장애물이 되지 않는 세계를 만들겠다"는 비전을 제시했다.
이날 기자간담회에서는 투로프스키 총괄과 함께 제임스 갤러거 구글 포토 소프트웨어 엔지니어링 디렉터, 알렉스 로 포토 검색 프로덕트 매니저가 화상 연결을 통해 새로워진 '구글 번역'과 '구글 포토' 서비스에 대해 설명했다. 구글은 지난 15일 머신러닝 기술을 적용해 성능을 향상시킨 구글 포토와 구글 번역 서비스를 선보였다.
투로프스키 총괄은 "신경망 기계번역 기술 덕분에 구글 번역 오류가 (언어별로) 55%에서 85%가량 감소했다"며 "이는 지난 10년 동안을 합친 것보다 큰 도약"이라고 설명했다. 투로프스키 총괄은 또 "신경망이 도입되면서 번역의 정확성뿐만 아니라 번역 내용이 자연스러워지는 성과가 있었다"고 설명했다.
새롭게 도입된 신경망 기계번역은 단어나 어절 단위로 번역하는 기존 방법과 달리 문장을 전체로 번역한다. 투로프스키 총괄은 "신경망 기계번역의 혁신적인 돌파구가 한 문장을 전체로 번역하는 것"이라며 "문맥을 중시하는 번역으로 자연스러운 번역이 가능해졌다"고 말했다.
현재 신경망 번역이 적용된 언어는 영어, 한국어, 일본어, 터키어, 중국어, 프랑스어, 독일어, 스페인어, 포르투갈어이다. 신경망 번역이 적용된 언어들은 각 언어 조합에 대해 신경망이 적용된 번역 서비스를 이용할 수 있다.
투로프스키 총괄은 또 "신경망은 여러 개의 언어를 한 번에 훈련할 수 있는 것이 장점"이라고 설명했다. 예를 들어 한국어와 일본어 번역에 대한 훈련 데이터가 없더라도 한국어와 영여, 일본어와 영어를 훈련할 수 있으면 한국어와 일본어 번역도 가능하다는 것이다. 투로프스키 총괄은 "인터넷에 공개되지 않은 언어의 경우 트레이닝 데이터를 확보하기 어려운데 신경망 번역을 통해 이런 문제를 해결할 수 있다"고 말했다.
번역의 품질을 크게 향상시킨 신경망 알고리즘은 구글 포토에도 적용되고 있다. 이미지를 올리면 자동으로 이미지를 분류하고 태깅하는데 신경망 알고리즘이 적용된다. 특별히 사진을 관리하지 않더라도 사람, 장소, 이벤트 등을 검색해 원하는 이미지만 볼 수 있는 것이다.
알렉스 로 매니저는 "방대한 양의 훈련 데이터를 통해 알고리즘을 만든다"며 "이 알고리즘은 고양이가 어떻게 생겼는지 일일이 알려주지 않아도 신경망으로 자동으로 고양이인지 개인지 안다"고 설명했다.
훈련에는 다양한 사진이 사용됐다. 로 매니저는 "인터넷에 공개된 방대한 이미지를 이용해 이미지들간의 유사점을 보면서 훈련했다"며 "구글 이미지 검색에서 단어와 이미지의 연관성에 대한 데이터도 훈련에 이용했다"고 설명했다.
머신러닝은 구글이 새로 출시한 '구글 포토스캐너'에도 사용됐다. 구글 포토스캐너는 종이 사진을 디지털 이미지로 변환해주는 서비스다.
제임스 갤러거 디렉터는 "디지털 카메라가 나오기 전에 종이에 인쇄된 사진은 정리돼 있지도 않고 기억에서 희미해지고 사라질 뿐만 아니라 다른 사람과 공유하기도 어렵다"고 지적했다. 그는 또 "디지털 솔루션은 무료가 아니거나 해상도도 만족스럽지 않고 시간이 오래걸리거나, 사진 경계선이 비뚤어지거나 반사광이 생기는 문제가 생긴다"며 "구글 포토스캐너는 이런 문제를 해결한다"고 강조했다.
갤러거 디렉터는 "정확하게 경계에 맞춰 사진을 자르는 것이 힘들다"며 "수십만장을 학습해 사진과 배경을 정확하게 구분해 자르기 위한 알고리즘을 개발했다"고 설명했다.
[테크M = 도강호 기자(gangdogi@techm.kr)]
-
'전자정부 名家' LG CNS, 1200억 '행복e음' 사업 수주로 자존심 회복할까공공 소프트웨어(SW) 사업의 강자 LG CNS가 올해 공공시장 첫 '대어'로 꼽히는 보건복지부 차세대 사회보장정보시스템(행복e음) 구축 사업에 출사표를 던졌다.17일 업계에 따르면 LG CNS는 이날 행복e음 사업 재입찰에 제안서를 제출했다.행복e음 사업은 지난 2009년 복지부가 각종 사회복지 급여 및 서비스 지원 대상자의 자격과 이력에 관한 정보를 통합 관리하기 위해 구축한 시스템을 현대화 하는 사업이다. 올해부터 3년간 약 1220억원이 투입된다.이 사업은 지난 3일 첫 입찰 공고를 마감했으나 무2020-03-17 16:54:47테크M 남도영 기자
-
네이버 vs 카카오, 포털-메신저 이은 3라운드... 링은 '콘텐츠'#수천억 자금으로 뭘 만들까#넷플릭스 잡을 수 있을까#톡TV-네이버TV 경쟁 볼만할 듯국내 대표 인터넷 맞수 기업 네이버와 카카오의 세번재 경쟁 무대 막이 올랐다. 포털과 메신저 플랫폼에서 치열하게 경쟁해온 두 기업의 3라운드 링은 '콘텐츠'다. 이미 양사는 콘텐츠 자회사에 수천억원의 자금을 쌓아놨다. 올해부터 본격적으로 콘텐츠 양산에 돌입한다. 콘텐츠 주도권 경쟁의 전초전은 이미 시작됐다.◆실탄 마련한 카카오M, 직접 콘텐츠 제작 개시카카오는 지난 16일 콘텐츠 자회사 카카오M이 3자 배정 유상증자2020-03-17 15:53:45테크M 허준 기자
-
[템 사이트] 게임 하면 유니티! 2020년 기대되는 유니티 기반 게임은?연일 쏟아지는 신작 소식이 게이머들을 설레게 하고 있습니다. 남다른 스케일을 자랑하는 게임업체들의 대형 신작은 물론 독특한 게임성을 내세운 게임까지, 게이머들의 다양한 취향을 만족시킬만한 다양한 신작게임들이 많습니다.오늘은 특히 유니티 엔진을 기반으로 한 신작 게임들을 엄선해서 소개할까 합니다. 유니티는 이미 전세계 수백만명의 게임 개발자들이 사용하는 유명한 게임엔진입니다. 최신 버전의 엔진 '유니티 2019.3' 업데이트를 통해 260가지가 넘는 개선사항과 신규 기능이 포함돼 진일보한 고성능 그래픽과 최적화 기2020-03-17 15:30:39테크M 허준 기자