바로가기 메뉴
본문 바로가기
대메뉴 바로가기

TECH M

네이버, 딥러닝으로 매일 200만 개 이미지 처리

2016-10-25도강호 기자

조근희 네이버 개발자가 25일 서울 강남구 코엑스에서 열린

(조근희 네이버 개발자가 25일 서울 강남구 코엑스에서 열린 개발자대회 'DEVIEW2016'에서 '딥러닝을 활용한 이미지 검색'을 주제로 발표를 하고 있다. )

 

"이미지에 자동으로 의미를 부여해 검색 결과를 높이는 서비스 개선이 이뤄질 것이다"

25일 서울 강남구 코엑스에서 개발자대회 'DEVIEW2016'에서 딥러닝을 이용한 네이버의 이미지 검색 기술이 소개됐다. 발표자들은 딥러닝을 통해 네이버의 이미지 검색 서비스 수준이 더 높아질 것으로 확신했다.

이날 '딥러닝을 활용한 이미지 검색'을 주제로 진행된 발표는 조근희, 김시연 네이버 개발자가 진행했다. 두 발표자는 딥러닝을 활용한 이미지 검색의 기본 원리와 딥러닝을 활용한 네이버 이미지 검색 서비스인 포토요약과 타임라인을 소개했다.

발표는 사용자가 찾으려는 이미지 정보를 글자 형태로 입력하면 해당 질의어와 관련된 이미지를 찾는 서비스를 중심으로 진행됐다. 글자 형태의 이미지 검색 질의어로 좋은 검색 결과를 보여주기 위해 선행돼야하는 과제는 이미지가 어떤 내용인지 파악하는 것이다. 이미지의 설명과 질의어가 일치하는 경우 질의어에 대한 검색 결과로 해당 이미지를 보여주기 때문이다.

조근희 개발자는 이미지에 대한 설명을 확인하는 방법으로 딥러닝을 사용하고 있다고 설명했다.

그는 "네이버는 26억 개의 이미지를 검색에 사용하고 있고, 매일 200만 개씩 증가하고 있다"며 "이미지와 텍스트가 함께 나오는 데이터는 블로그에서 최근 1년 이내에 생성된 것만 해도 12억 건에 이른다"고 말했다. 수많은 데이터를 처리해야하는 만큼 딥러닝이 최적의 방법이라는 것이다.

하지만 단순히 딥러닝을 적용한다고 블로그 글에서 이미지와 이미지에 대한 설명이 자동으로 추출되는 것은 아니다. 블로그에서 여러 개의 그림과 여러 문장의 글이 함께 나오기 때문에 이들 가운데 의미있는 조합을 찾아내는 것이 쉽지않다. 한 예로 고층 아파트 단지나 빌딩에 대한 사진에 '고층 건물'이라는 설명을 붙일 수 있지만, 실제 블로그에서 고층 아파트나 빌딩의 사진은 권리금, 분양가 등의 단어와 함께 사용되는 경우가 많다는 것이다.

이날 발표에서는 텍스트와 이미지를 조합한 검색 서비스 가운데 타임라인과 포토요약이 소개됐다.

타임라인 서비스의 경우 연예인과 같이 많은 사람이 공통사진을 찍어올리는 경우에 유용한 이미지 검색 방법이다.

김시연 개발자는 "인물 이미지를 이벤트 타임라인으로 보여주는 것"이라며 "같은 날, 같은 장소에서 찍힌 유명인의 사진은 비슷하기 때문에 가능한 서비스"라고 설명했다.

그는 이벤트 확인, 사진 비교와 선택에 모두 딥러닝을 활용한다고 설명했다.

포토요약에서는 사람들의 관심사가 일정한 주제를 중심으로 서비스해 이런 문제를 해결하고 있다. 현재 서비스하고 있는 범주는 식장, 미용실, 명소다.

조근희 개발자는 "이들 범주는 사람들이 음식, 시술결과, 풍경 등 공통된 관심사를 갖고 사진을 찍고 검색한다"며 "다른 범주도 공통된 관심사를 찾아낸다면 추가 서비스가 가능하다"고 말했다.

현재 조근희 개발자가 시도하고 있는 방법은 감독 학습과 비감독 학습을 번갈아 사용하는 방법이다.

그는 "감독학습을 통해 학습 데이터를 만들고 이렇게 만들어진 모델로 비감독 학습으로 새로운 범주를 찾고 이 범주로 다시 감독 학습을 반복해 새로운 범주에 해당하는 이미지 검색 서비스를 만들 수 있다"고 말했다.

[테크M = 도강호 기자(gangdogi@techm.kr)]

 

 

 

(주)테크엠주소 : 서울시 강남구 테헤란로2길 27, 10층 (역삼동, 비젼타워)대표이사.발행인 : 김현기편집인 : 허준개인정보보호책임자 : 김현기청소년보호책임자 : 허준
사업자등록번호 : 553-81-01725대표전화 : 070-4513-1460보도자료 및 제보 : press@techm.kr