TECH M
TECH M
네이버, 딥러닝으로 매일 200만 개 이미지 처리
(조근희 네이버 개발자가 25일 서울 강남구 코엑스에서 열린 개발자대회 'DEVIEW2016'에서 '딥러닝을 활용한 이미지 검색'을 주제로 발표를 하고 있다. ) |
"이미지에 자동으로 의미를 부여해 검색 결과를 높이는 서비스 개선이 이뤄질 것이다"
25일 서울 강남구 코엑스에서 개발자대회 'DEVIEW2016'에서 딥러닝을 이용한 네이버의 이미지 검색 기술이 소개됐다. 발표자들은 딥러닝을 통해 네이버의 이미지 검색 서비스 수준이 더 높아질 것으로 확신했다.
이날 '딥러닝을 활용한 이미지 검색'을 주제로 진행된 발표는 조근희, 김시연 네이버 개발자가 진행했다. 두 발표자는 딥러닝을 활용한 이미지 검색의 기본 원리와 딥러닝을 활용한 네이버 이미지 검색 서비스인 포토요약과 타임라인을 소개했다.
발표는 사용자가 찾으려는 이미지 정보를 글자 형태로 입력하면 해당 질의어와 관련된 이미지를 찾는 서비스를 중심으로 진행됐다. 글자 형태의 이미지 검색 질의어로 좋은 검색 결과를 보여주기 위해 선행돼야하는 과제는 이미지가 어떤 내용인지 파악하는 것이다. 이미지의 설명과 질의어가 일치하는 경우 질의어에 대한 검색 결과로 해당 이미지를 보여주기 때문이다.
조근희 개발자는 이미지에 대한 설명을 확인하는 방법으로 딥러닝을 사용하고 있다고 설명했다.
그는 "네이버는 26억 개의 이미지를 검색에 사용하고 있고, 매일 200만 개씩 증가하고 있다"며 "이미지와 텍스트가 함께 나오는 데이터는 블로그에서 최근 1년 이내에 생성된 것만 해도 12억 건에 이른다"고 말했다. 수많은 데이터를 처리해야하는 만큼 딥러닝이 최적의 방법이라는 것이다.
하지만 단순히 딥러닝을 적용한다고 블로그 글에서 이미지와 이미지에 대한 설명이 자동으로 추출되는 것은 아니다. 블로그에서 여러 개의 그림과 여러 문장의 글이 함께 나오기 때문에 이들 가운데 의미있는 조합을 찾아내는 것이 쉽지않다. 한 예로 고층 아파트 단지나 빌딩에 대한 사진에 '고층 건물'이라는 설명을 붙일 수 있지만, 실제 블로그에서 고층 아파트나 빌딩의 사진은 권리금, 분양가 등의 단어와 함께 사용되는 경우가 많다는 것이다.
이날 발표에서는 텍스트와 이미지를 조합한 검색 서비스 가운데 타임라인과 포토요약이 소개됐다.
타임라인 서비스의 경우 연예인과 같이 많은 사람이 공통사진을 찍어올리는 경우에 유용한 이미지 검색 방법이다.
김시연 개발자는 "인물 이미지를 이벤트 타임라인으로 보여주는 것"이라며 "같은 날, 같은 장소에서 찍힌 유명인의 사진은 비슷하기 때문에 가능한 서비스"라고 설명했다.
그는 이벤트 확인, 사진 비교와 선택에 모두 딥러닝을 활용한다고 설명했다.
포토요약에서는 사람들의 관심사가 일정한 주제를 중심으로 서비스해 이런 문제를 해결하고 있다. 현재 서비스하고 있는 범주는 식장, 미용실, 명소다.
조근희 개발자는 "이들 범주는 사람들이 음식, 시술결과, 풍경 등 공통된 관심사를 갖고 사진을 찍고 검색한다"며 "다른 범주도 공통된 관심사를 찾아낸다면 추가 서비스가 가능하다"고 말했다.
현재 조근희 개발자가 시도하고 있는 방법은 감독 학습과 비감독 학습을 번갈아 사용하는 방법이다.
그는 "감독학습을 통해 학습 데이터를 만들고 이렇게 만들어진 모델로 비감독 학습으로 새로운 범주를 찾고 이 범주로 다시 감독 학습을 반복해 새로운 범주에 해당하는 이미지 검색 서비스를 만들 수 있다"고 말했다.
[테크M = 도강호 기자(gangdogi@techm.kr)]
-
'전자정부 名家' LG CNS, 1200억 '행복e음' 사업 수주로 자존심 회복할까공공 소프트웨어(SW) 사업의 강자 LG CNS가 올해 공공시장 첫 '대어'로 꼽히는 보건복지부 차세대 사회보장정보시스템(행복e음) 구축 사업에 출사표를 던졌다.17일 업계에 따르면 LG CNS는 이날 행복e음 사업 재입찰에 제안서를 제출했다.행복e음 사업은 지난 2009년 복지부가 각종 사회복지 급여 및 서비스 지원 대상자의 자격과 이력에 관한 정보를 통합 관리하기 위해 구축한 시스템을 현대화 하는 사업이다. 올해부터 3년간 약 1220억원이 투입된다.이 사업은 지난 3일 첫 입찰 공고를 마감했으나 무2020-03-17 16:54:47테크M 남도영 기자
-
네이버 vs 카카오, 포털-메신저 이은 3라운드... 링은 '콘텐츠'#수천억 자금으로 뭘 만들까#넷플릭스 잡을 수 있을까#톡TV-네이버TV 경쟁 볼만할 듯국내 대표 인터넷 맞수 기업 네이버와 카카오의 세번재 경쟁 무대 막이 올랐다. 포털과 메신저 플랫폼에서 치열하게 경쟁해온 두 기업의 3라운드 링은 '콘텐츠'다. 이미 양사는 콘텐츠 자회사에 수천억원의 자금을 쌓아놨다. 올해부터 본격적으로 콘텐츠 양산에 돌입한다. 콘텐츠 주도권 경쟁의 전초전은 이미 시작됐다.◆실탄 마련한 카카오M, 직접 콘텐츠 제작 개시카카오는 지난 16일 콘텐츠 자회사 카카오M이 3자 배정 유상증자2020-03-17 15:53:45테크M 허준 기자
-
[템 사이트] 게임 하면 유니티! 2020년 기대되는 유니티 기반 게임은?연일 쏟아지는 신작 소식이 게이머들을 설레게 하고 있습니다. 남다른 스케일을 자랑하는 게임업체들의 대형 신작은 물론 독특한 게임성을 내세운 게임까지, 게이머들의 다양한 취향을 만족시킬만한 다양한 신작게임들이 많습니다.오늘은 특히 유니티 엔진을 기반으로 한 신작 게임들을 엄선해서 소개할까 합니다. 유니티는 이미 전세계 수백만명의 게임 개발자들이 사용하는 유명한 게임엔진입니다. 최신 버전의 엔진 '유니티 2019.3' 업데이트를 통해 260가지가 넘는 개선사항과 신규 기능이 포함돼 진일보한 고성능 그래픽과 최적화 기2020-03-17 15:30:39테크M 허준 기자