TECH M
TECH M
네이버, 딥러닝으로 매일 200만 개 이미지 처리
(조근희 네이버 개발자가 25일 서울 강남구 코엑스에서 열린 개발자대회 'DEVIEW2016'에서 '딥러닝을 활용한 이미지 검색'을 주제로 발표를 하고 있다. ) |
"이미지에 자동으로 의미를 부여해 검색 결과를 높이는 서비스 개선이 이뤄질 것이다"
25일 서울 강남구 코엑스에서 개발자대회 'DEVIEW2016'에서 딥러닝을 이용한 네이버의 이미지 검색 기술이 소개됐다. 발표자들은 딥러닝을 통해 네이버의 이미지 검색 서비스 수준이 더 높아질 것으로 확신했다.
이날 '딥러닝을 활용한 이미지 검색'을 주제로 진행된 발표는 조근희, 김시연 네이버 개발자가 진행했다. 두 발표자는 딥러닝을 활용한 이미지 검색의 기본 원리와 딥러닝을 활용한 네이버 이미지 검색 서비스인 포토요약과 타임라인을 소개했다.
발표는 사용자가 찾으려는 이미지 정보를 글자 형태로 입력하면 해당 질의어와 관련된 이미지를 찾는 서비스를 중심으로 진행됐다. 글자 형태의 이미지 검색 질의어로 좋은 검색 결과를 보여주기 위해 선행돼야하는 과제는 이미지가 어떤 내용인지 파악하는 것이다. 이미지의 설명과 질의어가 일치하는 경우 질의어에 대한 검색 결과로 해당 이미지를 보여주기 때문이다.
조근희 개발자는 이미지에 대한 설명을 확인하는 방법으로 딥러닝을 사용하고 있다고 설명했다.
그는 "네이버는 26억 개의 이미지를 검색에 사용하고 있고, 매일 200만 개씩 증가하고 있다"며 "이미지와 텍스트가 함께 나오는 데이터는 블로그에서 최근 1년 이내에 생성된 것만 해도 12억 건에 이른다"고 말했다. 수많은 데이터를 처리해야하는 만큼 딥러닝이 최적의 방법이라는 것이다.
하지만 단순히 딥러닝을 적용한다고 블로그 글에서 이미지와 이미지에 대한 설명이 자동으로 추출되는 것은 아니다. 블로그에서 여러 개의 그림과 여러 문장의 글이 함께 나오기 때문에 이들 가운데 의미있는 조합을 찾아내는 것이 쉽지않다. 한 예로 고층 아파트 단지나 빌딩에 대한 사진에 '고층 건물'이라는 설명을 붙일 수 있지만, 실제 블로그에서 고층 아파트나 빌딩의 사진은 권리금, 분양가 등의 단어와 함께 사용되는 경우가 많다는 것이다.
이날 발표에서는 텍스트와 이미지를 조합한 검색 서비스 가운데 타임라인과 포토요약이 소개됐다.
타임라인 서비스의 경우 연예인과 같이 많은 사람이 공통사진을 찍어올리는 경우에 유용한 이미지 검색 방법이다.
김시연 개발자는 "인물 이미지를 이벤트 타임라인으로 보여주는 것"이라며 "같은 날, 같은 장소에서 찍힌 유명인의 사진은 비슷하기 때문에 가능한 서비스"라고 설명했다.
그는 이벤트 확인, 사진 비교와 선택에 모두 딥러닝을 활용한다고 설명했다.
포토요약에서는 사람들의 관심사가 일정한 주제를 중심으로 서비스해 이런 문제를 해결하고 있다. 현재 서비스하고 있는 범주는 식장, 미용실, 명소다.
조근희 개발자는 "이들 범주는 사람들이 음식, 시술결과, 풍경 등 공통된 관심사를 갖고 사진을 찍고 검색한다"며 "다른 범주도 공통된 관심사를 찾아낸다면 추가 서비스가 가능하다"고 말했다.
현재 조근희 개발자가 시도하고 있는 방법은 감독 학습과 비감독 학습을 번갈아 사용하는 방법이다.
그는 "감독학습을 통해 학습 데이터를 만들고 이렇게 만들어진 모델로 비감독 학습으로 새로운 범주를 찾고 이 범주로 다시 감독 학습을 반복해 새로운 범주에 해당하는 이미지 검색 서비스를 만들 수 있다"고 말했다.
[테크M = 도강호 기자(gangdogi@techm.kr)]
-
SW 교육의 모든 것 ‘2016 SW 교육 페스티벌’ 개최[테크M = 테크M취재팀] 소프트웨어(SW) 교육의 현 주소와 나아갈 방향을 제시하는 행사가 열린다.한국과학창의재단은 오는 28, 29일 양일간 일산 킨텍스 제2전시장에서 ‘2016 SW 교육 페스티벌’을 개최한다고 밝혔다.교육부와 미래창조과학부가 공동주최하고 한국과학창의재단이 주관하는 이번 SW 교육 페스티벌은 SW 전시와 체험, 워크숍 프로그램을 비롯해 6가지 행사를 중심으로 진행된다.‘SW 교육 선도학교 프로그램&r2016-10-26 17:10:11테크M취재팀
-
더불어민주당 홈페이지 디도스 공격 받아더불어민주당의 공식 홈페이지(http://theminjoo.kr)가 26일 오후 사이버공격을 당해 일시적으로 마비되는 사건이 발생했다. 최순실 게이트로 민감한 시점에서 야당에 대한 사이버공격이 발생해 파문이 예상된다. 더민주는 26일 페이스북, 트위터 공지를 통해 “26일 오후 1시부터 2회에 걸친 디도스 공격으로 홈페이지 접속 장애가 발생했다”고 밝혔다. 더민주는 공격을 당한 후 서버를 한국인터넷진흥원(KISA)의 사이버대피소로 입주시켜 홈페이지를 보호했으며 서버관리업체를 통해 명확한 디도스 공격 여2016-10-26 17:10:06강진규 기자
-
[MIT선정 젊은혁신가]땀밴드로 건강 상태 체크한다웨이 가오 캘리포니아대 버클리캠퍼스 연구원건강 상태를 파악하는 땀밴드를 만들고 있다.“나는 중국 쉬저우의 작은 마을에서 자랐습니다. 어렸을 때 사람들이 다양한 병으로 죽는 것을 봤죠. 많은 이들이 자신의 병을 너무 늦게 발견했습니다.그래서 사람들의 건강 상태를 계속 측정하다가 문제가 생기기 전에 알려주는 전자기기를 만들겠다고 생각했습니다.우리 몸은 끊임없이 데이터를 생산합니다. 애플 워치, 핏빗 등 수많은 웨어러블 장비들이 있지만, 이들은 그저 신체 활동이나 맥박, 체온 같은 기본적인 정보만을 측정할 뿐2016-10-26 15:10:03MIT테크놀로지리뷰