바로가기 메뉴
본문 바로가기
대메뉴 바로가기

TECH M

국내 연구진 AI 영상인식 국제대회 2위

해당기술 CCTV, 블랙박스 영상 분석 등에 적용

2017-07-27강진규 기자

고종국 ETRI 책임연구원(왼쪽부터), 이승재 책임연구원, 박종열 시각지능연구그룹장, 윤영석 선임연구원, 조영주 연구원, 윤기민 연구원이 27일 미국 하와이 컨벤션센터에서 열린 국제 영상인식 대회에서 입상한 뒤 단체사진을 찍고 있다.

 

국내 연구진이 그동안 구글, 마이크로소프트(MS) 등이 우승했던 인공지능(AI) 영상인식 국제대회에서 2위와 3위에 입상하며 기술력을 입증했다. 이 기술들은 CCTV, 블랙박스 영상 분석은 물론 방송, 콘텐츠 분야 등에도 적용될 예정이다.

한국전자통신연구원(ETRI)은 27일 미국 하와이 컨벤션센터에서 개최된 국제 영상인식 대회(ILSVRC, 이미지넷) 사물검출 분야에서 사물 종류별 검출 성능 기준 2위, 평균 검출 정확도 기준 3위 성적을 달성했다고 밝혔다.

ILSVRC(ImageNet Large Scale Visual Recognition Challenge)는 2010년부터 매년 열리는 이미지 검색 대회다. 매년 글로벌 기업들과 대학들이 참여하고 있으며 2014년에는 구글, 2015년 MS가 대회 우승을 차지했다.

ETRI가 참가한 사물 검출 분야는 200가지 사물, 6만5500장 사진 중 사물의 종류와 위치를 찾아내 성능을 평가한다. 성적은 사물 종류별 검출 성능과 평균 검출 정확도(mAP)로 측정한다.

ETRI는 ‘딥뷰’팀과 ‘콘텐츠 비주얼 브라우징’팀이 참가해 딥러닝 기술 기반으로 사물의 종류와 위치를 검색하는 네트워크를 설계, 학습해 검출 성능과 정확도를 높이는데 주력했다.

 

ETRI 딥뷰(Deepview) 기술 개념도

 

그 결과 사물 종류별 검출성능 기준으로 ETRI 딥뷰팀이 2위를 차지했다. 딥뷰팀은 10가지 사물에 대해 최고 성능을 보였다.

ETRI는 사물 종류별 검출 성능이 높다는 것이 특정 사물에 대해 차별화된 기술력을 가지고 있다는 것을 의미한다고 설명했다. 이 분야에서 1위는 85개에서 최고 성능을 기록한 남경정보과학기술대(NUIST)가 차지했다.

이번 대회에는 전체 14개 기관이 참가했는데, 10가지 이상의 사물 종류에 대해 최고 성능을 기록한 팀은 2개팀에 불과했다. 지난해에는 21개팀이 참가, 3개팀이 이같은 성적을 기록했다.

ETRI 콘텐츠 비주얼 브라우징팀은 카이스트(KAIST) 신진우 교수팀과 함께 평균 검출 정확도(mAP) 기준 0.61로 3위를 달성했다.

mAP는 200가지 전체 사물의 검출 정확도를 나타내는 지표로 사물 검출 분야 종합 수준을 나타낸다. 전체 14개 참가기관 중 3개 팀만이 정확도 0.60 이상의 성적을 거뒀다. 1위는 남경정보과학기술대가, 2위는 싱가포르국립대가 차지했다.

 

ETRI 콘텐츠 비주얼 브라우징 기술 개념도

 

연구팀은 지난해 이 대회의 사물분류(Classification) 및 영상 내 사물위치 검출(Localization) 분야에 참가해 영상 내 사물 위치 검출 분야에서 에러율 9.92%, 사물 분류 분야에서 에러율 3.25%로 5위를 달성했다.

한편, 지난 21일 현장에서 별도로 개최된 국제 저전력 영상인식 대회(LPIRC)에서도 국내 연구진들이 두각을 나타냈다. 1위는 서울대학교 연구진이 차지했으며 ETRI 콘텐츠 비주얼 브라우징팀이 2위를 차지했다. 국제전기전자기술자협회(IEEE) ‘리부팅 컴퓨팅’분야에서 개최한 본 대회는 검출 정확도(mAP)와 검출 시 전력 소모량(Power)를 측정해 경쟁하는 대회다.

이번 대회에서 우수한 성적을 거둔 기술들은 다양한 영상 분석 분야에 적용될 예정이다.

이번 대회에 참가한 ETRI 딥뷰팀의 시각 지능 플랫폼 기술은 영상에 나타나는 다양한 사물과 행동을 이해하는 기술이다. 과학기술정보통신부가 지원하는 인공지능 국가전략프로젝트의 일환으로 개발하고 있다. 이 기술은 경찰청, 지자체, 학교 등의 CCTV를 비롯해 차량 블랙박스 심층분석, 방송콘텐츠 분석 등에 활용될 예정이다.

ETRI 콘텐츠 비주얼 브라우징팀의 기술은 영상을 통해 콘텐츠의 정보를 검색 하는 기술로 과기정통부가 지원하는 디지털콘텐츠 원천기술개발 사업의 일환으로 개발 중이며, 향후 건물 검색, 음식 검색 등 지능형 콘텐츠 검색 서비스에 적용할 예정이다.

김영문 과기정통부 디지털콘텐츠과장은 “콘텐츠 비주얼 검색 기술은 글로벌 콘텐츠 기업의 핵심 전략기술로 이번 대회를 통해 글로벌 경쟁력 확보 및 가상현실, 증강현실과 함께 4차 산업혁명을 주도할 수 있는 지능형 콘텐츠 분야의 교두보를 마련했다”고 말했다.

[테크M = 강진규 기자(viper@techm.kr)]

(주)테크엠주소 : 서울시 강남구 테헤란로2길 27, 10층 (역삼동, 비젼타워)대표이사.발행인 : 김현기편집인 : 허준개인정보보호책임자 : 김현기청소년보호책임자 : 허준
사업자등록번호 : 553-81-01725대표전화 : 070-4513-1460보도자료 및 제보 : press@techm.kr