TECH M
TECH M
이미지 넘어 영상인식 인공지능에 주목하는 이유
인공지능(AI)을 활용한 디지털 이미지 인식은 이미 다양한 서비스에 적용되고 있다.
하지만 동영상에서 움직이는 사물이 구체적으로 뭘하는지 파악하는 것은 지금의 기술로 커버하기는 쉽지 않다. 정지된 이미지 인식에 비해 요구되는 용량과 컴퓨팅 파워도 크다.
하지만 진입 장벽이 높은 만큼, 상용화에 따른 잠재력 또한 크다는 평가. 영상 인식이 가능해지면 AI 기술이 크게 발전하는 계기가 마련될 것으로 전망된다.
MIT와 IBM은 최근 영상과 여기서 이뤄지는 행동에 대해 설명을 단 '모멘트 인 타임'(Moment in Time) 데이터 세트를 공개했다.
MIT테크놀로리지리뷰에 따르면 '모멘트 인 타임'은 낚시 영상부터 브레이크 댄스 등 3초짜리 영상을 담고 있다. 아우데 올리버 MIT 수석 연구과학자는 "무슨 일이 왜 일어나는지 알고 싶다면 동작은 단일 프레임으로는 확인할 수 없는 많은 정보를 제공한다"고 말했다. 이것을 잘 활용하면 이미지 인식으로는 안되는 것들을 구현할 수 있다는 것이었다.
자율주행차를 포함해 영상을 해석하는 AI 시스템들은 현재 정지된 프레임에서 사물을 확인하는 방법에 의존하고 있다. 행동을 인식하는 수준은 아니다.
MIT테크놀로지리뷰에 따르면 영상 인식과 관련한 다음 도전은 무슨 영상인지를 넘어 영상에서 무슨 일이 벌어지는지 이해하는 것이다. 로봇이나 자율주행차에 적용하면 주변에서 무슨일이 벌어지고 있는지 보다 잘 이해할 수 있다.
영상인식 기술을 개발하려는 연구개발에도 가속도가 붙었다. 다양한 분야에서 영상 인식을 지원하는 AI 개발기술 개발이 진행 중이다.
MIT와 IBM이 진행 중인 프로젝트는 이와 관련한 여러 테스트 중 하나일 뿐이다. 지난해 구글은 태그가 붙은 유튜브 영상 800만개를 공개했다. 최근에는 클라우드 플랫폼 일환으로 영상에서 물체를 인식할 수 있는 도구도 공개했다. 구글 클라우드 플랫폼은 이미지, 오디오, 텍스트 처리 같은 AI 툴들을 포함하고 있다.
페이스북도 주석이 붙은 영상 데이터 세트를 개발하고 있다.
영상 인식기술 개발을 주특기로 하는 스타트업들도 등장했다. 토론토와 베를린에서 활약하는 스타트업인 투엔티빌리언뉴런스도 그 중 하나다. 이 회사가 공개한 데이터 세트를 활용하면 동영상이 축구경기인지 파타인지 확인할 수 있다. 누군가가 방에 들어왔는지 확인도 가능하다.
AI를 활용한 영상 인식 기술은 다양한 분야에서 응용될 수 있는 잠재력을 갖췄다는 평가다. IBM의 대니 거트프런드 연구원은 "노령층 보호나 장애인을 도와주는 기기도 생각해 볼 수 있다"고 말했다.
[테크M=황치규 기자(delight@techm.kr)]
-
2018 테크트렌드를 해부한다…테크M 1월호 발간비트코인 논란, 장병규 4차산업혁명위원회 위원장 인터뷰 등 인공지능(AI)기술 분야는 딥러닝을 통해 할 수 있는 것과 없는 것의경계가 명확해지고 현재의 기술적 한계 극복 연구가 활발히 진행될 것으로 전망된다.블록체인은 금융분야를 넘어 다양한 산업에서 기술도입이 활성화되고, 과거에 볼 수 없었던 새로운 비즈니스 모델이 본격적으로 등장할 가능성이 크다.현재 4G보다 훨씬 빠른 5G 기술이 부분적으로 도입되고 클라우드컴퓨팅을 보완하는 엣지컴퓨팅이 활성화될 것으로 보인다.테크M은2018년 1월호에2017-12-26 14:09:43김태환 기자
-
클라우드 서비스, 한미 FTA 재협상 테이블에 오르나한국과 미국의 자유무역협정(FTA) 재협상을 앞두고 클라우드 서비스가 협상 테이블에 오를 수도 있는 정황이 포착됐다.미국 정부는 올해 초부터 정보를 수집하며 협상 안건으로 클라우드 카드를 만지작거리는 모양새다. 한국 정부는 공식적인 대응을 자제하고 있지만 국내 기업들의 의견을 수렴하는 등 대응책 마련에 고심하고 있다.심상치 않은 미국 움직임26일 IT업계에 따르면 미국 정부가 FTA 재협상을 앞두고 클라우드 분야에 대한 정보 수집과 의견 수렴에 나선 것으로 알려졌다.주2017-12-26 09:28:07강진규 기자
-
“못 알아 들었어요, 다시 말해주세요” 몰지각한 대화형 인공지능[테크M=연세대학교 UX랩 인지공학스퀘어(홍수미, 조광수)]에러 처리를 잘하면, 성능과 사용자 경험 두 마리 토끼를 잡는다. 아마존 에코를 시작으로 국내에서도 다양한 종류의 대화형인터페이스가 도입되고 있다.삼성의 빅스비, 애플의 시리와 SKT의 누구, KT의 기가지니, 네이버의 클로바 등 다양한 형태와 서비스에서 대화형 인터페이스가 사용되고 있다.대화형 인터페이스는 사용자가 별도 사용법을 배울 필요 없이 ‘대화’라는 수단을 사용한다는 장점 때문에 각광받고 있다.그러나 대화형 인터페이스 사용 시2017-12-25 19:11:29연세대학교 UX랩 인지공학스퀘어(홍수미, 조광수)