TECH M
TECH M
한국인 말과 감성 이해하는 AI 시대 앞당긴다…한국어 음성, 대화, 복합영상 데이터 250만개 개방
한국 사람의 감정에 대한 영상 정보, 한국어의 자연스러운 발성정보를 담고 있는 인공지능(AI)용 데이터가 개방된다. 이번 데이터 개방이 AI기술 활용 스펙트럼을 넓히고, 관련 AI 서비스 상용화를 촉진하는 계기가 될 것으로 전망된다.
한국정보화진흥원(NIA)이 금년 6월 250만개 인공지능 학습용 데이터를 공개했다.
공개 데이터는 ①감정, 상황, 대화내용을 담고 있는 복합 영상 데이터, ②자연스러운 한국어 대화 음성 데이터, ③한국어 챗봇용 대화와 시나리오 데이터, ④한국어 기계독해 데이터 4종이다.
공개 AI 데이터별 활용 가능 서비스
데이터명 |
주요 활용 내용 |
복합영상(멀티모달) 데이터 |
사람의 표정과 대화 속에 내포된 감정을 읽고 사람과 공감하면서 대화하는 AI로봇의 개발 |
한국어 음성 데이터 |
2∼3명이 서로 자연스럽게 연속하여 발화하는 음성데이터로 기존 한국어 AI음성 인식기술 성능 향상 |
한국어 대화 데이터 |
음식점, 소매점, 학원 등 소상공인 업종에서 자주 발생하는 상황과 질문‧답변을 데이터로 제공하여 AI 챗봇 개발에 활용 |
한국어 기계독해 데이터 |
다양한 질문과 정답의 쌍을 AI에 딥러닝시켜 전후 맥락을 짚어 정확한 답변을 찾아 제공하는 AI로봇 개발 |
“데이터 확보가 AI 경쟁력”이지만 중소․벤처․스타트업 다수는 많은 비용과 시간이 필요한 데이터 구축에 어려움을 겪고 있다. 이런 환경에서 ‘인공지능 데이터 구축‧공개 사업’은 AI 시장에 진입하고자 하는 신생기업들에게 매력 높은 사업이다.
2017년부터 법률과 특허, 일반상식, 한국형 이미지 4종 데이터셋 구축을 시작해, 2019년 1월에 관광과 농업, 헬스케어 등 7종을 개방했다. 6월에 한국어 음성 등 4종을 추가로 개방했다.
올해 말에는 한영 번역말뭉치, 한국형 사물이미지, 한글 글자체 이미지, 이상행동 영상 같은 10종 2500여만건의 데이터셋을 공개할 예정이다.
AI 학습용 데이터 구축‧현황과 계획
또 국가 R&D 과제인 지능정보 플래그십 사업 등을 통해 만든 AI 학습용 데이터 다수를 7월 AI허브에 공개할 예정이다.
지능정보 플래그십 사업은 음성과 언어, 영상 등 다양한 정보를 복합적으로 학습해 사람과 상호작용하는 대화형 에이전트 기술과 서비스를 개발하는 AI분야 연구개발(R&D) 사업이다.
NIA 문용식 원장은 “AI 제품과 서비스가 활발하게 개발되고 출시될 수 있도록 데이터셋을 대량 구축하고 공개해 국내 AI 산업과 시장 경쟁력을 강화하는데 역량을 집중하겠다”고 밝혔다.
박응서 테크엠 기자 gopoong@techm.kr
-
'전자정부 名家' LG CNS, 1200억 '행복e음' 사업 수주로 자존심 회복할까공공 소프트웨어(SW) 사업의 강자 LG CNS가 올해 공공시장 첫 '대어'로 꼽히는 보건복지부 차세대 사회보장정보시스템(행복e음) 구축 사업에 출사표를 던졌다.17일 업계에 따르면 LG CNS는 이날 행복e음 사업 재입찰에 제안서를 제출했다.행복e음 사업은 지난 2009년 복지부가 각종 사회복지 급여 및 서비스 지원 대상자의 자격과 이력에 관한 정보를 통합 관리하기 위해 구축한 시스템을 현대화 하는 사업이다. 올해부터 3년간 약 1220억원이 투입된다.이 사업은 지난 3일 첫 입찰 공고를 마감했으나 무2020-03-17 16:54:47테크M 남도영 기자
-
네이버 vs 카카오, 포털-메신저 이은 3라운드... 링은 '콘텐츠'#수천억 자금으로 뭘 만들까#넷플릭스 잡을 수 있을까#톡TV-네이버TV 경쟁 볼만할 듯국내 대표 인터넷 맞수 기업 네이버와 카카오의 세번재 경쟁 무대 막이 올랐다. 포털과 메신저 플랫폼에서 치열하게 경쟁해온 두 기업의 3라운드 링은 '콘텐츠'다. 이미 양사는 콘텐츠 자회사에 수천억원의 자금을 쌓아놨다. 올해부터 본격적으로 콘텐츠 양산에 돌입한다. 콘텐츠 주도권 경쟁의 전초전은 이미 시작됐다.◆실탄 마련한 카카오M, 직접 콘텐츠 제작 개시카카오는 지난 16일 콘텐츠 자회사 카카오M이 3자 배정 유상증자2020-03-17 15:53:45테크M 허준 기자
-
[템 사이트] 게임 하면 유니티! 2020년 기대되는 유니티 기반 게임은?연일 쏟아지는 신작 소식이 게이머들을 설레게 하고 있습니다. 남다른 스케일을 자랑하는 게임업체들의 대형 신작은 물론 독특한 게임성을 내세운 게임까지, 게이머들의 다양한 취향을 만족시킬만한 다양한 신작게임들이 많습니다.오늘은 특히 유니티 엔진을 기반으로 한 신작 게임들을 엄선해서 소개할까 합니다. 유니티는 이미 전세계 수백만명의 게임 개발자들이 사용하는 유명한 게임엔진입니다. 최신 버전의 엔진 '유니티 2019.3' 업데이트를 통해 260가지가 넘는 개선사항과 신규 기능이 포함돼 진일보한 고성능 그래픽과 최적화 기2020-03-17 15:30:39테크M 허준 기자