TECH M
TECH M
어린아이 같이 질문에 되물으며 학습하는 마인드AI
신경망 AI와 달리 연계 질문에서 의중 파악…“대전제에 따른 소전제 확인 가능”
“지금까지 AI는 그저 굉장히 빠른 계산기에 불과합니다.”
이정환 마인드AI 대표는 자신감에 찬 목소리로 말했다. 신경망 기법으로 구성한 AI는 참과 거짓을 구분하는 방식으로 동작한다. 수많은 데이터를 학습해야만 인식할 수 있고, 그 덕분에 정확도가 높아진다.
하지만 마인드AI 알고리즘은 대전제와 소전제를 기반으로 결과 값을 추론한다. 대전제나 소전제가 온전치 않을 때는 사용자에게 되묻기도 하고, 대전제를 기반으로 소전제를 예측하기도 한다.
지금까지의 AI와 같이 단방향으로만 추론하지 않고 대전제와 소전제를 이동하며, 마치 사람처럼 사고하는 진정한 AI라는 주장이다.
인간 지식습득 방식 본뜬 ‘캐노니컬’ 알고리즘
최근 인공지능(AI) 알고리즘을 개발하는 스타트업 마인드AI는 기자 간담회를 열고 독보적인 AI 알고리즘 ‘캐노니컬(Canonical)’을 공개했다.
캐노니컬은 인간 지식습득 방식을 반영해 주어진 데이터를 역으로 추적하는 논증 구조를 가진다. 지금까지 신경망 기법을 활용한 AI 알고리즘은 이미 결정된 구조를 가지고 학습한다.
예를 들어 리모콘을 바닥에 떨어트렸다고 가정했을 때 원인은 중력의 작용이고, 결과는 바닥으로의 추락이다.
만일 기존 신경망 기법 AI를 활용해 이 현상을 증명하려면 중력이 있는 상황, 없는 상황, 테이블이 있는 경우, 리모콘 무게가 무거울 때와 중량이 0인 상태, 대기 유무 같이 적게는 수십 가지, 많게는 수천만 가지 상황을 일일이 입력해야 한다.
반면 마인드AI 캐노니컬 구조는 ‘중력이 작용할 경우 질량이 있는 물체는 바닥으로 떨어진다’는 대전제를 활용해 리모콘이 바닥으로 떨어진다는 결과 값을 도출한다.
만일 대전제가 온전치 않거나 정보가 없다면, 알고리즘은 오히려 소전제를 활용해 대전제를 추론한다. ‘리모콘이 땅바닥에 떨어졌다 -> 그 이유는 힘이 작용하기 때문이다 -> 그 힘은 중력이다’는 방식으로 역으로 추론할 수 있다.
이정환 마인드AI 대표는 “기존에 있던 디시전 트리(decision tree) 방식의 AI와 다르게 캐노니컬은 자연어 처리 기법을 구조적으로 설명하면서 삼각형 형태로 조직을 만들고, 질문 들어왔을 때 조직 안에 있는 노드와 연결선을 쫓아가면서 이론적으로 이해하기 시작하는 방식”이라며 “단순히 예스-노로 나누는 게 아니라 입체적으로 사고한다. 세포가 있고 그 안에 핵이 있는 것처럼, 삼각형 구조 안에서 상하좌우로 왔다갔다 하며 생각을 하는 방식”이라고 설명했다.
실제 2월12일 마인드AI는 베타모델 ‘딜라이트’를 활용해 동화 ‘어린왕자’를 읽고 추론한 뒤 결론을 내놓는 과정을 시연했다. 동영상으로 관련 내용을 볼 수 있다.
보아뱀이 코끼리를 먹었다는 내용과 연관해 “먹는(eat) 행동은 왜 일어나는가”라는 질문에 “왜 먹어야 하지?”라는 의문을 갖게 되고, “살기 위해 먹는다”는 결론을 도출했다. ‘살려면 먹어야 한다’는 대전제를 추론하고자, 왜 먹는지를 스스로 찾는다는 점이 지금까지 AI와 차별성이다.
AI 자연스러움 높아질 수 있어
이렇게 하면 AI 응용분야에서 자연스러움이 훨씬 높아질 개연성이 크다.
만일 챗봇이나 인공지능 스피커에 캐노니컬 알고리즘을 적용할 경우 마치 진짜 인간과 상담하는 것처럼 구현할 수 있다.
예를 들어 현재 인공지능 스피커는 ‘사랑해’ 라고 말할 때, 사용자가 사랑해라는 말을 했을 때 반응을 직접 입력하고, 그 입력된 내용을 답한다.
반면 캐노니컬은 사랑해라고 말하면, 사랑한다는 뜻이 무엇인지 되묻기도 한다. 어떤 답이 나오는지를 들은 뒤 축적하고, 이후에 사랑해라는 말에 대해 자신이 터득한 자연스러운 답변을 내놓을 수 있다.
캐노니컬 구조를 도입하면 특히 AI에 대한 투명성을 높일 수 있다고 이 대표는 설명했다.
지금까지 AI는 결과 값에 대한 설명을 못했다. 알파고로 예를 들면, 코딩된 알고리즘에 의하면 A라는 포석을 놓았을 때 승률이 가장 높았다고 치면 왜 승률이 높은지를 판단할 수 없다. 그저 여기에 놓아야 높다는 결과만 덩그러니 있게 된다. 만일 이유를 추론하기 위해 역산하면 수천만 가지에 달하는 경우의 수를 모두 검토해야 한다.
반면 캐노니컬 구조는 한 수를 둘 때 이미 대전제 판단근거가 마련된 다음 둔다. 수를 놓기 전에 대전제가 마련되지 않으면 이해를 하고 넘어가는 형식이다. 이에 AI 응용 프로그램이 문제를 일으킬 경우 원인을 쉽게 파악할 수 있다는 장점을 가진다.
온톨로지 기반 블록체인 생태계 조성
마인드AI의 정확도는 온톨로지(합의된 명제)가 많을수록 올라가는 구조다. 궁극적으로는 은유적 표현까지도 이해하는 단계까지 올라설 수 있다고 마인드AI 개발진은 추측하고 있다.
이 대표는 “온톨로지 확보는 어린아이가 새로운 것을 배우고 학습하는 것과 마찬가지”라며 “계속 받아들이면 a와 b를 연결하지만 더 나아가 a와 d를 연결할 수도 있다. 장기적으로는 B와 Z를 연결하는 방식으로 응용할 수 있을 것”이라고 말했다.
방대한 온톨로지 데이터는 악의적인 접근이나 수정이 없어야 하기에 블록체인으로 관리한다. 투명성을 확보할 수 있고 해킹 위협이 낮아지는 효과가 나타난다. 특히 온톨로지 데이터를 업데이트하는 사람에게 보상으로 코인을 지급하는 구조를 마련해 새로운 생태계를 구성할 수도 있다고 마인드AI 측은 설명했다.
지금까지 AI에 적용했던 신경망생성 기법이 틀렸다는 것은 아니다. 마인드AI 알고리즘과 상호보완적인 요소로 활용할 수 있을 것이란 전망이다.
이 대표는 “영어를 제대로 구사하려면 최소한 3000개 단어를 알아야 한다. 마찬가지로 대명제를 모아야 하는 것은 스스로 학습을 하기 위한 수준으로 가기 위해선 일정수준의 팩트를 수집해야 한다는 의미”라며 “IBM, 아마존, 구글 같은 업체들의 신경망 알고리즘이 틀렸다기보다는 서로 접근방식이 다른 것이고, 상호보완적으로 역할 할 것”이라고 말했다.
[테크M=김태환 기자(kimthin@techm.kr)]
-
'전자정부 名家' LG CNS, 1200억 '행복e음' 사업 수주로 자존심 회복할까공공 소프트웨어(SW) 사업의 강자 LG CNS가 올해 공공시장 첫 '대어'로 꼽히는 보건복지부 차세대 사회보장정보시스템(행복e음) 구축 사업에 출사표를 던졌다.17일 업계에 따르면 LG CNS는 이날 행복e음 사업 재입찰에 제안서를 제출했다.행복e음 사업은 지난 2009년 복지부가 각종 사회복지 급여 및 서비스 지원 대상자의 자격과 이력에 관한 정보를 통합 관리하기 위해 구축한 시스템을 현대화 하는 사업이다. 올해부터 3년간 약 1220억원이 투입된다.이 사업은 지난 3일 첫 입찰 공고를 마감했으나 무2020-03-17 16:54:47테크M 남도영 기자
-
네이버 vs 카카오, 포털-메신저 이은 3라운드... 링은 '콘텐츠'#수천억 자금으로 뭘 만들까#넷플릭스 잡을 수 있을까#톡TV-네이버TV 경쟁 볼만할 듯국내 대표 인터넷 맞수 기업 네이버와 카카오의 세번재 경쟁 무대 막이 올랐다. 포털과 메신저 플랫폼에서 치열하게 경쟁해온 두 기업의 3라운드 링은 '콘텐츠'다. 이미 양사는 콘텐츠 자회사에 수천억원의 자금을 쌓아놨다. 올해부터 본격적으로 콘텐츠 양산에 돌입한다. 콘텐츠 주도권 경쟁의 전초전은 이미 시작됐다.◆실탄 마련한 카카오M, 직접 콘텐츠 제작 개시카카오는 지난 16일 콘텐츠 자회사 카카오M이 3자 배정 유상증자2020-03-17 15:53:45테크M 허준 기자
-
[템 사이트] 게임 하면 유니티! 2020년 기대되는 유니티 기반 게임은?연일 쏟아지는 신작 소식이 게이머들을 설레게 하고 있습니다. 남다른 스케일을 자랑하는 게임업체들의 대형 신작은 물론 독특한 게임성을 내세운 게임까지, 게이머들의 다양한 취향을 만족시킬만한 다양한 신작게임들이 많습니다.오늘은 특히 유니티 엔진을 기반으로 한 신작 게임들을 엄선해서 소개할까 합니다. 유니티는 이미 전세계 수백만명의 게임 개발자들이 사용하는 유명한 게임엔진입니다. 최신 버전의 엔진 '유니티 2019.3' 업데이트를 통해 260가지가 넘는 개선사항과 신규 기능이 포함돼 진일보한 고성능 그래픽과 최적화 기2020-03-17 15:30:39테크M 허준 기자