TECH M
TECH M
[MIT리뷰/AI와 대화②] 기계와 대화하는 사람들
알파고의 승리 후 몇 달 뒤 인공지능 붐의 산실인 실리콘 밸리를 방문, 인공지능의 현실 적용에 상당한 성과를 거둔 이들과 인공지능이 언어를 이해하게 하려고 노력하고 있는 이들을 만났다.
구글, 페이스북, 애플의 본사에서 그리 멀지 않은 팔로 알토에 사는 위노그라드를 먼저 만났다. 곱슬머리 백발에 덥수룩한 턱수염을 가진 그는 존경 받는 학자 같이 보이면서도 자신의 열정을 다른 이들에게 전하는 능력을 가지고 있었다.
위노그라드는 기계에게 말하는 능력을 가르치려고 한 최초의 학자 중 한 명이다. 1968년 언어에 푹 빠진 수학 천재였던 그는 MIT에 새로 생긴 인공지능 실험실에서 박사과정을 시작, 박사과정 목표로 텍스트를 기반으로 사람과 일상의 언어로 대화할 수 있는 프로그램을 만들겠다고 결심했다. 당시만 해도 이것이 비현실적인 목표라고 여겨지지 않았다.
“그때는 여기에 어떤 무한한 가능성이 있다고들 생각했지요.”
당시 인공지능은 가장 활발하게 연구되는 분야였으며 MIT의 다른 이들은 컴퓨터 비전 시스템과 미래형 로봇 팔을 만들고 있었다.
모두가 언어에 대한 정복이 쉽게 이루어질 것이라고 생각했던 것은 아니다. 저명한 언어학자인 노엄 촘스키 MIT 교수를 비롯한 비판가들은 우리가 인간의 언어도 아직 제대로 이해하고 있지 못하다는 점을 들어 기계가 언어를 이해하게 만드는 것은 쉽지 않을 것이라고 생각했다.
위노그라드는 한 파티에서 자신이 인공 지능 연구실에서 일한다고 소개하자 촘스키의 학생 중 하나가 파티장에서 나가버렸다고 회상했다.
그러나 그가 컴퓨터가 언어를 이해하게 될 것이라고 생각했던 이유가 있었다. 그가 박사과정을 시작하기 2년 전 독일 출신의 조셉 와이젠바움 MIT 교수는 최초의 인공지능 대화 프로그램을 만들었다.
엘리자(ELIZA)란 이 프로그램은 만화에 나오는 정신과 의사처럼, 환자가 한 말의 중요한 단어를 반복하거나 혹은 대화를 더 진행하게 만드는 질문을 던지는 식으로 동작했다.
예를 들어 어머니에게 화가 난 환자가 있다면 엘리자는 이렇게 말한다.
“어머니에 대해 생각할 때 또 어떤 사실이 마음속에 떠오르나요?”
아주 간단한 기술이었지만 이 프로그램은 놀랄 만큼 잘 작동했다. 와이젠바움은 어떤 참가자들이 자신의 가장 어두운 비밀을 엘리자에게 털어 놓는 것을 보고 충격을 받았다.
위노그라드는 진정으로 언어를 이해하는 것처럼 보이는 뭔가를 창조하고 싶었다. 그는 먼저 문제를 간단하게 만들었다. 그는 가상의 물건 몇 개가 가상의 테이블에 놓인 매우 단순한 가상의 공간 ‘블록 월드’를 만들었다.
그리고 이 축소된 가상 세계에 필요한 모든 명사와 동사를 구분하고 간단한 문법 규칙까지 이해하는 SHRDLU(이 단어는 자동식자기의 두번째 줄 글자들로 만들어진 아무 의미 없는 단어다)란 이름의 프로그램을 만들었다.
이 프로그램은 대상을 묘사하고 이들의 관계에 대한 질문에 답할 수 있었다. 또 명령에 따라 이 가상 세계를 변화시킬 수 있었다. 특히 일종의 기억력을 갖고 있어 처음에 ‘붉은 원뿔’을 언급했다면, 나중에 ‘그 원뿔’이라고 말했을 때 사용자가 바로 붉은 원뿔을 가리킨다고 가정했다.
SHRDLU는 인공지능의 발전을 알리는 상징이 됐지만 곧, 이 발전이 환상에 불과하다는 것이 밝혀졌다. 위노그라드가 자신의 가상 세계를 더 크게 확장하려 하자 그 새로운 세계를 묘사하기 위한 단어의 수와 문법의 복잡성이 당시의 기술로는 감당할 수 없는 수준으로 늘어난다는 것을 알게 된 것이다.
한 두 해 뒤, 그는 이 문제에 손을 들었고 결국 인공지능 분야를 떠나 다른 분야로 연구주제를 바꿨다.
“처음 생각보다 그 한계가 너무 가까이 있었던 거죠.”
위노그라드는 당시의 기술로는 기계가 언어를 진정으로 이해하게 만드는 것이 불가능하다고 결론 내렸다.
허버트 드레퓌스 UC 버클리 철학교수가 1972년 ‘컴퓨터가 할 수 없는 것(What Computers Can’t Do)’에서 주장한 것처럼 인간이 가진 여러 능력은 일종의 직관적 지능이 있어야 하며, 이는 단정적인 규칙으로는 구현하기 어려운 것이라는 점이 문제였다.
바로 이 점 때문에 이세돌 기사와 알파고의 대결을 앞두고 수많은 전문가들이 기계가 바둑으로 인간을 이기기 어려울 것이라고 예측했던 것이다.
그러나 드레퓌스의 그러한 주장에도 불구, 몇몇 연구자들은 기계가 일종의 지능을 가지게 만들 수 있는 방법을 개발해왔다. 뇌과학에서 일부 영감을 받은 이들은 뇌 신경을 수학적으로 흉내 낸 후 이를 여러 층으로 만들고 특정한 입력에 대해 반응하도록 훈련할 수 있는 인공 신경망 기술을 시도했다.
초기에는 이 기술의 속도가 너무나 느렸으며 논리나 추론을 표현하기에는 비현실적이라는 점 때문에 주목받지 못했다. 그러나 신경망은 직접 프로그램으로 쓰여지기 어려운 문제를 학습을 통해 해결할 수 있었으며, 이 때문에 손글씨를 인식하는 것과 같은 간단한 문제에 유용하다는 것이 증명돼 1990년대 들어 수표에 쓰인 숫자를 읽는 기술로 상용화됐다.
이 기술을 지지하는 이들은 신경망이 언젠가는 기계로 하여금 더 많은 일을 하게 만들 것이라고 믿었다. 그들은 심지어 언젠가 이 기술을 통해 기계가 언어를 이해하게 될 것이라고 주장했다.
지난 몇 년간 신경망은 더 복잡해졌고 더 강력해졌다. 신경망에 사용되는 수학이 더욱 정교해졌을 뿐 아니라 특히 컴퓨터의 속도와 데이터의 양이 모두 기하급수적으로 증가하면서 신경망 기술은 빛을 보기 시작했다. 2009년 캐나다 토론토대학의 연구진은 다층 딥러닝 기술로 음성 인식의 기존 기록을 경신했다. 그리고 2012년 같은 연구팀은 머신-비전 대회에서 딥러닝 알고리즘으로 놀랄만한 정확도를 보여줬다.
딥러닝 신경망은 사진을 아주 단순한 기술을 사용해 인식한다. 신경망의 한 층은 사진을 입력 받은 뒤 각각 픽셀의 농도에 대해 특정 신경이 발화한다. 이 신호들은 뉴런들이 서로 엮여 있는 여러 층을 거쳐 대상이 무엇인지를 알려주는 마지막 단계에 도달하게 된다.
역전파(backpropagation)라는 수학적 기술은 신경망이 제대로 된 답을 내도록 각 뉴런들의 민감도를 조절, 대상이 무엇인지 구별하는 능력을 학습할 수 있다. 신경망 내부의 다른 층들은 각각 사진의 모서리, 색깔, 재질 등의 특성에 반응한다. 이 기술은 이제 물체, 동물, 그리고 사람의 얼굴을 인식하며 그 인식률은 일반적인 사람의 구별 능력에 견줄 수 있을 정도다.
이 딥러닝 기술을 언어에 적용하는 데는 분명한 어려움이 있다. 언어는 사진과는 근본적으로 다른 기호로 이뤄졌기 때문이다. 예를 들어 전혀 다른 글자로 이뤄진 단어가 비슷한 뜻을 가질 수 있고 같은 단어라도 맥락에 따라 여러 가지 뜻을 가질 수도 있다.
1980년대 연구자들은 언어를 신경망에 적용할 수 있는 문제로 바꾸는 기발한 아이디어를 생각해냈다. 그들은 단어를 하나의 수학적 벡터로 나타낼 수 있으며 이를 통해 이들의 유사성을 계산할 수 있다는 것을 보여줬다.
예를 들어 ‘보트’와 ‘물’은 전혀 다른 단어이지만 벡터 공간에서는 가까이에 자리잡게 된다. 요슈아 벤지오가 이끄는 몬트리올 대학과 구글의 연구팀은 이 아이디어를 바탕으로 문장을 그 문장에 포함된 각각의 단어에 의해 더 복잡한 벡터로 표현하는 - 저명한 딥러닝 연구자로 구글에서 함께 일하기도 한 토론토대학 제프리 힌튼 교수는 이를 ‘생각 벡터’라 불렀다 - 신경망을 만들었다.
두 언어에 대해 이런 신경망을 만듦으로써 연구자들은 두 언어를 놀라운 정확도로 번역할 수 있었다. 또 이와 비슷한 신경망과 사진을 인식하는 신경망을 결합, 매우 그럴듯한 사진 설명을 달 수 있게 됐다.
<본 기사는 테크M 제43호(2016년 11월) 기사입니다>
-
'전자정부 名家' LG CNS, 1200억 '행복e음' 사업 수주로 자존심 회복할까공공 소프트웨어(SW) 사업의 강자 LG CNS가 올해 공공시장 첫 '대어'로 꼽히는 보건복지부 차세대 사회보장정보시스템(행복e음) 구축 사업에 출사표를 던졌다.17일 업계에 따르면 LG CNS는 이날 행복e음 사업 재입찰에 제안서를 제출했다.행복e음 사업은 지난 2009년 복지부가 각종 사회복지 급여 및 서비스 지원 대상자의 자격과 이력에 관한 정보를 통합 관리하기 위해 구축한 시스템을 현대화 하는 사업이다. 올해부터 3년간 약 1220억원이 투입된다.이 사업은 지난 3일 첫 입찰 공고를 마감했으나 무2020-03-17 16:54:47테크M 남도영 기자
-
네이버 vs 카카오, 포털-메신저 이은 3라운드... 링은 '콘텐츠'#수천억 자금으로 뭘 만들까#넷플릭스 잡을 수 있을까#톡TV-네이버TV 경쟁 볼만할 듯국내 대표 인터넷 맞수 기업 네이버와 카카오의 세번재 경쟁 무대 막이 올랐다. 포털과 메신저 플랫폼에서 치열하게 경쟁해온 두 기업의 3라운드 링은 '콘텐츠'다. 이미 양사는 콘텐츠 자회사에 수천억원의 자금을 쌓아놨다. 올해부터 본격적으로 콘텐츠 양산에 돌입한다. 콘텐츠 주도권 경쟁의 전초전은 이미 시작됐다.◆실탄 마련한 카카오M, 직접 콘텐츠 제작 개시카카오는 지난 16일 콘텐츠 자회사 카카오M이 3자 배정 유상증자2020-03-17 15:53:45테크M 허준 기자
-
[템 사이트] 게임 하면 유니티! 2020년 기대되는 유니티 기반 게임은?연일 쏟아지는 신작 소식이 게이머들을 설레게 하고 있습니다. 남다른 스케일을 자랑하는 게임업체들의 대형 신작은 물론 독특한 게임성을 내세운 게임까지, 게이머들의 다양한 취향을 만족시킬만한 다양한 신작게임들이 많습니다.오늘은 특히 유니티 엔진을 기반으로 한 신작 게임들을 엄선해서 소개할까 합니다. 유니티는 이미 전세계 수백만명의 게임 개발자들이 사용하는 유명한 게임엔진입니다. 최신 버전의 엔진 '유니티 2019.3' 업데이트를 통해 260가지가 넘는 개선사항과 신규 기능이 포함돼 진일보한 고성능 그래픽과 최적화 기2020-03-17 15:30:39테크M 허준 기자