인공지능의 어두운 비밀 (중) > 기사

[테크M 독점제휴 = MIT테크놀로지리뷰]

2015년, 뉴욕 마운트시나이 병원의 한 연구진은 병원의 방대한 환자 기록에 딥러닝을 적용하자는 아이디어를 떠올렸다. 여기에는 환자를 대상으로 한 시험 결과와 의사의 진단 결과 등에 따른 수 백 가지 항목이 포함되어 있다.

‘딥 페이션트’라 이름 붙인 이 프로그램은 약 70만 명의 환자 데이터를 기반으로 학습했는데, 다른 과거 기록을 이용해 질병을 예측했을 때 놀라울 정도로 뛰어난 성능을 보인바 있다.

딥 페이션트는 어떤 의학 전문가의 도움도 없이 간암 같은 다양한 질병으로 발전할 가능성이 있는 패턴을 찾아냈다. 마운트시나이 연구진을 이끈 조 더들리는 환자의 의료 기록을 통해 질병을 예측할 수 있는 ‘상당히 좋은’ 여러 가지 방법이 있지만 “딥 페이션트가 훨씬 더 나았다”고 말했다.

하지만 딥 페이션트는 우리가 쉽게 받아들일 수 없게 만드는 점들을 갖고 있다. 딥 페이션트는 조현병 같은 정신 질환의 발병을 놀라울 정도로 잘 예측하는 것처럼 보인다. 조현병은 의사들도 매우 예측하기 어려운 병으로 유명한데, 더들리는 딥 페이션트가 어떻게 이를 잘해내는지 궁금했다.

하지만 그는 아직 그 비밀을 모른다. 이 새로운 기술은 자신이 어떻게 그 일을 해내는지에 대해 아무런 힌트를 주지 않는다. 딥 페이션트 같은 프로그램이 실제로 의사들에게 도움이 되려면 지금 복용중인 약을 다른 약으로 바꾸라는 처방을 내릴 때, 의사와 환자에게 처방의 정확성을 정당화 할 수 있는 근거를 함께 제공하는 게 이상적일 것이다.

더들리는 “우리는 의사에게 도움을 주는 인공지능을 만들 수는 있다”면서도 “그들이 어떻게 작동하는지는 모른다”고 말한다.

인공지능 분야가 늘 이런 식이었던 것은 아니다. 초기 인공지능을 다루는 방법에 대한 두 가지 학파가 있었다. 규칙과 논리에 기반을 둔, 우리가 내부 프로그램을 봄으로써 실제로 어떻게 동작하는지 명백하게 알 수 있는 방식으로 기계를 만드는 게 가장 합리적이라고 생각했던 다수가 있었다.

한편에는 생명체가 사용하는, 곧 관찰과 경험을 통한 학습법을 기계가 쓸 수 있다면 지능을 더 쉽게 구현할 수 있을 것이라고 생각한 이들이 있었다. 이는 프로그램 방법을 근본적으로 바꾸었다.

특정 문제를 푸는 명령어를 사람이 직접 짜는 대신, 이 프로그램은 데이터와 정답의 예를 통해 새로운 데이터에 대한 정답을 주는 알고리즘을 스스로 만들어낸다.

오늘날 존재하는 가장 강력한 인공지능은 기계학습 기술이 발전한 것이며 바로 후자의 길을 따른 것이다. 기계가 스스로 프로그램의 핵심 부분을 짜는 것이다.

초기 이런 접근 방식은 현실적 한계를 가졌고, 60년대와 70년대에는 이 분야의 소수만이 이런 방식을 연구했다. 그러나 여러 산업에 컴퓨터가 도입되고 거대한 데이터가 축적되면서 이 기술이 재조명되기 시작했다. 여러 종류의 강력한 기계학습 기술이 개발되었고 특히 인공 신경망으로 불리는 기술이 등장했다. 90년대 들어 신경망은 손 글씨를 스스로 해독할 수 있게 되었다.

그러나 신경망을 여러 층으로, 혹은 ‘딥’하게 만드는 등의 기발한 여러 기술들이 등장해 인식 능력의 급격한 향상이 이루어진 것은 지난 십 년 사이의 일이다. 오늘날 인공지능의 인기는 이 딥러닝 기술의 덕택이다.

딥러닝 덕분에 기계는 사람이 직접 프로그램을 짜서 구현하기에는 너무나 복잡한 기능인 음성 인식에서 사람과 비슷할 정도의 강력한 능력을 가지게 되었다. 딥러닝은 컴퓨터 비전과 기계 번역 역시 크게 향상시켰다. 이제 의료, 금융, 제조업 등 여러 분야에서도 사용되고 있다.

더들리는 “우리는 의사에게 도움을 주는 인공지능을 만들 수는 있다”면서도 “그들이 어떻게 작동하는지는 모른다”고 말한다.

어떤 기계 학습 기술이든 그 작동 과정은 사람이 직접 짠 프로그램에 비해 본질적으로, 심지어 컴퓨터 과학자들에게도 난해할 수밖에 없다. 그렇다고 이 말이 모든 미래의 인공지능 기술이 그 정도로 불가해할 것이라는 뜻은 아니다.

하지만 그 본질상, 딥러닝은 극히 어두운 블랙박스다.

심층 신경망의 내부를 들여다봐도 그 신경망이 어떻게 작동하는지를 파악하는 것은 불가능하다. 신경망은 서로 교묘하게 연결된 수십에서 수백 개의 계층과 그 계층 사이 수천 개의 가상 신경에 의해 동작한다. 첫 번째 계층의 신경은 어떤 사진 중 한 픽셀의 명도 같은 값을 입력받아 이를 바탕으로 뭔가를 계산한다.

이 결과 값은 거미줄 같은 연결을 통해 다음 계층에 입력되는데 이렇게 모든 계층을 거쳐 결과물이 나온다. 또, 역전파라는 과정을 이용해 이 신경망 각 계층의 신경이 원하는 값을 출력하도록 만드는 학습이 이루어진다.

심층 신경망이 가진 수많은 계층은 각각 다른 수준의 추상화를 지원한다. 개를 인식하도록 만들어진 심층 신경망이라면 하위 계층은 색깔이나 형태 같은 단순한 특성을, 상위 계층은 털이나 눈 같은 보다 복잡한 특성을 인식한다. 그리고 가장 상위 계층에서 개라고 인식하게 되는 것이다.

다른 종류의 기계 학습도 어떻게 보면 이와 비슷하다. 소리들이 모여 단어가 되며, 글자와 단어들이 모여 문장이 만들어진다. 운전대를 어떻게 돌리느냐는 운전의 일부이다.

이런 시스템에서 어떤 일이 일어나고 있는지 이해하기 위해 독창적인 방법들이 사용돼 왔다. 2015년 구글의 연구진은 실제 사진속 물체를 인식하는 딥러닝 기반 이미지 인식 알고리즘을 바꿔 그 물체를 생성하거나 변형시키도록 했다.

이들은 알고리즘을 역으로 적용함으로써 기존 알고리즘이 어떻게 새나 건물 등을 인식하는지를 찾아낼 수 있었다. 딥드림이란 이 프로젝트는 구름이나 식물을 통해 외계의 동물이 자라나는 것 같은 그로테스크한 이미지와 숲이나 산을 배경으로 탑이 솟아나는 듯한 환상적인 이미지를 보여주었다.

"어쩌면 자신의 판단에 대해
부분적으로만 합리적 설명을 할 수 있는
것은 지능의 본질적 특성 중 하나일지
모릅니다. 나머지는 그저 본능이나
무의식같이 불가사의한 것이죠."

이 이미지들은 딥러닝이 전적으로 이해할 수 없는 어떤 것은 아니라는 사실을 알려준다. 곧, 알고리즘이 부리와 깃털 같은 흔한 시각적 특징에 주목한다는 사실을 밝혀낸 것. 그 이미지들은 사람이 대부분 무시하는 어떤 특징을 컴퓨터는 중요하게 생각한다는 점에서 딥러닝과 인간 인식의 차이를 보여준다.

구글의 연구진은 이 알고리즘이 아령의 이미지를 만들 때 곧잘, 아령을 들고 있는 사람의 팔도 그려낸다는 것을 언급했다. 기계는 사람의 팔을 아령의 일부로 생각하고 있는 것이다.

뇌과학과 인지과학의 아이디어들이 이 분야의 연구에 이용되고 있다. 와이오밍대학 제프 클룬 교수팀은 심층 신경망을 테스트하는 방법으로 인공지능이 일으키는 일종의 착시를 이용했다. 2015년 연구팀은 특정한 이미지로 해당 신경망 하위 계층의 패턴들을 자극, 실제로는 존재하지 않는 대상을 있는 것처럼 여기도록 인공지능을 속일 수 있음을 증명했다.

“만약 아주 작은 신경망이라면, 이를 이해하는 것이 가능하다. 하지만 신경망이 커지면, 한 계층에 수천 개의 신경이 있고 이런 계층이 수백 개가 있다. 이런 상황에서 신경망을 이해하는 것은 불가능하다”

이 팀의 공동연구자중 한 명인 제이슨 요신스키는 뇌에 탐침을 찔러 신호를 찾는 것과 비슷한 일을 심층 신경망에 하는 도구를 만들었다. 신경망의 중간에 있는 하나의 신경을 골라, 그 신경을 가장 강하게 반응시키는 이미지를 찾은 것. 그 이미지들은 마치 인상파 화가가 플라밍고나 스쿨버스를 그린 것처럼 매우 추상적이어서 인공지능의 인식 능력이 가진 신비한 특성을 더욱 잘 드러내 주었다.

우리는 이런 단편적인 것보다 인공지능이 어떻게 생각하지는 지에 대한 더 많은 지식이 필요하다. 하지만 이를 위한 간단한 방법은 없다. 상위 계층의 패턴 인식과 복잡한 판단에는 심층 신경망 내부에서 이루어지는 계산이 중요한 역할을 하지만 그 계산들은 복잡한 함수와 변수들로 얽혀있다.

“만약 아주 작은 신경망이라면, 이를 이해하는 것이 가능하다. 하지만 신경망이 커지면, 한 계층에 수천 개의 신경이 있고 이런 계층이 수백 개가 있다. 이런 상황에서 신경망을 이해하는 것은 불가능하다” 자콜라 교수의 말이다.

자콜라 교수의 옆방은 기계 학습을 의료에 적용하기 위해 노력하고 있는 MIT 레지나 바질레이 교수의 방이다. 그녀는 몇 년 전, 43세의 나이로 유방암 진단을 받았다. 병 자체도 그녀에게는 충격이었지만, 더 아쉬웠던 것은 최신 통계학이나 최신 기계 학습 기술이 종양학 연구나 암환자 치료에 전혀 쓰이고 있지 않다는 사실이었다.

그녀는 인공지능이 의약 분야를 혁신할 수 있는 잠재력을 가지고 있으며 이는 의료 기록을 활용하는 것 이상을 의미한다고 말한다. 그녀는 아직 제대로 활용되고 있지 않은 데이터들(이미지 데이터, 병리학 데이터, 그리고 모든 정보)을 활용하려는 계획을 세우고 있다.

그녀는 지난 해 암 치료를 끝낸 후 자신의 학생들, 메사추세츠 종합병원 의사들과 함께 연구자들이 관심을 가질 만한 임상 특징을 가진 환자의 병리학 보고서를 골라내는 시스템을 개발했다. 그러나 바질레이는 이 시스템이 자신의 판단 근거를 댈 수 있어야 한다는 것을 이해하고 있다.

이 때문에 그녀는 자콜라 교수팀과 함께 단계를 하나 추가했다. 시스템이 자신이 발견한 패턴의 대표적인 문장 일부를 추출해 보여주는 것. 바질레이 교수팀은 또 유방엑스선 사진에서 유방암의 조기 징후를 찾아낼 수 있는 딥러닝 알고리즘을 개발하고 이 시스템도 자신의 판단 근거를 설명하도록 만들려 한다.

“기계와 인간이 서로 협력할 수 있는 구조가 반드시 있어야 합니다.”

"이 예측 불가능하며
이해할 수도 없는 인공지능과
우리는 얼마나 잘 소통하고
어울릴 수 있을까?"

<본 기사는 테크M 제50호(2017년 6월) 기사입니다>

TECH M

TECH M

인공지능의 어두운 비밀 (중)

인기기사

광고영역

태그