바로가기 메뉴
본문 바로가기
대메뉴 바로가기

TECH M

비식별화된 개인정보, 얼마나 안전할까?

인터넷진흥원, 비식별 빅데이터 개인정보 위험성 분석 나서

2017-03-03강진규 기자

 

빅데이터 활용과 관련해 개인정보의 식별 위험에 대한 분석이 진행된다. 그동안 제기돼온 문제인 온라인 정보들을 조합한 개인 식별 위험과 비식별 조치된 개인정보와 공개 정보를 조합한 위험성에 대한 확인 작업이 이뤄진다.

3일 정부 관계자들에 따르면, 한국인터넷진흥원(KISA)는 이 달 말부터 6월까지 ‘빅데이터 환경의 차등화 된 개인정보 보호 연구’를 진행한다.

그동안 시민단체와 보안 전문가들은 빅데이터 활용 시 개인정보 보호에 대한 문제를 지적해왔다. 온라인상 대규모 정보를 수집, 이용할 때 개인정보 침해의 우려가 있다는 것이다. 또 빅데이터 활용 시 비식별 조치된 개인정보에 대한 문제도 제기돼 왔다.

한편에서는 개인을 확인할 수 있는 일부 정보를 삭제하거나 볼 수 없도록 비식별 조치를 하면 안전하다고 주장했다. 반면 비식별가 완벽한 것이 아니며 공개된 정보들과 비식별 정보가 결합될 경우 식별 정보가 될 수 있다는 지적도 있었다.

빅데이터와 개인정보를 놓고 갑론을박하고 있는 가운데 이번 연구는 빅데이터 환경에서 개인정보 활용에 대한 실제 위험을 확인하기 위해 진행된다.

KISA는 온라인상 접근이 용이한 외부 공개정보로부터 개인 식별의 위험성을 분석한다. 포털 사이트, 카페, 블로그, 소셜네트워크서비스(SNS) 이용자 게시글을 비롯해 인터넷 사이트에 공개된 다양한 정보를 수집, 분석해 어느 정도 개인식별의 위험과 악용 가능성이 존재하는지 확인한다는 것이다.

또 KISA는 비식별 조치된 샘플 데이터와 외부 공개정보 연계에 따른 개인식별 위험도 분석한다. 비식별 조치된 데이터에 공개정보를 조합할 경우 실제 어느 정도 개인식별이 가능한지, 또 어떤 위험이 있는지 알아보겠다는 것이다.

이 분석에는 가명처리, 총계처리, 데이터 삭제, 데이터 범주화, 데이터 마스킹 등 비식별 방법이 연구된다. K-익명성의 취약점, 안정성도 분석 대상이다. 정부는 지난해 6월 개인정보 비식별조치 가이드라인을 통해 비식별화 안전장치로 K-익명성 모델을 소개했다. K-익명성은 동일한 값을 가진 레코드를 K개 이상으로 해 특정 개인을 추론하기 어렵도록 하는 방법이다.

이와 함께 KISA는 개인정보를 식별하려는 의도를 경제적 이익, 악의성, 기타 목적 등으로 나눠 위험성을 분석하고 위험에 따른 경제적, 사회적 영향도 분석한다.

KISA 관계자는 “KISA가 개인정보 비식별조치 지원센터를 운영하고 있다”며 “센터를 운영하고 비식별조치를 지원하는데 활용하기 위한 내부 자료로 쓰기 위해 시뮬레이션 등의 방식으로 연구하는 것”이라고 말했다.

이번 연구로 분석된 내용은 정부의 빅데이터 정책과 비식별화 등에 영향을 줄 것으로 보인다. 그동안 우려했던 문제가 실제로 드러날 경우 보완 조치가 이뤄져야할 것으로 예상된다. 반대로 문제가 크지 않은 것으로 나타나면 빅데이터 활성화 추진의 근거 자료가 될 수도 있다.

[테크M = 강진규 기자(viper@techm.kr)]

(주)테크엠주소 : 서울시 강남구 테헤란로2길 27, 10층 (역삼동, 비젼타워)대표이사.발행인 : 김현기편집인 : 허준개인정보보호책임자 : 김현기청소년보호책임자 : 허준
사업자등록번호 : 553-81-01725대표전화 : 070-4513-1460보도자료 및 제보 : press@techm.kr