출시 3주만에 80만명의 이용자를 끌어모을만큼 인기를 누렸던 인공지능(AI) 챗봇 '이루다'가 사라졌다. 이루다의 인기 배경이었던 '자연스러운 한국어 일상 대화 능력'이 개발되는 과정에, 이용자 데이터가 적절히 처리되지 않았다는 비판이 거세게 일어난 뒤다. 이루다를 개발한 스캐터랩은 결국 회사측 과실을 일부 인정하고, 지난 12일 이루다 서비스를 중단했다.
17일 챗봇 이루다 서비스가 중단된 뒤에도 개인정보와 관련된 논란이 계속되고 있다. 스캐터랩이 이루다 개발에 활용한 데이터 '카카오톡 대화 100억건' 때문이다. 이는 스캐터랩이 운영하는 또다른 서비스인 '연애의 과학' 이용자들로부터 수집됐다. 연애의 과학은 이용자와 특정 대화 상대의 카카오톡 채팅 내용으로 서로의 애정도·친밀도를 분석하는 앱으로, 지난 2016년 출시됐다.
스캐터랩은 연애의 과학 이용자들로부터 제공받은 데이터를 이루다 서비스 개발에 활용했지만, 그 방식은 합법적이었다는 입장이다. 연애의 과학 이용자들에게 '개인정보 취급방침' 동의를 받았다는 이유에서다. 하지만 이용자들 사이에선 서비스 이용을 위해 제공한 데이터가 전혀 별개 서비스를 만드는 데 활용된다고까지는 예상하지 못했다는 반응이 나왔다.
형식상 이용자의 동의를 받았기 때문에 법적으로 문제되지 않는단 논리는 개인정보 침해 사례가 불거지는 온라인 서비스 사업자들의 초기 대응에서 공통적으로 확인된다. 지난 15일께 지도 앱 카카오맵에서 '즐겨찾기' 폴더 기능을 통한 개인정보 침해 이슈가 불거질 때, 카카오 측에서도 정보 입력시 이용자에게 공개 허용에 대한 동의를 받았다는 해명이 나왔다.
실제로 개인정보보호법상 그 당사자(정보주체)와 사업자간 분쟁시, 사업자가 확보한 이용자 동의는 이용자가 미처 예상하지 못했던 광범위한 개인정보 이용방식을 정당화하는 근거로 활용된다. 그러나 정보를 제공하면서도 개인정보 취급방침을 '정독'하는 이용자는 극히 드물다. 현실에서 이용자 동의의 법률적인 효력과 한계는 '회색지대'에 있다.
향후 이용자 데이터로 AI 기술을 개발하고 온·오프라인 서비스와 결합하는 사례가 많아질수록, 개인정보의 수집과 활용에 대한 이용자 동의는 큰 무게를 갖게 된다. 스타트업·대형포털뿐아니라 '상품추천 AI'를 활용하는 유통·배달 서비스사, 디지털 개인화 서비스를 강화하고 있는 이동통신사·제조사 등 모든 기업 디지털 서비스의 합·불법 경계가 갈릴 수 있다.
고학수 한국인공지능법학회장(서울대 법학전문대학원 교수)는 "실제 법적 분쟁이 벌어지면 이용자가 동의해야 하는 개인정보 취급방침의 표현이 얼마나 구체적이어야 하는가, 그 해석의 주체가 기업과 이용자 중 어느 쪽이어야 하는가, 이런 부분을 다투게 될 것"이라며 "법원에선 이제까지 다뤄지지 않은 논점이라, 중요한 선례가 나올 수 있다"고 지적했다.
스캐터랩은 앞서 일련의 사건으로 이용자들에게 제공받은 데이터와 개인정보를 합법적으로 처리하지 못했을 것이란 의심을 샀다. 특히 연애의 과학 이용자들은 개인정보 유출 이슈에 민감하게 반응할 수밖에 없었다. 애초부터 자신이 제공한 카카오톡 대화 내용이 전혀 별개 서비스인 이루다를 개발하는데 활용됐으리라고 예상하지 못했기 때문이었다.
이루다가 정식 출시 후 특정 키워드에 답할 때, 은행과 예금주 명, 숫자 등이 포함된 문장을 답한 경우가 있었다. 스캐터랩은 비식별화·익명화를 거쳤다고 밝혔지만 실제 이용자 채팅 데이터에서 걸러지지 않은 문자열이었다. 스캐터랩이 특정 인물의 실명 등을 포함한 100건의 연애의 과학 이용자 채팅(1700개 문장 분량) 데이터를 삭제하지 않고 개발자용 온라인 사이트에 수개월간 게재해 왔다는 사실도 뒤늦게 알려졌다. 이와 관련해 스캐터랩은 개인정보보호위원회와 한국인터넷진흥원의 개인정보보호법 위반 여부 조사를 받고 있다
스캐터랩에서 직원으로 일했던 인물의 제보로 회사 내부 단체대화방에서 이용자들이 제공한 채팅 내용을 돌려봤다는 의혹도 제기됐다. 스캐터랩은 이 사안에 대해 자체 진상조사위원회를 구성해 단체대화방 대화 내역을 조사 중이며 파악된 결과를 공표하겠다고 밝혔다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지