Deepinsight 아주경제 오피니언

브랜드칼럼

문송천 교수 moon@kaist.edu

- 카이스트 경영대학원 교수
- 미국 일리노이대(어바나 샴페인) 전산학 박사
- 유럽 IT학회 아시아 대표이사
- 카이스트, 케임브리지대, 에든버러대 전산학과 교수

[문송천의 디지털 산책] 빛의 속도 양자컴 .. 그런데 어디다 쓰지
창작과 비평은 인간 고유의 몫이다. 기계가 결코 대신할 수 없는 영역이다. 아무리 인공지능(AI)이 현란해 보여도 자연지능을 넘어설 수는 없다. 알파고가 이세돌에게 4승 1패로 이긴 것으로 인해 AI가 인간을 능가할 수 있을 것으로 인식되기 시작했으나 단지 착각에 불과한 것이다. 마치 자동차 속도를 사람이 못 따라가듯이 그랬다. 컴퓨터는 계산을 빨리 하는 기계에 불과하다. 1초에 수십조 번 계산을 쉽게 하니 상상이 되겠나. 그럼에도 불구하고 ‘컴퓨터가 일일이 다시 계산하려면 시간이 좀 걸릴 테니까 중간 결과를 내가 대신 어딘가에 저장해놔야 마음이 놓이지, 그래야 나중에 얼른 가져다 쓰지’라는 무식한 생각을 하는 게 보통이다. 이런 중간 결과 저장이 일으키는 파장은 크다. 이 글에선 논할 바 아니지만 중간 결과는 가급적 또는 아예 없을수록 데이터 정확성에 기여한다. 기계에 대한 중간 결과류의 통상적 배려가 완전히 틀리다는 것을 인정하기 싫은 것이 인간의 자존감에서 나오는 것일까. 기계를 다스리는 인간 자부심의 본질은 창작과 비평 능력에 있다. 기계는 해본들 거의 표절급이다. 그래서 윤리 문제가 바로 등장하는 것이다. 창작 능력이 없으면 비평하는 능력 자체도 불가능하다는 점 역시 자명하다. 생성AI가 표절 혹은 단순 검색 일변도의 문장을 쏟아낼 수밖에 없는 것도 이유는 알고 보면 그래서다. 기계 대 인간 간 게임에 대해 정교히 알기 위해서는 컴퓨터라는 기계가 어떤 구조하에 어떻게 작동하는지 알지 않으면 안 된다. 이런 작동 원리에 대해 자세히 모른 채 내놓은 생각과 판단은 단지 착각에 불과할 따름이다. 따라서 응용전산학자, 즉 기초전산학자에 속하지 않는 이들이 내놓은 판단은 대개 과장이 많고 틀린 경우도 적지 않다. 최근에는 양자 컴퓨터에 대한 이야기가 많다(아주경제 2025년 2월 20일자). 거슬러 올라가면 사실상 작년 이맘때쯤부터 화제로 등장했다. '미래 산업 만능 열쇠 양자컴퓨터, 산업계 난제 한 방에 풀릴 것'란 본제의 뉴스가 떴다(매일경제 2024년 4월 1일자). 양자 컴퓨터란 정보 저장 능력을 기존 컴퓨터에 비해 증가시키기 위해 기존 컴퓨터에 비해 색다른 방법을 쓴다. 기존에는 정보를 표현하는 비트 한 자리에 0이나 1 둘 중 하나가 들어가지만 양자 컴퓨터에서는 그 한 자리(‘큐비트’라고 칭함·원어는 퀀텀 비트)만 가지고도 한 순간에 0과 1을 동시에 갖기도 한다. 즉 기존 컴퓨터에서는 0과 1을 동시에 갖는 일은 불가능하단 뜻이다. 이게 무슨 이야기인지는 비트 두 자리를 놓고 기존 컴퓨터와 양자 컴퓨터를 비교해봐야 실감이 난다. 기존에는 두 비트가 있을 때 어느 한 특정 순간에 가질 수 있는 값은 00, 01, 10, 11 중 단 하나만 된다. 즉 00과 01을 동시에 나타낼 수는 없단 뜻이다. 또한 두 비트에서 이 네 값을 같은 한 순간에 동시에 갖는 일이 불가능하다. 그런데 양자 컴퓨터에서는 00, 01, 10, 11이라는 4개 값을 한 순간에 동시에 갖는 일이 특이하고 희한하게 가능하다. 즉 기존 비트에는 2의 n(n은 비트 수)승의 1이라는 경우의 수 중에서 오로지 단 한 가지 경우만을 값으로 갖지만 큐비트에서는 2의 n승의 경우의 수 전체를 한꺼번에 모두 갖는 게 가능하다는 뜻이다. 양자 컴퓨터의 표현 능력은 기존 컴퓨터에 비해 커지는데 n이 증가할수록 표현 능력은 기하급수로 늘어나게 된다. 그렇다면 왜 이렇듯 같은 비트 자리 수를 가지고도 기존 방식과 양자 방식 간에 이렇게 현저히 다른 표현이 나오는 것일까. 이를 이해하려면 자석과 빛의 성질 차이를 생각해보면 된다. 강자성을 띤 자석은 한번 자화가 일어나면 외부 자기장이 사라져도 잔류 자화가 남아 있는 물질이다. 이런 식으로 N극 혹은 S극 중 한쪽 방향으로 자화시킨 게 바로 한 비트의 0과 1에 해당한다. 이게 기존 컴퓨터의 작동 원리다. 반면 양자란 것 자체가 양자 컴퓨터는 빛과 파동의 원리로 작동한다. 유리 같은 물체에 빛이 비치면 외부에서 보는 각도의 차이에 따라 각양각색의 다른 무지개 색깔 모양으로 눈에 보이게 된다. 광전효과란 빛이 갖는 입자의 성질을 이용한 현상으로 금속 판에 일정한 진동수 이상의 빛을 비추면 표면에서 전자가 튀어나오는 현상이다. 이때 튀어나오는 전자의 패턴이 각양각색으로 달라질 수 있단 말이다. 이걸 어디다 응용할 수 있을지 알아보기 위해 미로 찾기 게임을 연상해보자. 기존 비트로는 한 번에 하나의 미로 경로를 시도한다면 큐비트로는 한 번에 여러 경로를 동시에 시도하는 게 가능해질 것이라는 말이다. 양자 컴퓨터를 다룬 기사 중에는 다음과 같은 내용도 있다. '슈퍼컴 능가하는 양자 컴퓨터 전 세계 전쟁 중' '1만번 해야 할 실험, 한 방에 해결' '신약개발 등 AI가 연구실 풍경 바꿔놔' 같은 류의 장밋빛 전망으로 일관된 내용들이다. 과연 그럴까. 이에서 더 진전하여 'AI와 결합할 경우 인간 지능을 넘어서는 초지능도 가능, AI 학습에 필요한 막대한 양의 데이터를 양자 컴퓨터가 처리해 줄 수 있을 것'이라는 내용도 있다. 그러나 세상에 존재하는 오늘날 기업이나 공공 조직 내 데이터 중 절반이 값의 부정확성 내지 불필요한 누더기 같은 중복으로 인해 쓸모없는 것이라는 사실을 안다면 양자 컴퓨터가 제 아무리 막대한 계산을 순식간에 해 낸다고 해서 AI 성능이 상상할 수 없을 정도로 향상될 것이라는 주장은 완전히 틀렸다는 점을 지적하지 않을 수 없다. 문제는 데이터 아닌 것들이 데이터로 둔갑한 경우가 허다하다는 점이다. 예를 들면 2+3=5에서 계산 과정 초기 인자 2와 3은 데이터지만 5는 계산 결과지 계산 데이터(data)는 아니라는 사실을 한번 간파해봐야 한다. 여기서 5를 계산 결과로 나온 정보(information)로 부를 수 있으나 초기 조건으로서 주어진 데이터는 결코 아니다. 이게 데이터와 정보의 현저한 차이점이다. 이걸 큰 차이로 받아들이지 않는다면 컴퓨터 작동 원리나 컴퓨터를 사용하여 만들어져서 돌아가는 기업(공공조직 포함) 정보시스템의 작동 원리에 관해 별로 알고 싶은 생각이 없다는 방증이다. '미국은 양자 컴퓨터 상용화에 근접, 중국 일본 맹추격, 한국은 세계시장 점유율 1.8%'라는 내용도 나온다. 그러나 중국과 일본이 국가 자체, 즉 국내산 운영체계(OS) 없이 추격을 해본들 무슨 소용이 있겠나. 아마존이나 메타(페이스북) 등도 AI 대전에 참전하는 배경은 그들은 자체 OS를 이미 보유하고 있기 때문이라는 사실을 반드시 알아야 한다. 그들이 기존 원도즈나 안드로이드를 채택하여 AI 대전에 뛰어든다면 누가 결과적 승자가 될지 그 결과는 뻔한 것 아니겠는가. 남 좋은 일을 아마존과 메타가 할 필요가 있을까. 기존 OS 의존 없이 자신만의 신규 OS를 만들지 않으면 사상누각이 되기 때문이다. 우리나라가 특히 약한 부분이 바로 여기다. 요즘 잘하는 희망 섞인 말로 한국어와 한국 문화에 능한 토종 챗GPT 또는 AI로 인한 연구실 풍경 변화 운운하는 내용의 기사가 심심치 않게 눈에 들어온다. 그러나 과연 그럴 수 있을까. 토종 AI가 토종 OS 위에서 돌아간다면 말이 되는 것이지만 그런 게 아니라면 남 좋은 일만 하는 결과를 불러일으킬 게 뻔한 것에 대해 번지수 잘못 짚은 일임을 알아야 한다. 양자 컴퓨터에 대한 전망으로 '신약·우주·군사무기 패권 결정할 게임체인저'라는 내용도 나온다. 그러나 자연현상 분석, 신약 개발, 금융 투자 분석, 통신 암호 분석 등 분야에서는 그럴 수 있겠지만 재무회계 수치의 정확성이 요구되는 기업 부문에서는 양자 컴퓨터가 설 땅은 별로 없다. 그 이유는 큐비트의 한계인 계산의 오류다. 현재 기술 수준으로 1000번 계산 중 한 번 오류는 큐비트가 지닌 매우 심각한 문제다. 기존 비트로는 수조 번을 계산해도 오류가 한 번도 나지 않는다. 빠르다고 무조건 좋은 건 아니다. 1억번에 걸쳐 해야 할 실험을 단 한 방에 깨끗이 해결한다는 말은 예측력이 중시되는 특수 영역에서는 의미가 있을 일이지만 데이터의 정확성에 대해 타협의 여지를 허용하지 않는 대부분 일반 재무 중심의 기업 부문에는 별로 도움이 되지 않는 내용이기 때문이다. 최근에는 CES 2025에서 엔비디아의 젠슨 황 회장이 기조연설을 하면서 그리고 연설 후 시간이 수주 지난 시기에 양자 컴퓨터에 대한 실용화 시기에 대해 오락가락하는 전망을 내놔 세상을 떠들썩하게 만들기도 하고 양자 관련 주식 투자자들의 심기를 불유쾌하게 건드린 일이 있었다. 이를 보면 양자 컴퓨터의 미래에 관한 전망치는 응용 분야에 따라 크게 좌우될 수 있다고 이해해도 무방하다. 연구 분야 중에 예측 분야가 있다. 그들의 연구 결과는 기상예보를 비롯해 다양한 용도로 쓰인다. 그런 분야를 관찰하다 보면 딱 들어 맞는 경우보다는 오히려 틀리는 게 정상이라는 판단도 얼핏 든다. 틀려도 용납 가능한 수준에서 약간의 오차로 틀린다면 쓸 만한 일이기도 하다. 기상예보 주기가 길어 본들 1주 단위로 나오는 건 잘 아는 사실이다. 그런데 양자 컴퓨터의 계산 속도에 힘입어 만일 5년 치 혹은 10년 치 기상예측이 비교적 정확하게 가능하다면 여러 산업과 여러 사람에게 영향력을 발휘할 것이다. 주가 예측도 그렇고 교통 상황 예측도 그런 쪽에 해당한다. 태양계는 보통 1광년 내에 속한다. 지금은 화성·목성까지만 가지만(거리로는 10억㎞ 이내) 나중에는 양자 컴퓨터의 성능으로 지구에서 가장 멀다고 하는 135억 광년(거리로는 10조㎞-목성까지 거리의 1만배) 떨어진 은하계를 후손들이 왔다 갔다 할 날도 올 것이다. 그러니까 기존 컴퓨터보다 수천 배 이상의 성능을 지금 당장 기대한다면 양자 컴퓨터를 그런 쪽에 쓸 수 있단 뜻이다. 하지만 기존 컴퓨터 발전 속도를 감안하면 1000배 성능 정도는 통상 10년 내에 가능한 일인 바, 생각하기에 따라 양자 컴퓨터의 쓸모가 정해질 것이다. 얼마 전 90세를 일기로 스위스에서 존엄사를 택한 노벨상 경제학상 수상자 대니얼 카너먼의 말처럼 관점에 따른 선택의 폭과 자유는 생활 속에서 무척 많이 주어질 전망이다. 문송천 필자 이력 ▷카이스트 경영대학원 교수 ▷미국 일리노이대(어바나 샴페인) 전산학 박사 ▷유럽IT학회 아시아 대표이사 ▷대한적십자사 친선홍보대사 ▷카이스트·케임브리지대·에든버러대 전산학과 교수
[문송천의 디지털 산책] 선거망 신뢰 회복, 데이터 검증 부터
부정선거 혹은 선거부정에 대한 의혹이 전혀 수그러들지 않고 있는 상황이다. 이 사안이 계엄의 단초로 작용했다는 점을 감안해서가 아니라 선관위 선거투개표 시스템에 잘못 설계된 것이 만에 하나라도 있다면 이쯤에서 개선책을 내놔야만 의혹을 줄여 나갈 수 있을 것으로 본다. 이 문제는 진영 대립을 떠나 의혹을 냉정하게 객관적으로 분석해 볼 필요가 있는 중대 사안이다. 따라서 이 글에서는 좌우를 떠나 개선점을 면밀하게 짚어보고자 한다. 지난달 10일 의혹이 헌법재판소에서 변론으로 다루어지긴 했으나 전문가들이 아니다 보니 워낙 피상적이었던 점은 유감이다. 공방은 3가지 관점이다. 첫째로 선거인 명부 조작 가능성, 둘째로 보안체계 우회 가능성, 셋째로 망 분리라는 세 가지 관점에서 다뤄졌는데 이런 수위는 국회에서 벌어지는 국정청문회에도 못 미치는 수준이었다. 선거망에 전문성을 보유한 컴퓨터 전문가 단 한명도 없이 형식적으로 진행됐다. 법적인 요건 상 아마 없어도 됐을 것이지만 전 국민 앞에서 논리적으로 또한 과학적으로 명쾌하게 짚고 넘어갈 수 있는 호기였으나 무척 아쉬운 대목이었다. 사이버 보안에서 내부위협을 전문적으로 다루는 연구기관의 최근 2025년 2월 보고서를 참고하면 외부위협은 25%에 달하며 내부위협 또한 그에 못지않은 수준인 22%에 달하는 것으로 나타났다. 내부위협의 비율은 2017년 보고된 39%(하버드 비즈니스 리뷰 2017년 12월 6일자)보다는 다소 줄어든 것이지만 여전히 경종을 울려주는 대목이다. 내부위협 기술은 외부위협 기법에 비해 매우 정교하다. 그런데 이번 헌재 부정선거 의혹 공방은 모두 외부위협 관점에서만 다뤄졌지 내부위협은 언급조차 되지 않았다는 점이 문제다. 변론에서는 국정원 내 해킹전문가라고 하는 어느 차장이 출석하여 질의 응답이 진행됐으나 질의가 상기 세 관점에 국한된 것들이라 응답 역시 그 수준에 머물렀다. 선거정보시스템(속칭 선거망)에서 내부위협까지는 아니더라도 얼마 전 행정망(정확히는 행정정보시스템)에서 발생했던 오류처럼 선거망에서도 오류가 일어날 만한 여지를 배제할 수는 없는 일이다. 데이터 설계 및 데이터 통합 관리가 부실했다면 충분히 문제가 있을 수 있다. 결론부터 말하면 행정망 데이터 오류와는 성격이 약간 다르기는 하지만 선거망 데이터 오류가 있었을 가능성이 유력하다. 왜 그럴까. 보도에 의하면 선관위가 보유한 전산장비는 6400대로 집계(더팩트 2025년 2월 12일자)되는데 그 많은 컴퓨터 장비에서 발생하는 선거데이터가 중앙선관위에서 중앙집중 관리되도록 통합 설계되어 있는지에 대해서는 보도된 바가 전혀 없다. 좀 더 자세히 설명하면 그 많은 수천대 PC가 지역 개표소에 흩어져 있다는 이야기인데 각 PC에서 선거데이터 구조를 어떤 기술로 어떻게 설계했는지 살펴봐야 한다. 전국 개표소 수는 총 251개로 나온다. 시군구별 선관위(개표소)에서 각기 선거데이터를 생성하기 위해 PC가 26대씩 사용됐다는 계산이 나온다. 중앙선관위에서 이들 원초 데이터를 과연 어떤 과정과 경로를 통해 어떤 기술로 취합하여 여하히 통합 관리했는지도 봐야 한다. 만약 이종 기술들이 혼재해서 사용됐다면 더 세심히 들여다봐야 한다. 그러면 데이터 일관성 및 정합성이 어느 수준에서 지켜졌는지 또한 문제가 있다면 어떤 유형의 데이터 오류가 있었을지 판단 가능해진다. 이를 제대로 점검한다면 선관위로서도 부정 의혹을 잠재울 수 있는 좋은 계기가 될 것이다. 이런 기술적 부분들은 법조계에 몸을 담고 있는 이들에게는 어려운 내용이겠으나 전문가에게 맡기면 되는 일이다. 선거망도 정보시스템의 하나다. 잠시 행정망 사고를 되돌아보자. 2023년 11월에 발발한 것으로서 일주일 사이에 연이어 먹통 사고가 발생했고 그 후로 6개월이 지난 2024년 5월 또다시 서류 오발급 사태가 발생했다. 정부24에서 민원 서류를 신청했는데 남의 서류가 나오는 오류가 여러 군데서 터진 것이다. 서류에는 많은 데이터가 들어간다. 남의 서류가 나왔다는 뜻은 바로 남의 데이터를 건드리도록 시스템이 흘러갔다는 의미다. 행안부는 이 사고를 “정부24 오류 발급은 개발자의 프로그램 개발 상 실수 (코딩 오류)”라고 밝혔다 (2024년 5월 5일자 조선일보). 이게 과연 코딩 잘못일까. 그러자 “서류가 오발급됐다면 프로그램 개발자 실수 아닌 데이터 오류일 것”이라는 전문가 지적이 있었다(2024년 5월 7일자 디지털타임스). 그러므로 선거투개표도 선거데이터 품질을 짚어봐야 하는 문제로 귀결된다. 즉 데이터베이스(DB) 설계 오류일 가능성이 유력하다. 부정 의혹 주장을 객관적으로 살펴봐도 선거인 명부 부정확성, 즉 불일치성을 제기하는 것 위주다. 개별 단위 개표소에서 집계결과치 수기 표기 등의 허점이 드러난 것으로 주장하는 부분들이 있다. 그 골자는 데이터 정합성인데 선거데이터가 과연 부정확하게 처리됐다면 선관위 DB에 들어갈 데이터 설계가 부실하게 다뤄졌을 가능성이 있다. 선거DB 설계가 제대로 됐는지 살펴봐야 할 대목이다. 만일 무늬만 DB지 실상은 DB 기술에는 못 미치는 일반 파일 (엑셀 파일 수준) 처리 기술로 돌아갔다면 데이터 오류가 발생할 여지가 있는 것이다. 코로나19 때도 확진자 정보를 제대로 DB화 하지 않고 일반 엑셀 파일로 관리하다가 파일 후미에 위치해야 할 확진자 정보가 자동 실종되는 문제가 발생했던 적이 있었다는 사실을 유념해야 한다. 따라서 차제에 단독 조사팀이 아닌 객관성을 높여 공동 조사팀을 꾸려 선거망 설계를 점검할 필요가 있다. 명확히 규명하지 않고 그냥 지나칠 경우에는 두고두고 문제가 될 수 있다. 다른 것에 우선하여 선거DB가 과연 적절히 설계됐는지, 설계 상의 오류는 없었는지 추적해봐야 한다. 선거부정 의혹을 규명하기 위해 이 부분은 필요하다. 만에 하나 DB 설계 오류가 존재하여 DB 설계 수준이 미흡한 것으로 드러난다면 선관위가 의혹을 자초했다는 지적에서 자유로울 수 없기 때문이다. 선관위 케이스는 해킹 문제는 아닐 것으로 본다. 전에 원전 해킹 사태 그리고 청와대 국정원 KBS 등 국가 주요 시설 9군데가 동시다발적으로 해킹 당한 경우를 보면 대규모 해킹은 홈페이지 마비를 통상 동반한다. 그러나 선관위는 그런 류의 해킹을 경험한 적은 없는 걸로 안다. 그렇다면 문제가 유력시되는 DB에 대한 체크 리스트는 어떤 것일까. 3가지가 있다. 첫째 선거 DB를 어떻게 설계했는지, 둘째 DB가 대단위로 통합 관리되지 않고 산발적으로 관리되는지, 즉 중·소단위 혹은 개별 투표소 별로 관리되는지, 셋째 DB 보안을 위한 기법이 어느 수준에서 적용되는지를 세심히 점검해봐야 한다. 이를 위해 DB 전문가를 반드시 포함하여 합동 점검팀이 구성되어야 함은 물론이다. 일반 파일은 데이터 정확성을 보장 못하며 일반 파일이 아닌 정규 DB로 설계하더라도 설계자 사람의 실수로 정확성이 보장 안되는 경우가 발생할 수 있다. 후자의 경우는 기계 오류가 아닌 인재에 해당한다. 결국 DB 설계 품질이 어느 수준인지 판별할 수 있는 전문가가 투입되면 오류 가능성에 관한 모든 게 가려질 일이다. 데이터 전문가 투입 시 문제진단은 물론 해법까지 마련하는 데 오래 걸리지 않는다. 수개월이면 족하다. 20년 전 금융정보분석원(FIU) 시스템이 잘 돌아가지 않았을 때도 데이터 전문가를 투입하여 DB설계 관점에서 정밀 진단했고 그 결과로 데이터품질 문제가 제기되어 품질개선에 들어간 경험이 있다. 그후 개선된 FIU시스템은 지난 20년간 아무 문제 없이 잘 돌아가고 있다. 선관위 시스템점검위원회 구성을 볼 때 DB전문가가 유독 포함돼 있지 않은 점은 석연치 않다. 전국 개표소에서 총 6400대 PC를 썼다고 하는데 그 수준이라면 선거망 하부에 DB가 아예 없었다는 뜻이다. 엑셀 수준에서 선거결과가 집계됐을 것이다. PC에서는 DB기술이 원래 지원되지 않으므로 DB보안이 적용됐을 리 만무하다. 이 글을 읽은 분들은 컴퓨터전문가들은 다른 시각을 가지고 있다는 점을 발견했을 것이다. 색다른 시각이라는 의견도 있을 것이다. 모든 사회 구석구석에 컴퓨터 없이는 돌아가지 않는 세상이다. 트럼프 2기 행정부를 바라보는 시각 또한 컴퓨터전문가 눈에는 다르게 보인다. 행정부 요직에 무려 10여 명의 컴퓨터전문가를 등용했다. 인사부장관 복지부장관 법무부차관 등이다. 그간 암암리에 숨어든 비효율적 요인을 제거하겠다는 미국의 의지를 읽는다. 대한민국에서 국가데이터 관리가 부실하여 연 10조원 상당의 혈세 낭비가 있다는 분석을 본다면 우리도 이렇게 해야 한다. 이런 게 진정한 국가개혁이다. 선거부정 의혹을 단 한명의 컴퓨터전문가도 참고인으로 채택하지 않은 점은 큰 실책이다. 일개 해킹 관련 국정 청문회에서도 이렇게 하지는 않는다. 그보다 훨씬 중대한 국가적 사안을 이렇게 허술하게 처리하고 넘어가도 되는 것인가. 말로만 들어오던 선관위 인사 비리가 드디어 보도됐다. 지역선관위 당 평균 4건 꼴이다. 헌재는 선관위가 독립기관이라 감사 대상이 아니라고 감싸고 있다. 이로 인해 헌재와 선관위 발표 신뢰도에 의문을 다는 이들이 있는 것이다. 헌재 역시 독립기관이다. 독립 여하를 떠나 선진국에선 헌재는 물론 선관위도 감사 영역에 포함시킨다. 그래서 우리의 청렴지수가 세계 30위권인지도 모른다. 불편한 진실이다. 선거망에 대해 요약하면 선거데이터가 발생하는 애초 순간부터 중앙서버에서 관리되도록 시스템이 설계돼 있지 않았을 것이라는 점은 선거망이 구식 구멍가게 식으로 운영됐다는 점을 보여주는 결정적인 단면이다. 지금이 어느 시대인가. 클라우드 AI시대 아닌가. 그 핵심은 바로 데이터다. 그렇다면 선관위는 차세대에 대한 대비가 없었다는 뜻과 같은 것이다. 선거부정에 대한 내부위협까지 대응하려면 감시 인력 관여를 최소화하고 시스템적으로 자동으로 완벽하게 구현해야 한다. 공개 입찰로 업체에 단순히 맡겨서는 역부족이므로 FIU에서 했듯이 시스템 설계 초기부터 반드시 DB보안 전문가의 기술 지도를 받아야 한다. 그렇지 않고는 선거부정 의혹은 언제든 다시 터져 나오게 돼있는 것이다. 문송천 필자 이력 ▷카이스트 경영대학원 교수 ▷미국 일리노이대(어바나 샴페인) 전산학 박사 ▷유럽IT학회 아시아 대표이사 ▷대한적십자사 친선홍보대사 ▷카이스트·케임브리지대·에든버러대 전산학과 교수
[문송천의 디지털 산책] 기업 AI 경영의 ABC…데이터의 '쓸모'를 보자
기존에 데이터가 빅데이터급으로 많이 축적된 분야에서는 인공지능(AI)이 잘 작동할 수 있다는 단적인 사례를 보여준 것이 이번 노벨 물리학상과 화학상이다. 또한 이번 CES 2025에서 엔비디아의 젠슨 황이 보여준 신체적 AI라는 개념도 지금 생성 AI가 어느 방향을 향해 개발되고 있는지를 단적으로 보여주는 사례였다. 자동차나 로봇을 제외하면 다른 제조업 분야나 일반 기업 경영에는 아직 시기상조라는 증명이다. 왜 일반 기업 부문에 생성 AI가 맞지 않는 것일까. 거기에는 여러 원인이 있지만 그중 가장 결정적인 한계는 생성 AI의 기업 문서 분석 능력 부족에 있다. 그렇다면 그걸 개선하려면 뭐가 필요할까. 이게 이번 글의 주제다. 과학 분야에는 실제로 실험 결과로 수집된 빅데이터가 많다. 모두 실험실에서 나온 데이터들이다. 예를 들면 분자가속기 혹은 원자분쇄기로 명명되는 기계에서는 불과 1초당 1페타바이트(PB)라는 어마어마한 데이터 양이 발생한다. 1페타란 1000테라바이트(TB)로 10의 15승을 일컫는다. 따라서 충돌 실험이 수십 초 동안만 진행되더라도 수십 PB 분량의 데이터가 발생한다. 이는 대규모 물리 혹은 화학 혹은 생물 실험 현장이 아닌 기업에서는 상상도 못할 만한 큰 분량이다. 따라서 데이터가 풍성한 과학 분야는 AI가 잘 놀 수 있는 마당이 된다. 바둑의 기보가 빅데이터급으로 쌓일수록 알파고가 잘 작동했듯이 말이다. 알파고는 본질상 검색엔진이었다. 역대 기보 전체를 모두 학습한 데이터를 토대로 해서 다음 묘수를 찾아내는 데 인간보다 탁월했기 때문에 이세돌 9단을 제압할 수 있었던 것이다. 역대 기보 전체를 데이터 분량으로 추정하면 대략 40TB 정도 나온다. 빅데이터급(빅데이터로 불리려면 1000TB는 되어야 함)에는 훨씬 못 미치지만 그럼에도 불구하고 여전히 방대한 규모의 데이터다. 외장 하드디스크의 보통 용량이 2TB인 점을 감안하면 그 20배나 되므로 기보 전체는 꽤 큰 규모다. 이렇듯 AI는 무지막지한 분량의 데이터를 사전에 학습한 것을 기반으로 새로운 묘수를 제시하는 데 탁월하다. 우리 몸에서 중요한 역할을 하는 단백질의 새로운 구조를 밝히기 위해 과학자들은 많이 노력해왔다. 그러나 단백질 구조 분야는 연구비와 시간을 엄청나게 투자한다고 해서 결과가 그에 비례해서 나오는 분야가 아니었다. 이 과정을 AI가 파고든 것이다. 단백질은 마치 기다란 끈이 말려 있거나 접혀 있는 것처럼 보이는 아미노산으로 이뤄져 있다. 아미노산을 기본 생명 단위로 해서 긴 사슬 형태로 이루어진 모습이 단백질이라는 분자다. 참고로 분자란 원자들이 화학 결합을 통해 이루어진 단위체를 가리키는 용어다. 알파고 개발자로 유명한 하시비스는 자신의 영국 대학 박사 과정 시절에 그가 소속된 연구실에서 개발된 '폴드잇'이라는 게임을 해본 적이 있다. 폴드잇은 가상의 공간에서 아미노산을 갖가지 방법으로 접어보면서 조합을 시도하는 온라인 웹 게임이다. 단백질을 직접 접어 보면서 안정된 구조를 찾아가는 모의실험이다. 이 도구로 과학자가 수십 년간 밝혀내지 못했던 에이즈 바이러스가 증식하는 데 필수적인 단백질 구조를 다수의 온라인 게이머들이 단 3주 만에 찾아낸 일도 있다. 폴드잇을 써 본 하사비스는 새로운 구조를 찾아 나가는 과정이 바둑을 둘 때 다음 수를 내놓는 것과 같다고 생각했다. 바둑 기사들이 다음 수를 놓는 과정과 단백질 구조 예측을 하는 과정이 유사하다고 판단했고 이에 대한 실증작업으로 알파고를 만들어 이세돌 9단을 이긴 뒤에는 학습을 마친 AI는 확률적으로 가장 나은 제안을 한다는 사실에 확신을 가졌다. 그 자신감을 바탕으로 그는 신종 단백질 전용 알파폴드 팀을 곧바로 꾸렸다. 그가 개발한 검색엔진 알파폴드에서는 딥러닝 기술을 사용하여 기학습한 단백질 구조 데이터와 아미노산 특징 데이터를 바탕으로 확률적으로 가장 가능성이 큰 아미노산을 찾아내기에 이른다. 이는 마치 챗GPT가 다음에 올 가장 최적화된 단어를 찾아낸 것과 같다. 이렇게 하여 알파폴드는 단백질 구조를 90% 정확도로 예측해냈다. 이는 컴퓨터가 사람보다 10만배 빠르다는 증거 중 한 예다. 즉 전문가가 한 종류의 단백질 구조를 분석해내는 일을 수행하는 경우에 짧아도 수년 걸리지만 그런데 컴퓨터는 수십 분 만에 간단히 해결한다는 말이다. 인류는 50년에 걸쳐 아미노산 특징을 파악한 데이터를 보유하고 있다. 과학계에서 단백질 구조에 관한 데이터를 수집해 온 지는 50년 됐다. 즉 50년 동안 파악해 놓은 단백질 구조 빅데이터가 존재했다는 뜻이다. 아미노산 종류는 20개로 한정돼 있지만 단백질 종류는 수천만 개에 달한다. 아미노산과 함께 그동안 인류가 밝혀왔던 단백질의 특징과 같은 실험 데이터가 쌓였기에 AI 학습에 큰 도움을 준 것이다. 그렇다면 단백질 데이터와 아미노산 데이터 같은 것은 어떤 부류의 데이터인가. 그것은 전부 과학적 실험 데이터다. 즉 도표 형태로 묘사된 데이터들로서 문서 부류에 속하는 데이터는 전혀 아니다. 문장의 형식(문서)과 달리 단지 도표 하나가 데이터의 역할을 하는 것이다. 그러나 세상에는 과학 데이터보다 문서 데이터가 더 많다. 기업에는 특히 그렇다. 실험실 환경과 기업 환경은 다른 것이다. 그러므로 데이터가 단순한 과학 분야에서 AI가 괄목할 성과를 보인다고 해서 데이터가 문장 형태로 복잡하게 얽히고설킨 기업 분야에서도 그럴 것이라고 가정하는 것은 위험한 발상이다. 그러나 눈을 기업으로 돌려보면 기업 섹터는 데이터가 그런 규모로 많지는 않다. 기업으로서 전 세계적으로 가장 많은 데이터를 보유하고 있는 곳은 월마트로 총 데이터량이 무려 40PB에 달한다. 전 세계 기업 중 1PB 분량을 초과하는 데이터를 보유한 기업은 불과 10개 미만에 지나지 않는다. 우리나라엔 그런 기업이 하나도 없으며 미국에 구글, 아마존, 마이크로소프트를 포함한 단 몇 곳만 있을 뿐이다. 실제로 제조 기업에서 많은 데이터를 발생시키는 기업이 있다 하더라도 데이터를 사외에 공개하기가 불가능하기 때문에 생성 AI는 거기에 접근할 수 없다. 과학데이터는 숫자뿐이라 단순하지만 제조 기업에서는 발생하는 자체 데이터도 기업 내 문서와 관계가 있기 때문에 문서가 AI에 적합하도록 다듬어져 있기 전에는 AI를 실제 적용할 길이 없다. 기업 내 문서데이터는 문장 형태로 표현되는 게 특징이다. 숫자는 별로 없다. 제약회사와 공장형 제조 기업은 예외다. 그간 축척한 방대한 데이터를 활용해 정확도를 높여 불량률을 줄일 수 있었다. 제약회사는 의약 실험 데이터를 다량으로 보유하고 있기 때문에 AI 효과를 볼 수 있다. 이런 데이터가 풍부한 제조업을 제외하면 기업 부문에서 AI로 효과를 볼 수 있는 분야는 극히 제한적이다. 기업 문서 내 문장이 문법적으로 온전치 않으면 기업 문서를 있는 AI에 그대로 학습시켜본들 소용이 없는 까닭이다. 따라서 문장의 온전성을 판별하는 선행 과정이 필수적이다. 누가 무엇을 언제 어떻게 (무슨 행위 A를) 하는지에 대해 기술하는 것이 문장의 내용이다. 즉 어느 문장이든 6하 원칙을 갖추는 게 기본 중의 기본이다. 6하 원칙 중에서도 행위가 가장 핵심이다. A라는 행위를 매개로 해서 B-A-C와 같은 데이터 간 관계적 흐름이 조성된다는 뜻이다. 따라서 B와 C보다는 A가 초점인 것이다. 이게 문서 문장 데이터가 과학 수치 데이터와 다른 점이다. 문서 데이터에서 중요한 점은 그것을 AI의 먹이로 작용시키고자 할 때는 문서 내 문장이 행위 중심으로 기술되어 있는지 면밀히 살펴봐야 한다는 점이다. 행위 중심으로 돼 있어야 AI의 핵심인 문장 간 추론이 가능하기 때문이다. 추론이란 사실들을 죽 늘어 놓고 연역 혹은 귀납의 과정을 거쳐 새로운 사실을 발견해내는 일을 말한다. 도표를 기반으로 해서는 추론할 일이 거의 없다. 왜냐하면 도표 속 데이터는 단순히 숫자만 담고 있기 때문이다. 추론은 연역 또는 귀납의 과정을 거쳐야 가능한데 그러려면 데이터 간 연결고리 발견이 관건이다. 예를 들면 위에서 B라는 데이터와 C라는 데이터가 A라는 데이터를 통해 연결고리를 갖듯이 데이터 간 연결고리를 찾는 게 추론에서는 중요하다. 그걸 찾아가는 길, 즉 추론 경로라고 부른다. 이런 데이터 간 경로는 문장 내에서 발굴 가능해야 한다. 그런데 문법적으로 온전치 못한 문장에서는 이런 경로 발견이 불가능하다. 그러므로 만일 행위 중심으로 묘사되어 있지 않을 때에는 반드시 사전에 변환(정제)을 거쳐야 한다. 그 후에 AI에 문서 데이터를 학습시켜야 한다. 그래야 추론도 가능해진다. 따라서 행위 중심으로 제대로 제작된 문장을 교정 과정 없이 그대로 AI에 먹이로 준다면 실패할 수밖에 없다. AI에 내장된 추론 기능이 문서 정제까지도 자동으로 알아서 해주겠지 하는 생각은 오산이다. 잘못 작성된 문장이라도 많은 문장들을 학습시켜 보면 추론이 가능할 것 아니겠는가 하는 생각도 잘못이다. 쓰레기 더미에서 보석을 찾는 게 불가능하듯이 말이다. 따라서 AI 적용 효용성은 데이터의 유형으로 판가름 나는 것이다. 실험 결과가 숫자나 이미지 형태로 나타나는 기초과학 분야에서는 AI가 막강한 성능을 발휘할 수 있지만 숫자 형태보다는 문장 형태가 많은 사회과학 분야에서는 AI가 설 땅은 별로 없다. 기업 경영은 기초과학이 아니라 사회과학에 속한다. 따라서 경영 합리화와 경영 최적화를 위해서는 AI를 적용하기 전에 무엇을 필수적으로 갖추어야 하는지에 대해 깊이 생각해 봐야 한다. 문송천 필자 이력 ▷카이스트 경영대학원 교수 ▷미국 일리노이대(어바나 샴페인) 전산학 박사 ▷유럽IT학회 아시아 대표이사 ▷대한적십자사 친선홍보대사 ▷카이스트·케임브리지대·에든버러대 전산학과 교수
[문송천의 디지털 산책] 선거투개표 시비…무엇이 화근인가
지금은 인터넷 인구가 55억명에 달해 있는 시대다. 전 세계 인구의 65%에 해당한다. 유아들 빼고 나면 누구나 다 쓴다고 봐도 무방할 것이다. 시야를 지구촌 전체로 확대해보면 오지 어디를 가보더라도 이동통신망을 통해 교신 안 하는 성인이 거의 하나도 없을 정도로 보편화된 인터넷 시대 단면을 목격하게 된다. TV 이래 인터넷만 한 영향력을 발휘한 도구는 없었다. 어느 한 지역에서 촉발한 작은 변화라도 사회 전반으로 급속도로 확산되는 현상이 보편화됐다. 이는 인류 사회가 생각보다 빠르게 개방적 추세로 나가고 있다는 증거다. 이런 시대에 유권자인 국민들은 과거보다 전향적인 투명성을 원하는 동시에 과거 회귀적인 그 어떤 시도에도 거부감을 느낀다는 사실을 정치권에서는 모르는 것 같다. 그렇다면 투개표 방식에 대해선 이 시대 유권자들이 어떤 생각을 갖고 있을까. 미래지향적으로 가야 맞지 과거지향적으로 가는 걸 좋아할 사람은 거의 없을 것이다. 전자개표에 대해서도 일말의 문제가 있다고 느껴 그걸 기술적으로 개선하려는 노력 대신 과거 방식, 즉 수동 개표로 간다면 그걸 환영할 부류의 유권자는 소수일 것이다. 미국을 보자. 2016년 미국 대선에서 ‘케임브리지 아날리티카’라는 기업이 유권자 8000만명분 개인정보를 허락없이 남용한 페이스북 스캔들 사건이 터졌다. 댓글 조작을 통해 페이스북의 감정조작이 이루어져 그 미국 대선에서 트럼프 대통령이 당선되면서 소셜미디어에 대한 반감도 커졌다. 그후로 인터넷 시대에 투표의 공정성에 대한 문제가 제기되었고 미국은 IT 강국답게 모바일 투표를 도입하게 되었다. 비트코인 식 블록체인 기술을 기반으로 했다. 그 다음 대선, 즉 바이든 대통령을 탄생시킨 선거에서는 해외 주둔 병력을 포함한 재외국민투표에 블록체인 방식 투표를 적용했다. 또한 미국 조지아주 등 26개 주에서는 투표 회신에 획기적으로 이메일 방식까지도 허용했다. 애리조나주 등 4개 주에서는 대선 투표에서 모바일앱 투표도 도입했다. 이 앱도 투표 신뢰성을 보장하기 위해 상기 블록체인 방식을 통해 유권자 신원증명을 거쳤다. 우리의 선거 방식 현장을 보면 투표는 수동으로 개표는 자동으로 이루어진다. 투개표 방식에 불일치 현상이 존재하는 것이다. 이게 어떤 허점을 제공할 가능성도 배제할 수 없기에 선관위에서는 다각도로 노력하고 있는 것으로 알고 있다. 투개표 시스템이라는 것은 허점이 있어 보여도 선관위 내부적으로 투개표에 만전을 기하고 있다면 외부에서 투명성을 문제 삼기 쉽지 않다. 하지만 디지털 추세에 맞춰 우리도 향후 수동 투표가 아니라 전자투표로 가는 날에는 모바일앱 투표방식을 포함한 이메일 투표 도입도 상상해 볼 수 있을 것이다. 이렇게 가는 게 발전하는 국가의 맞는 방향이라고 본다. 이번 국가 계엄 사태에서 쟁점시 됐던 선거 정보시스템에 대해 다르게 접근했더라면 하는 아쉬움이 있다. 선거 시스템도 국가 정보시스템 중의 하나지만 사람이 만드는 것이라 완벽하지는 않다. 인간의 오류까지 막을 수 있는 완벽을 기하려면 블록체인 방법을 쓰면 될 것이다. 블록체인은 외부는 물론 내부 조작 및 해킹까지도 사전차단 및 사후추적 가능한 기술이다. 전자투개표에도 딱 맞아떨어질 수 있다는 데 착안한 에스토니아에서는 대선 투개표에서 블록체인을 실제로 사용하고 있다. 이런 가운데 선관위 전자개표기 오류 가능성에 대해 2023년 두 차례 실시한 점검에서 엇갈린 결과가 나온 것이 화근으로 작용했다고 본다. 먼저 국정원 측 주도로 했고 그 다음으로 선관위 측 단독으로 했다 (이데일리 2023년 10월 10일자). 두 점검 결과에서 상이한 점이 발견됐고, 그게 진영 별로 서로 다른 해석을 자아내는 기초가 되지 않았나 본다. 그 후로는 추가 점검이 실시된 적은 없는 것으로 안다. 이런 맥락에서 볼 때 국가지도자 입장에서 부정선거 진위를 과연 가리고자 했다면 선관위 관련 규정인 헌법 제114조를 유심히 살펴봤었다면 좋았을 것이다. 그에 따르면 선관위는 대통령 국회의장 대법원장의 3자 합의를 통해 구성되어 행정부 입법부 사법부와는 완전히 독립된 헌법기관이다. 그러므로 쉽지는 않겠지만 3자 합의가 이루어질 수 있다면 그 전제 하에 선관위 시스템에 대한 통합 태스크포스를 구성할 수도 있지 않았을까 하는 생각이 든다. 최근 국가행정망 마비사태 때 만들어졌던 태스크포스처럼 말이다. 단독 점검이 아니라 유관기관 통합적으로 보강하여 실시할 길은 있을 것 같다. 주요 행정 부처 장관 탄핵에 이어 계엄 선포 그리고 대통령 탄핵에까지 이른 이번 국정 혼란 사태는 한마디로 여야 법조계 출신들의 합작품이다. 여야 모두 법리에 강하다 보니 한쪽은 예상 외의 계엄 선포로 갔고 다른 쪽은 탄핵으로 맞섰다. 국가 요직에 법조인들이 몰리는 현상과 또한 그들을 선호하는 경향은 어제 오늘 일은 아니다. 그런 영입이 많은 배경엔 그들의 쓰임새가 뚜렷이 있기 때문이다. 입법 등의 법률 활동에 도움이 될 것이라는 정당과 유권자의 기대가 반영된 결과라고 본다. 단일 전문 직군 중에선 가장 많은 국회의원을 배출하는 분야도 바로 법조계다. 22대 국회에서는 법조인 출신이 60명으로 5명 중 1명꼴이다. 이는 21대보다도 30% 이상 늘어난 것이다. 20대 국회도 49명으로 6명 중 1명 꼴이다. 19대 총선에서도 48명이었다. 의회에서 이러한 법조계 편중 현상은 영국 프랑스 같은 나라에서는 찾아보기 힘든 기이한 현상이다. 우리는 총 의원 수의 20%에 달하는 반면 그들은 5% 미만이다. 그렇다면 이공계 출신은 얼마나 될까. 이공계 비율은 10% 문턱을 넘지 못하며 매우 낮다. 지난 20년간 그랬다. 이공계 비율은 21대 국회에 비해 22대 국회에서 더 낮아졌다. 이공계에 인물이 사실상 넘치지만 정치에 선뜻 나서지 않는 탓도 있다. 한때 비례대표 영입 1순위를 차지해왔던 이공계란 말도 사라져 버린 지 오래다. 과학기술 입국을 외치지만 대선에서도 이공계가 도전했던 기록은 역대 한 명뿐이다. 그분은 과학계의 태두 격이었으나 득표율은 불과 0.1%도 안됐다. 그만큼 과학계 인재에 대해서는 국민들의 관심이 없는 게 현실이다. 특정 직업집단이 국가 요직에서 과다 대표되는 것은 출신 다양성 분포에서 볼 때 바람직하지 않다. 법조계는 주로 과거 사건에 대해 법리적으로 반추하는 분야라 과거지향적인 특징이 있다. 반면 예를 들면 과학계는 미래를 보는 분야다. 법조계와는 정반대 성향을 갖는다. 헌법재판소도 예외지대는 아니다. 재판관 인적구성에 있어서 선진국처럼 비법률인에게도 문호를 개방하는 다양성이 필요하다는 의견이 꾸준히 나온 점을 참고할 만하다(한겨레 2009년 7월 12일자, 연합뉴스 2024년 12월 20일자). 앞으로 유권자들은 법조계 출신에 표를 행사하기 보다는 국회의원 중 비율이 가장 떨어지는 분야인 이공계 출신 후보에게 귀중한 한 표를 행사한다면 국가 미래를 위해 좋을 것이다. 한편 국내 과학계 자구 노력도 중요하다. 우리나라의 과학기술 단체로서는 과학기술단체총연합회(과총)가 있다. 그러나 주로 과학기술인의 친목 단체 성격으로서 미국의 과총과는 설립 취지부터 다르다. 미국 과총은 세계적으로 가장 저명한 학술지 중의 하나인 사이언스 저널을 출간하는 노력과 더불어 일반 대중과의 접점을 중시하며 정치권에 대한 선의의 압력 단체 역할을 하고 있다. 우리는 그런 국가 발전을 위한 압력 단체가 하나도 없는 실정이다. 법조계 출신들이 정계에서 비율이 크다는 점 하나만으로 문제가 되는 것은 아니지만 국회의원 대다수가 자신의 과오에 대해서도 권력을 이용하여 방어전을 지루하게 펼치는 관행은 지탄의 대상이 된다. 남에겐 관용이 없는 것도 법을 잘 알기 때문일 것이다. 법리에 강한 점이 국헌 준수와 거리가 멀다면 국가 지도층으로서는 큰 흠결이다. 논리적인 면에서 법조인에 못지않은 과학자라도 그렇게 행동할까. 크게 대비되는 점이다. 새 시대가 요구하는 이런 방향성에 대해 여야 전체에서 특히 알았으면 한다. 따라서 우리의 제1과제는 인물부터 교체하는 일이다. 여야는 보다 미래지향적인 인재들을 대거 영입하는 자세를 적극적으로 보여주어야 한다. 지난달 탄핵 의결 후 연일 쏟아지는 소식을 접하면 뭐가 진실이고 거짓인지 전혀 구별이 안된다. 아전인수 격으로 법적 권한에 대해 여야가 180도 다른 해석을 내리기 때문이다. 지금 시대는 디지털이다. 국가 행정 국방 법사 사회보장 교육도 모두 디지털로 가고 있다. 평시와 전시를 대비하기 위하여 행정망 국방망(북한 무인기) 같은 전산망이 그래서 구축되는 것이다. 그러나 최근 상기 국가 주요 2개 시스템이 오작동 내지 먹통 되는 사태가 발생하였다. 국가재난망 법원전산망 사회복지망 교육전산망과 같은 국가 주요 시스템에서도 최근 그런 사태가 발생했다. 이런 조직에서는 디지털 마인드를 가진 사람에게 중추 역할을 맡기는 게 중요하다. 어느 인적 시스템은 물론 어느 기계적 자동 시스템도 완벽한 것은 없다. 앞으로 전자동으로 선거 투개표가 시행되기 위해서는 시스템 업그레이드를 위해 선관위 수장의 디지털 마인드는 점검의 대상이다. 선관위 법 어느 조항에도 위원직을 특정 전문 분야에 국한하지는 않는다. 선진국에선 선관위 위원 임명 시 전문 분야 간 균형을 유지케 하는 관련 법 조항까지도 있는 것으로 알고 있다. 다른 헌법기관이나 행정부처에서도 디지털 시대에 걸맞게 전문분야 간 균형에 신경 써야 할 것이다. 문송천 필자 이력 ▷카이스트 경영대학원 교수 ▷미국 일리노이대(어바나 샴페인) 전산학 박사 ▷유럽IT학회 아시아 대표이사 ▷대한적십자사 친선홍보대사 ▷카이스트·케임브리지대·에든버러대 전산학과 교수
[문송천의 디지털 산책] 종전을 향해 가는 러시아 우크라이나 전쟁
러시아가 우크라이나를 정중앙에서 동서로 나누는 드니프로강 인근의 에너지 발전 인프라 시설을 중거리 탄도 미사일로 공격하여 전황이 고조되고 있다. 트럼프 대통령 당선자가 평소 가능한 한 전쟁을 조속히 끝내게 하겠다고 공언한 바 있어 교전 양측이 종전 임박을 예견한 가운데 러시아 측에서 이런 확전 강세를 두는 것은 아마도 종전 협상에서 유리한 고지를 차지하기 위한 것으로 보인다. 이번 전쟁 발발 직전 필자가 우크라이나를 방문하면서 느낀 첫 인상은 모스크바를 연상케 하는 분위기였다. 과거 오랜 역사의 공산권 러시아 지배로 인해 그런 듯했다. 잘살지 못하는 나라지만 유능한 컴퓨터 프로그래머들을 상당수 보유하고 있어 IT로 국가 경제를 키워 보기 위해 우크라이나는 노력을 해왔다. 우크라이나 남부 오데사에서 개최된 IT 학술대회 기조 강연자로 초청을 받아 우크라이나 땅에 발을 디뎠다. 러시아의 침공이 있기 불과 1년 전 일이다. 이때만 해도 아주 평화롭던 이 나라가 세계를 경악케 하는 화염 속에 휩싸일 줄은 그 당시는 아무도 몰랐다. 우크라이나는 유럽에서는 러시아에 이어 둘째로 국토 면적이 큰 대국이나 1인당 국민소득은 불과 4000달러 수준으로 유럽에서 가장 꼴찌 최빈국이다. 마치 30여 년 전 한국으로 생각하면 된다. 동남아시아로 치면 인도네시아 정도에도 못 미치는 수준이다. 주 산업은 농업이다. 좋은 땅과 기후 덕분에 미국, 태국과 더불어 세계 최대 곡창 지대 중 하나다. 그러나 큰 덩치에 비해 지난 1000년 동안 남의 지배만 받아온 약소국 신세를 지금까지 면치 못하고 있는 나라다. 1000년 전부터 몽골 지배를 받다가 16세기에 이르러서는 폴란드와 러시아의 연합 세력에 국가가 드니프로강을 중심으로 동과 서가 각기 분할돼 지배당했고 17세기에는 폴란드 통치 진영까지 러시아에 의해 지배당하면서 러시아 지배권에 들어가게 됐다. 그 당시부터 러시아인들은 우크라이나는 러시아의 일부이며 러시아와 우크라이나는 한 나라라는 의식이 싹트기 시작했다. 최근 러시아가 우크라니아를 침공하면서 푸틴 대통령이 우리는 하나라는 말을 뇌인 것으로 보면 그 발언의 역사적 배경이 17세기에서부터 비롯된 것임을 알 수 있다. 그리하여 한일합병 때처럼 우크라이나 언어 말살 정책으로 자국 언어를 구사하지 못하는 인구가 늘어났고 1922년에는 국가 전체가 스탈린 휘하의 소련 완전 지배 체제로 돌입했다. 그러다 1991년 소련 붕괴와 더불어 드디어 독립 국가로 재탄생했고 인구 구성 비율에서 러시아 출신이 20%에 달할 정도로 국가 정체성이 희석되는 현상이 나타났다. 우크라이나 재합병을 틈틈이 노리던 러시아가 2014년 크림반도를 침공함으로써 그 반도를 러시아 영토로 간단히 편입하면서 불안감이 감돌기 시작하더니 급기야는 러시아가 이번과 같은 대대적 침공을 전격 감행하기에 이른 것이다. 그러고는 장장 2년 6개월 동안 적국에 침략당하고 있다. 이런 역사의 소용돌이를 보면서 깨닫게 되는 것은 나라가 나라답게 독립하여 자생 능력을 갖추려면 우리도 한번 잘살아보자는 새마을 정신 같은 결기로 국민 전체가 한마음 한뜻으로 뭉쳐 나라의 기초를 건설해야 하는 것이다. 그래야 오늘날 대한민국처럼 훗날 창대한 열매를 거둘 수 있는 것이지 부정부패의 고리를 끊지 못하고 나라를 시궁창에 빠뜨리는 정치 풍토가 연속돼서는 오늘날 우크라이나 신세를 면치 못한다는 사실이다. 우크라이나가 한국처럼 한강의 기적을 경험하려면 우크라이나 정치인들의 분골쇄신 없이는 불가능하다. 우크라이나의 부정부패 지수는 창피할 정도로 아프리카 케냐와 동남아 필리핀 수준에 머무르고 있는 실정이다. 부정부패 지수로는 한국은 63점으로 중진국, 덴마크가 90점으로 선진국, 우크라이나는 33점으로 후진국, 해적이 들끓는 소말리아는 17점으로 최후진국이다. 북한 역시 17점이라는 사실도 시사해 주는 바가 많다. 부정부패의 고리를 끊지 않고는 다른 노력을 해봐야 아무 소용이 없다는 걸 알 수 있다. 우크라이나를 돌이켜보면 지난 400여 년간 러시아 지배의 그늘에서 자력 갱생할 기회가 무려 7번에 걸쳐 있었다. 그때마다 정치력 부재로 실기한 과거를 상기하면 통탄할 일이다. 전쟁 발발 후 국토의 20%를 러시아 측에 잃고 마는 곤경에 처하다가 이제는 그중 9% 정도만 수복한 상태다. 그래서 어찌 보면 난국을 스스로 자초한 것 아닌가 하는 견해가 존재하는 것도 이 때문이다. 사상 처음으로 유럽연합의 일원이 됨과 동시에 나토의 일원이 될 수 있는 호기를 맞고 있는 건 어떻게 보면 불행 중 다행이다. 이번에도 실기할 것인지 지켜봐야 할 일이지만 국제사회를 향해 과거의 우유부단한 정치력을 이제는 더 이상 보여줘서는 아니 될 것이다. 사실 이런 유형의 지리멸렬한 전쟁 양상은 과거에 본 적이 없다. 전쟁 발발 시작부터 매우 이상하다. 우크라이나가 전쟁에 사용할 무기를 다른 나라에서 전부 빌려 다 쓰고 있으니 말이다. 돌이켜보면 강대국들의 전략에 당한 신세다. 원래 우크라이나는 1994년 초까지는 미국, 러시아 다음으로 핵무기를 다량 보유하고 있던 군사 강대국이었다. 핵탄두 약 1700발과 ICBM 170기 이상을 보유한 세계 3위 핵보유국이었다. 그런데 1994년 말 부다페스트에서 미국, 영국, 러시아 3국 주도로 열린 유럽안보협력기구 회의에서 우크라이나는 핵확산금지조약에 서명하면서 핵무기를 완전히 포기하게 된다. 이때 우크라이나가 보유하고 있던 핵탄두와 미사일을 반환하면서 공교롭게도 그것들이 전부에 러시아에 넘어가게 된 것이다. 러시아에 넘기기 전에도 우크라이나는 핵무기 작전통제권을 자체적으로 갖고 있지 못했다. 핵무기가 물리적으로 우크라이나 영내에 있었지만 작전통제권은 러시아가 갖고 있었기 때문이다. 우크라이나가 핵무기를 러시아에 넘기고 핵확산금지조약에 가입하며 국제사회는 우크라이나의 현 국경에 대한 주권을 확인하며 우크라이나에 대한 공격에 유엔 안보리가 대처한다는 국제 조약이 1994년 12월 5일 부다페스트에서 벨라루스, 카자흐스탄, 우크라이나, 러시아, 미국, 영국이 서명함으로써 효력을 발휘하게 되었다. 우크라이나는 핵탄두와 ICBM을 전량 러시아로 반출해 폐기했다. 핵무기 전량을 러시아에 넘겨 비핵화를 완료한 것은 1996년 6월이다. 이후 우크라이나는 자국 원전에서 쓰는 우라늄 원료를 모두 러시아에서 수입하고 사용 후 핵연료도 러시아로 반출해 처리하고 있다. 1994년 우크라이나는 핵무기를 포기하는 대신 크림반도를 포함한 영토보전과 주권보장 경제적지원 등을 국제적으로 약속받았다. 이른바 부다페스트 조약이다. 하지만 이번 사태에서 조약에 서명한 미국 영국 등 서방국가들은 아무런 연합군 파병을 하지 않았다. 애초에 법적 구속력이 별로 없고 부다페스트조약에서 조차도 핵무기에 의한 공격이나 위협이 있을 때만 지원을 위해 안전보장위원회를 소집한다고 하였기에 서방세계가 군사적 지원을 하지 않아도 조약위반이 아닌 것으로 드러났다. 핵무장 포기는 우리의 역사적 실수였다는 것이라는 주장이 나온 것은 군사주권을 갖고 있지 못했던 우크라이나가 2014년에 이르러 크림반도를 러시아 측에 합병당하고 나서 나온 말이다. 2018년의 일이다. 그러면서 우크라이나 국방장관이 내놓은 성명은 이렇다. 우리에게 주어졌던 안전 보장 약속은 해당 각서의 종이 값만도 못할 정도로 믿어서는 안 되며 각국은 자신의 힘에만 의지해야 한다고 강조했다. 뒤늦은 깨달음이다. 그런 가운데 최근에 서방 미사일을 지원해주면 그걸 사용하여 러시아 본토를 공격하게 해 달라는 요청을 우크라이나가 미국과 영국에 하는 바람에 논란이 되고 있다. 이 무슨 역사의 장난이며 과연 누가 누구와 전쟁을 하고 있는 건지 헷갈리는 상황이다. 일국의 군사주권이 얼마나 중요한지를 가르쳐주는 좋은 대목이 아닐 수 없다. 우크라이나는 현재도 유럽 최대 우라늄 매장량을 자랑하며 또한 원자로를 17개 가동하고 있다. 그러나 이들 원자로에 대한 통제권이 러시아 측에 있다는 게 어떻게 말이 되는가. 우크라이나 국토 내 원전을 러시아 군이 아니라 우크라이나 군이 직접 공격하고 있다는 뉴스가 바로 그런 경우를 잘 설명해준다. 이번 사태를 통해 알 수 있는 교훈은 국제조약에 많은 허점이 있다는 점이다. 우크라이나만 예외가 아니며 어느 다른 국가도 그런 희생양이 될 수 있다는 점이다. 세계은행은 국가 재건 비용을 약 500조원으로 추산했다. 우리나라 1년치 국가예산에 버금가는 수준이다. 근 3년간 지리멸렬하게 끌어온 우크라이나 전쟁이 미국 트럼프 대통령 재선을 비롯한 국제 정세 변화로 2025년 새해에는 끝날 것으로 보고 있다. 우크라이나의 나토 가입이 가장 큰 핵심 쟁점으로 부각된 가운데 종전 조건 협상 줄다리기에 1년을 보내리라고 본다. 러시아는 우크라이나가 나토 가입을 추진하지 않을 것을 약속한다면 당장이라도 러시아 병력을 철수시키겠다고 밝힌 바 있다. 일단 양국 상호 간 에너지 시설 공격 중지에 관한 협상이 성공한다면 종전 분위기는 조성될 수 있을 것 같다. 종전 후 한국이 격동 30년을 통해 세계 10위권 자리를 잡은 한강의 기적을 보여줬듯이 침공당한 우크라이나가 드니프로강의 기적을 과연 세계 만방을 향해 보여줄지 기대되기도 한다. 그러기 위해서는 무엇보다 가장 필요한 것은 국가 지도층이 그들의 역사에서 부정부패를 과감히 척결하고 공의로운 길을 걸음으로써 국가를 견고하게 만들겠다는 비장한 각오를 결의하고 실천하는 일 것이다. 앞으로도 러시아를 대항할 그보다 더 좋은 무기는 없을 것이다. 문송천 필자 이력 ▷카이스트 경영대학원 교수 ▷미국 일리노이대(어바나 샴페인) 전산학 박사 ▷유럽IT학회 아시아 대표이사 ▷대한적십자사 친선홍보대사 ▷카이스트·케임브리지대·에든버러대 전산학과 교수
[문송천의 디지털 산책] SW 경시한 삼성전자 예고된 위기
전산학이 자연과학으로 분류된 적은 없었다. 그러나 전산 분야에서 노벨상을 석권하는 일이 최초로 올해 발생했다. 전산 분야 석학을 위시하여 우리가 잘 아는 알파고를 만든 소장파 전산 전문가들 총 5명이 자연과학 분야를 대변하는 물리학상과 화학상을 받았다. 실질적으로 싹 쓸었다는 표현이 어울릴 정도다. 수상자 중 물리·화학 전공 출신은 단 한 명도 없었다. 기이한 일이다. 이에 대해 자연과학계에서는 어떻게 생각할까. 물리학상 수상자인 힌튼 교수의 이력을 물리학계에서는 특히 주목하면서 물리학은 더 이상 존재하지 않는다는 자조적인 말까지 나온다. 순수 전산학자로서 AI의 위험성에 대해 1년 전 경종을 울려 전 세계적으로 널리 알려지긴 했지만 물리학을 전공하거나 주력으로 연구한 경력은 전무한 까닭이다. 물리학자라고 부를 수 없는 인물이 사계 최고봉의 상을 수상했으니 충격이 클 수밖에 없을 것이다. 그렇다면 여기서 두 가지 의문이 든다. 첫째는 자연과학을 전공한 적이 전혀 없는 이들이 자연과학 쪽을 넘봤을까 하는 의문이다. 학문 간 인접성 관점에서만 봐서는 이에 대한 답을 찾기는 불가능하다. 그러나 전산학자 입장에서는 이렇게 본다. IT 산업에서 매출액 기준으로 하드웨어(HW) 산업 대 소프트웨어(SW) 산업은 40대60이지만 컴퓨터 내부에서는 그게 20대80이다. 전산학과 교과과정에서도 SW과목이 HW과목보다 4배 더 많은 것은 그런 배경이 있다. 컴퓨터 기술이 컴퓨터가 아닌 타 분야와 융합하는 역할은 HW보다는 SW에 훨씬 더 의존한다. 융합이란 사실상 어느 한 주력 분야가 다른 인접 분야를 파고드는 과정이다. 그래서 SW가 발전하는 어느 상위 단계에 이르러서는 SW가 컴퓨터 기술이 여러 다양한 분야를 파고들 것으로 전산학계에서는 내다봤던 것이다. 이런 예측은 지금으로부터 30년 전에 이루어진 일로 기초과학 분야 역시 이런 융합에서 열외가 아니었음이 명확히 증명된 것이다. 힌튼은 영국 케임브리지대학 학부 전산학과 출신으로서 최종적으로 영국 에든버러대학에서 전산학 박사 학위를 취득했으며 또한 화학상 수상자 3명 모두 영국 케임브리지대학 학부 전산학과 출신이다. 그렇다면 두 번째 의문은 왜 유독 영국 대학에서 기초과학 분야 노벨상을 받을 정도로 자연과학을 꿰뚫는 인재를 동 시대에 배출할 수 있었을까 하는 점이다. 국내 대학 현실만 봐서는 이에 대한 답 역시 찾을 수 없다. 그러나 케임브리지대학과 에든버러대학 전산학과 교수 생활을 하여 영국 대학에 대해 잘 아는 필자로서는 이렇게 본다. 국내(한국)에서는 학부에서도 학생의 능력을 평가할 때 중등교육의 연장선상에서 거의 시험에 의존하지만 영국은 학부부터 대학원에 이르기까지 시험은 없이 실험과 실증에만 철저히 의존한다. 그런 실험 과제를 수행하려면 문헌조사가 필수다. 성적도 A·B와 같은 등급 평가가 아니고 문헌 내용을 얼마나 파악했는지 또한 그 내용을 자기 시각에서 재해석했는지를 정량화함으로써 성적을 평가한다. 창의적 분석 노력을 중시한다는 말이다. 성적은 100분위 기준으로 최소한 50을 넘겨야 한다. 60점 이상이면 우등 성적으로 분류한다. 60이면 한국에선 D 수준에 해당하는 것으로 잘못 오해할 수 있으나 영국의 성적 부여 체계는 그렇지 않다. 영국에서 60은 한국 대학으로 치면 B+ 내지 A-에 해당하는 성적이다. 우리처럼 시험 위주 교육과 시험 전 요점 정리해주는 방식으로 평가할 경우 시험장에서 창의성 있는 답안이 과연 실시간적으로 나올지는 의문이다. 학부를 졸업한 지 얼마 안 된 상태에서 우리를 놀라게 한 알파고를 만들었던 주역인 데미스 하사비스를 한번 살펴보자. 그는 케임브리지대 전산학과 재학 시절 학내 체스 동아리 회장을 지냈다. 알파고라는 컴퓨터 바둑 프로그램 코딩에 체스 실력이 분명히 응용됐음을 짐작하게 해주는 대목이다. 약관인 그가 바로 금년 노벨화학상을 수상했다. 바둑에 응용한 경험을 화학 분야 단백질 분석에 똑같이 그대로 적용한 결과였다. 화학을 전공해본 적이 전혀 없는 알파고 개발팀 동료 2명도 노벨화학상을 공동 수상하는 영예를 누렸다. 세계 대학 경쟁력 순위 평가에서 왜 영국 대학들이 상위 10위 내에 5개나 들어가 있는지 그 이유를 잘 대변해주는 대목이다. 창의력과 응용력에서 앞선 까닭이다. 창의적 훈련을 거치지 못한 학부 졸업생들에게 알파고급 창의적 제품을 개발하라고 요구하는 것은 무리다. 따라서 대학 경쟁력이 중요하다. 세계 10위 이내 대학에 영국 대학이 5개나 포함돼 있다고 하는 사실은 의미하는 바가 크다. 영국이란 작은 나라가 놀랍게도 무려 절반을 차지하고 있다. 그 이유는 오로지 창의적 교육 때문이다. 따라서 국내 대학 교육의 문제도 돌아보는 계기가 되어야 한다. 우리도 세계 10위 이내에 드는 대학이 나오려면 대학 교육이 바뀌어야 한다. 그러나 한줄기 서광은 비친다. 최근 전산학 랭킹에서 국내 대학 하나가 MIT(현 세계 13위)를 앞질렀기 때문이다. 세계 9위로 사상 최초로 10위 내에 진입했다. 전통적으로 한국의 MIT로 불려왔던 카이스트가 그 주인공이다. 그러던 MIT와의 관계를 역전시켰다고 하는 사실은 대단한 일이다. 미국컴퓨터학회 ACM의 랭킹 발표이기에 의미가 크다. ACM은 컴퓨터 분야 노벨상으로 불리는 튜링상을 제정한 학회로서 힌튼은 튜링상을 2018년에 받은 바 있다. 이번 수상에 대한 언론의 반응은 대체로 이렇다. 기초과학의 혁신은 한계에 봉착했으며 과학계의 연구방법을 전환시키는 계기가 전산학에 의해서 가능해지기 시작했다는 의견이 지배적이다. 과학 속에 숨어 있는 비밀을 앞으로는 IT기술이 아니고는 풀어내기 힘들 것이라는 해석과 과학의 경계선까지도 AI에 의해 허물어졌다고 하는 반응도 나온다. 그렇다면 기초과학이 설 땅이 완전히 사라졌단 말인가. 아니면 전산학이 기초과학을 대체할 것이라는 징조인가. 그러나 그렇지는 않다. 전산학의 영향력이 커진 것은 사실이지만 기초과학은 나름대로 원래의 위상이 있는 것이다. 연구 지평을 더 넓히지 못하는 자연과학계의 자체적 한계를 극복하게 해주는 역할을 전산학이 대신 도맡아서 해주었을 뿐이다. 따라서 이번 노벨상은 전산학의 이러한 파괴력에 관해 생각하게 해주는 독특한 기회가 아닐 수 없다. 그건 도대체 어디서 오는 것일까. 타 분야까지 침투할 수 있는 능력의 근원은 다름아닌 바로 SW에 있다. 경계나 장벽에 무관하게 어디든 파고들 수 있는 SW의 타고난 본성 때문이다. SW 하나로 새로운 단백질을 설계해내는 데 성공했으며 또한 단백질 구조를 빠르게 예측하는 알파폴드(이 알파도 알파고의 알파와 같이 구글을 지칭)라는 이름의 검색엔진 SW를 개발하여 적용한 것이 결정타였다. 그러니까 실상은 이런 SW가 노벨상을 받게 해준 원인 제공자였던 것이다. 인류가 어떤 성격의 거시적 도전에 직면할 것인지 미래를 내다보는 안목은 중요하다. SW는 이러한 인류 난제를 발굴하는 데에도 유용하게 쓰일 전망이다. 또한 난제 해법을 찾는 데에도 크게 기여할 전망이다. 이번 수상으로 돌이켜볼 일이 하나 있다. 창의성 부족에서 비롯되는 선진국과의 격차가 오늘날 삼성 위기와 난국을 불러일으켰기 때문이다. 기업에서는 위기 때마다 고질적 행정 관료적 문화를 타파할 리더십 부재가 원인이라는 지적이 등장하나 그건 이번 위기에 관해서는 잘못된 분석이다. HW 시대에는 위기가 닥쳐도 신경영 전략 하나만으로도 헤쳐 나가는 길이 가능했으나 SW는 다르다. SW 개발 능력이 없이도 설계와 생산이 가능했던 메모리반도체 기술체계에만 의존하다가 SW 역량이 필수인 비메모리반도체 쪽에 대응하는 데 실패하면서 벌어진 현상이라 그렇다. 삼성의 반도체 역사는 올해로 50년 됐다. 비메모리 시대 진입과 AI 시대를 대비하기 위해 적어도 30년 전부터 SW 쪽을 준비했어야 했건만 그냥 버텨 오기만 했다. SW는 공장에서 단숨에 찍어낼 수 있는 게 아니기 때문에 이번 위기는 오래갈 전망이다. 어디서든 SW 대 HW는 60대40 비중을 나타낸다. 반도체에서도 예외가 아니다. 기업도 그렇지만 정부도 지난 30년간 SW에 관해서는 포기해왔다. 국가 정책과 인선을 HW 일변도로 실행해 온 점도 그런 대목이다. 정부 발표에 의하면 AI 3대 강국에 들어가겠다고 한다. SW를 제대로 안 하면서 3대 강국에 들어가기는 불가능하다. 국내 언론계도 마찬가지로 어느 언론사에도 SW 담당 기자는 한 명도 없다. 반면 HW 반도체 취재팀은 넘칠 정도로 구성돼 있다. 영미는 다르다. 그들은 수십 년 전부터 SW 전문 기자를 두고 있다. 필자가 그들과 직접 인터뷰한 적이 25년 전 일이다. 이게 SW에 정면 대응하지 못하고 피해 다니는 우리의 불편한 진실이다. 돌이켜보면 전산학 역사는 올해로 꼭 80년 됐다. 영화 속에나 등장하던 계산하는 기계가 디지털 계산기의 형태로 1943년에 영국에서 제작되고 난 후로는 그만큼 된 것이다. 20년 후면 100주년이다. 즉 컴퓨터 역사 한 세기를 향하는 길목에서 전산학의 타 분야 침투가 본격화됐다고 보는 것이 적절할 것이다. 이제는 수상으로 심지어 자연과학 영역으로도 확대되고 있음을 알 수 있다. 더 나아가서 전산학은 종전의 기초과학 못지않은 연구의 기초를 제공할 수 있는 독특한 위치에 있다. 해당 분야에 필요한 검색엔진 SW를 알파폴드 격으로 특화하여 어느 분야를 위해서든 제작해 낼 수 있기 때문이다. 이런 검색엔진은 분야를 막론하고 예측의 정확도를 높이는 데 쓸모 있는 도구다. 따라서 SW 영향권 내에 들어올 분야는 점차 증가할 것이 분명하다. 물리·화학·생물로 대변되던 과학의 삼두 시대가 종말을 고했다는 평가가 기초과학계 내부에서 나온 점을 주목할 만하다. 그렇다면 전산학은 오늘날에 이르러 기초과학의 대열에 진입했다는 의미로 봐도 무리는 아닌 것이다. 그렇다면 과거 전통적 3대 기초과학 분야 계보를 이어 전산학이 제4의 기초과학으로서 자리매김할 날이 도래한 것이 아닐까. 문송천 필자 이력 ▷카이스트 경영대학원 교수 ▷미국 일리노이대(어바나 샴페인) 전산학 박사 ▷유럽IT학회 아시아 대표이사 ▷대한적십자사 친선홍보대사 ▷카이스트·케임브리지대·에든버러대 전산학과 교수
[문송천의 디지털 산책] 당신의 초상권은 안전하십니까?
기술이 발전하는데도 세상은 제자리인 것이 한두 가지가 아닐 것이다. 그중에 대표적인 것이 있다면 항공기와 선박 블랙박스다. 자동차는 현행 차내 블랙박스를 받아들인다고 치더라도 항공기와 선박은 일단 사고가 나면 망망대해 잔해 중 블랙박스를 수거하지 못하는 경우가 종종 보도된 일은 세월호 참사 등을 통해 누구나 잘 알 것이다. 인터넷 시대에 이는 참 어리석은 일이다. 선박이나 항공기 운항 데이터를 위성 인터넷 서버 데이터를 지상 서버에 실시간으로 전송하는 시스템이 갖춰져 있었다면 잔해를 찾지 않아도 얼마든지 사고 원인을 규명할 수 있기 때문이다. 규정 개정 미비로 인한 인간의 어리석음을 쉽게 알 수 있는 대목이다. 딥페이크에 대한 대처도 같은 맥락이다. 사진은 초상권이 달린 데이터다. 그래서 선진국에서는 입학원서나 입사원서에서 사진을 절대 요구하지 못한다. 사진을 제출하는 방식이 아니라 필요한 시점에 촬영한다. 따라서 사진 찍는 일은 입학 후나 입사 후에 벌어질 수 있는 일이다. 즉 학생증이나 사원증을 만들 때 발급 현장에서 사진을 찍는다. 초상권을 존중할 뿐만 아니라 사진에 대한 후속 관리를 학교나 직장이 하겠다는 의지가 담겨 있다. 하지만 우리는 온갖 신청 서류에 사진을 첨부하도록 요구하는 사례가 일상화돼 있다. 초상권에 대한 의식이 없는 까닭이다. 초상권은커녕 사진에 대한 사후 관리도 해 줄 자신이 없다는 뜻도 담겨 있다. 이렇게 관리가 안 된 사진이 딥페이크를 만드는 데 무분별하게 유통되고 있다. 이게 국내 현실이다. 사진을 재산권이 달린 데이터로 보지 않기 때문이다. 부동산과 자동차를 이렇게 허술하게 관리하지는 않는다. 이구동성으로 지금은 데이터 시대라고 한다. 어떤 데이터든 데이터가 가장 처음 만들어질 때 데이터에 데이터의 출처를 표시하도록 강제하기만 하면 정품 데이터인지 아니면 허위 데이터인지 쉽게 구분하는 일이 충분히 가능해진다. 인공지능(AI)이 대두되면서 AI가 데이터를 먹이로 사용하기 때문에 데이터 관리의 중요성은 날로 커지고 있다. 관리라 함은 데이터가 최초 생성될 때부터 세심하게 시작하는 것이다. 그다음으로 데이터가 가공되어 유통되는 과정에서도 데이터에 대한 관리는 마찬가지로 진행되어야 한다. 그러나 우리는 이런 준비가 전혀 안 돼 있다. 그렇다면 왜 이렇게 무감각한 것일까. 데이터를 다루는 태도가 시대 변화에 걸맞게 완전히 변해야 하는데 바뀔 생각 없이 말로만 데이터 시대 운운하기 때문이다. 데이터 시대를 접하면서 데이터를 상품으로 팔고 살 생각만 했지 데이터 권리에 대해 무관심해왔다. 우리나라는 특히 그렇다. 데이터 바우처 같은 예가 대표적이다. 데이터가 불러 일으킬 수 있는 문제를 규명하고 대책을 준비하기 전에 데이터 상품성에만 관심을 가졌다. 이는 다른 나라에서는 전혀 찾아보기 힘든 일이다. 선진국에서는 데이터 경제를 추구할 때도 상품성부터 고려하는 이런 식으로 하지 않는다. 그들은 산업 분야에서 서비스를 창의적으로 개선하기 위한 원재료로 보는 각도에서 데이터 경제를 다룬다. 우리와는 시작부터 다르다. 과학기술이 사회 어두운 구석을 밝히는 역할을 하는 데 있어서 기여할 바가 매우 큼에도 불구하고 행정이나 법조계에서 애써 외면하는 일이 되풀이되고 있는 것이 우리의 현실이다. 딥페이크에 관해 보도되는 내용을 봐도 법적 사후 조치로만 대응이 일관돼 있다. 기술로 완벽하게 사전 차단할 수 있는 길이 있는데도 알아볼 생각을 안 한다. 기술적으로 확실한 방법은 사진의 최초 소유자 아이디와 유포자 아이디를 실명화하여 아이디가 다를 경우 최초 소유자에게 유포 동의를 받았는지를 검증할 수 있도록 사진에 동의 티켓을 부착함으로써 가능하다. 이 경우 동의티켓을 함부로 날조하지 못하도록 해야 하는데 이 역시 기술적 장치를 동원하면 된다. 인터넷 시대에 데이터는 재산이다. 개인에게 속한 데이터면 데이터의 소유권은 개인에게 있다. 조직에 속한 것이면 데이터의 소유권은 조직에 있다. 남의 재산을 함부로 가져다 쓰는 일이 불법이듯이 마찬가지로 데이터를 함부로 가져다 써서는 아니 된다. 부동산이나 자동차가 소유권을 중시하는 재산이듯이 데이터 역시 그에 못지않은 재산으로 다뤄야 한다. 따라서 아무리 간단한 사진 도용도 선진국 법 규정으로 하면 대략 25만 달러 수준의 높은 벌금을 부과해야 한다. 청소년들이 딥페이크 제작 주범 역할을 하는 경우가 많은 것으로 보도되고 있고 딥페이크에 사용된 대부분의 사진이 연예인 사진이라고 보도되고 있는 점을 참고하면 딥페이크 제작을 시도하는 청소년이 25만 달러의 벌금 부과 사실을 알고도 제작을 감행하는 일은 없을 것이다. 성범죄를 근원적으로 차단하지는 못하더라도 성범죄 사고를 대폭 줄일 수 있는 지혜로운 방법은 탈출구를 제공해주거나 아니면 강공책으로 범죄 의도를 꺾는 길이 있다. 딥페이크에 대한 예방과 대처 역시 그런 각도에서 접근해야 할 사안이다. 사진에 대한 데이터 소유권 명시 기술이 채택된다면 거짓 거리 유포에 대한 생각을 애초부터 접을 것이다. 마치 블록체인이 채택된 곳에 해커들이 얼씬거리지 않듯이 말이다. 블록체인이 제대로 적용된 곳은 해커들 자신이 난공불락이라는 점을 누구보다 잘 알기 때문에 공격 의사를 포기하게 되는 까닭이다. 범죄를 예방하기 위해서는 범죄의 싹이 애초부터 트지 못하게 조치하는 것이 무엇보다 제일 중요한데 딥페이크에서도 그게 기술적으로 가능하다. 우리가 방법을 알면서도 시도조차 안 하는 게 실제로 많다. 항공기나 선박에서 인터넷 실시간 교신을 한다면 현행 블랙박스는 필요 없어짐은 물론이고 기껏해야 사건을 설명하는 보조 자료 정도에 지나지 않을 것이다. 그렇다면 왜 그렇게 하지 않는 것일까. 그것은 단순히 규정 때문이다. 인터넷을 이용해야 한다는 강제 규정이 없기 때문에 안 해도 되기 때문이다. 세월호 침몰 시고 때도 이런 규정은 없었고 지금도 여전히 없다. 문제를 막을 방법이 기술적으로 있는데도 행정과 규정이 전혀 발 빠르게 뒤따르지 못하기 때문에 벌어지는 일들이다. 이런 일의 근원은 사실상 과학기술자들이 사회 발전과 개혁을 위한 입법과 정책 수립에 투입되지 못하고 철저하리만큼 배제되는 까닭이다. 정부 위원회에 법 전문가와 행정 전문가가 필요하지만 21세기 기술 시대에는 과학기술자도 반드시 일정 비율로 반드시 포함되도록 규정을 반드시 개정해야 한다. 그러나 이게 과연 누구 손에 달려 있는가. 그래서 안 고쳐지는 것이다. 이제는 과학기술자를 적재적소에 등용할 줄 알아야 한다. 평소에는 문제가 수면 위로 잘 드러나지 않지만 큰 문제만 터졌다 하면 응급인력으로 과학기술 인력이 마치 밀물처럼 긴급 투입됐다가는 썰물처럼 빠져나가고 행정인력들은 언제 그랬냐는 듯 다시금 원위치하는 현실이 반복되니 말이다. 행정안전부뿐만 아니라 보건복지부, 교육부, 국방부 등 컴퓨터 정보시스템이 뿌리가 되어 돌아가는 시대임은 누구나 다 아는 사실이다. 그렇다면 부처마다 과학기술 인력들을 붙박이로 자리 잡게 함으로써 언제 터질지 모르는 화약고 문제 해결에 중추 역할을 하도록 변화의 물결을 불러일으켜야 한다. 과학기술 시대에 과학기술자로 하여금 이런 사회적 변화를 주도할 기회를 줄 수 있는 사람은 과연 누구일까. 아무나 내가 하겠다고 나선다고 될 일이 아니다. 사실 이런 변화를 주도할 사람은 극히 한정돼 있다. 우리나라의 경우는 대통령이라면 가능할 것이다. 과거 수십 년 전에도 국가 개혁에 장애가 되는 병폐를 대통령령으로 전격적으로 일거에 뚫고 나간 적이 있다. 아무리 꽉 틀어 막혀 있는 것 같이 보여도 그걸 뚫고 나갈 길은 있는 법이다. 그러나 능력과 권한을 다 줬는데도 허무하게 날려버리는 일이 종종 있다. 딥페이크 문제에 있어서도 대통령의 의지와 실천이 중요하다. 가해자 대부분이 10대 청소년이라는 사실을 보면 정부의 데이터권 도입 검토에 대한 발표만 있어도 허위 영상 제작 의도는 간단히 누를 수 있기 때문이다. 유해 콘텐츠 수익의 절반을 포털이 챙긴다는 실로 기가 막힌 현실을 보면 가해자와 의도적으로 공조하는 공범 아닌지 의심이 들 때가 많다. 정부나 국회도 효력 없는 뒷북 정책만 양산하고 있어 방관자 소리를 면하기 힘든 지경이다. 이는 딥페이크에 국한된 문제는 아니다. 과학기술 시대에 잘못 대처하는 게 한두 가지가 아니기 때문이다. 우리가 정신 똑바로 차리지 못하면 과학기술 시대에 승차하지 못하고 실기하는 일을 겪을 수 있다는 점을 다른 누구보다도 지도자층에서는 반드시 알아야 한다. 앞으로 딥페이크보다 더 큰 일들이 얼마든지 터지게 되어 있는 것이다. AI가 야기하는 딥페이크 같은 부작용에 변변치 않게 대처한다면 이는 인간이 편리하자고 만든 기계에 인간이 농락당하는 꼴이 되는 것 아니겠는가. 기계를 간단히 제어할 방법이 얼마든지 있는데도 불구하고 안 한다면 얼마나 어리석은 일인가. 21세기 데이터 시대에 선도국으로서 지위를 누리고자 한다면 디지털장전에 들어가는 핵심 내용으로서 '초상권을 제2의 재산권으로 다룰 것'이라는 의지를 천명해야 한다. 그것 하나만으로도 거짓 유포 가해자들은 한참 뒤로 물러나는 큰 효과를 거둘 수 있기 때문이다. 인터넷은 데이터를 날라 퍼뜨리는 공간이 된 지 오래다. 인터넷의 부작용에 선제 대응하기 위해서는 예전부터 데이터에 대한 의식을 바꿨어야 했다. 딥페이크 문제에서 그치지 않고 그냥 아무 것이나 데이터겠지 하면서 데이터를 소홀히 다뤄 온 관행도 이제는 바꾸는 계기가 되어야 할 것이다. 문송천 필자 이력 ▷카이스트 경영대학원 교수 ▷미국 일리노이대(어바나 샴페인) 전산학 박사 ▷유럽IT학회 아시아 대표이사 ▷대한적십자사 친선홍보대사 ▷카이스트·케임브리지대·에든버러대 전산학과 교수
[문송천의 디지털 산책] 인터넷 통제권은 여전히 이곳이 쥐고 있다
중국이 첨단 기술을 확보하지 못하도록 미국이 모든 조치를 취하고 있다는 표제의 보도가 종종 등장한다. 미국이 첨단 반도체를 비롯하여 이제는 소프트웨어까지 대중국 수출 규제를 강화하겠다는 뜻이다. 군사적 이유가 가장 크다. 그다음은 산업적 및 기술적 이유다. 그런데 그런 보도에서 눈여겨볼 대목은 규제의 주체가 미국 국방부나 국가안보부가 아니고 상무부라는 사실이다. 왜 상무부일까. 대중국 규제의 내용을 보면 미국 하원 세입소위원회 청문회에 출석한 미국 상무부 장관이 “중국이 첨단 기술을 확보하지 못하도록 필요한 조치를 하고 있다”는 말을 했다고 한다. 하원 세입위원회란 어떤 곳인가. 미국의 대외 공급 사슬 관리를 포함한 무역정책 및 자유무역협정 등 통상정책과 과세 정책을 담당하는 핵심 위원회로 규정되어 있다. 여기서 눈에 띄는 것은 ‘대외 공급 사슬’이란 단어다. 공급 사슬 업무는 본질적으로 원래 상무부 업무에 해당한다. 공급 사슬 관리 목적으로 미국이 반도체 지원금을 지원하는 국가 수는 중국을 제외한 `무려 11개로 파악된다. 아시아에서는 우리나라는 물론 대만, 일본, 말레이시아에 이어 베트남까지도 포함된다. 중국의 산업 첨단화를 규제하기 위한 목적으로 국제사회에 지원하는 것이기에 중국이 제외되는 것은 당연했다. 이 반도체 지원 정책이 의회에서는 하원 세입위원회 소관이며 정부 부처로는 다름아닌 상무부 소관이다. 그렇다면 미국 상무부는 무엇을 하는 곳일까. 알기 쉽게 결론부터 말하면 세계 인터넷에 대한 통제권을 갖고 있는 막강한 미국의 정부 부처다. 조금 의아해 할 사람들도 있겠으나 전후 사정을 자세히 살펴보면 이렇다. 상무부 홈 페이지를 보면 상무부의 역할은 '모든 공동체를 위해 경제적 성장과 기회를 추구하기 위한 조건들을 조성해준다'로 명시되어 있다. 또한 미국의 경쟁 우위를 도모하기 위한 혁신과 발명, 창조를 주도하고, 예를 들면 양자 컴퓨팅 기술과 인공지능(AI) 같은 첨단 분야를 주도할 뿐만 아니라 데이터 경제까지도 주도하는 주체로 정의되어 있다. 디지털 및 데이터부를 정부 부처로 따로 두고 있는 영국 같은 나라와는 달리 미국은 상무부가 디지털과 데이터 쪽까지 관장하는 것으로 되어 있다. 그증의 핵심은 단연 인터넷이다. 그걸 상무부가 직접 관장한다는 뜻이다. 많은 이들은 인터넷은 국제 공유재로 생각한다. 주인도 없이 마음껏 자유자재로 쓰게끔 누구에 의해선가 허용되어 있다고 추측한다. 그러나 과연 그럴까. 답은 아니다. 인터넷의 실권자는 1978년 이후로는 미국 상무부다. 지금도 여전히 그러하여 인터넷의 총체적 관할권은 전적으로 미국 상무부에 의존하고 있다. 상무부 내 관할 기구의 정확한 명칭은 국가 원격통신 및 정보 관리청이다. 이 기구는 국가 정부통신 정책 일체에 관해 대통령을 직접 자문하는 기구로 되어 있다. 인터넷이 탄생한 것은 1969년 10월이다. 그 당시는 미국 국방부가 인터넷의 주인이었다. 지금은 인터넷 사용자 수가 55억명에 이르고 있지만 1995년 기준으로 인터넷 사용자 수는 불과 1000만명 수준이었다. 1970년부터 1977년까지는 인터넷 사용자 수가 수십만 명으로 미국 국방부가 관할하다가 인터넷이 주로 학계 쪽에서 교수와 대학원생 위주로 사용되면서 관할권이 미국과학재단으로 넘어갔고 1980년대로 향하면서 인터넷 사용자 수가 수백만 명으로 늘어났다. 그러다 인터넷 인구가 1억명을 처음으로 돌파한 1998년 미국은 ICANN이라는 인터넷 주소 관리 목적의 비영리기구를 설립한다. 지금은 ICANN이 미국 정부에 의존하지 않는 형태의 독립 국제 기구로서 작동하고 있기는 하나 지금도 ICANN 본부가 미국에 위치하고 있는 만큼 미국의 입김이 여전히 강할 수밖에 없는 현실적 구조로 되어 있다는 점은 결코 누구도 부인할 수 없다. 그렇다고 한다면 미국 상무부가 인터넷 최상위 관리 권한을 여전히 쥐고 있다고 봐도 무방한 것이다. 전 세계 인터넷은 총 13개의 최상위 루트 서버로 관리된다. 일본에 1개, 네덜란드에 1개, 스웨덴에 1개를 제외하고는 나머지 10개는 전부 미국 본토에 위치해 있다. 이는 두말할 나위 없이 인터넷에서 미국의 절대적 위상을 잘 대변해주는 것이다. 인터넷상에서 벌어지는 일거수일투족을 미국은 한눈에 다 내려다보듯 샅샅이 알 수 있는 위치에 있다고 이해하면 된다. 코소보 사태 때나 리비아의 철권 독재자 카다피를 제거할 때, 빈 라덴 참수 작전 시 미국이 작전을 펼치기 전에 적국 내 인터넷 접속 기능을 사전에 차단한 다음 공격을 감행한 것을 보면 미국의 영향력을 짐작할 수 있을 것이다. 또한 과거 북한의 인터넷을 일주일간 차단한 일도 널리 잘 알려져 있는 사실이다. 미국의 영향력이 아니고서는 벌어지기 힘든 일이다. 따라서 오늘날에도 인터넷에 대한 통제권은 미국 상무부가 갖고 있다고 봐도 무방하다. 마치 유엔과 IMF 및 세계은행의 실권을 미국이 갖고 있듯이. 그러나 인터넷에 대한 통제를 미국이 자의적으로 하기에는 국제사회의 눈이 매섭다는 점도 미국은 잘 알고 있다. 또한 미국이 인터넷 통제권을 비합리적으로 행사하지는 않을 것이라는 기대감을 저버리기도 힘들다. 그러므로 미국은 인터넷 통제권을 사용하는 데 있어서 국제사회의 눈치를 의식하지 않을 수 없다. 반도체나 소프트웨어 수출 규제를 통해 적국을 견제하고자 하는 뜻은 실은 국가 안보에 있다. 미국산 반도체나 소프트웨어를 적국이 상업용으로 사용할 수 있지만 자칫하면 군사적으로도 미국 공격에 전용될 수도 있다고 보는 것이다. 미국이 축적한 방대한 자료를 학습한 생성AI 기술로 제작한 생화학 무기류를 동원한 공격 가능성을 배제할 수 없기 때문이다. 그래서 상무부는 중국이 첨단 기술을 확보하지 못하도록 필요한 모든 조치를 취하는 것으로 봐야 한다. 여태까지는 반도체에서만 대중국 수출을 엄격하게 통제해 왔지 오픈AI나 구글이 개발한 AI 모델에 대해선 따로 대외 수출 규제를 전혀 하지 않았다. 앞으로는 챗GTP 같은 AI 소프트웨어도 규제하겠다는 의도로 해석된다(로이터 2024년 5월 9일자). 그러고 보면 인터넷은 미국 국방부가 개발을 거쳐 탄생시킨 뒤 상무부가 유지·운영 중인 미국의 성공 작품이다. 위성항법장치 GPS 또한 마찬가지로 미국 우주항공국 NASA가 개발하여 민간 기업에 넘긴 기술로 성공 사례다. 개인적으로나 기업 운영을 위해 인터넷이, 또 자동차 항공기 선박 등에서 GPS가 전 세계적으로 편리하고 유용하게 사용되고 있으니 말이다. 그런데 면밀히 알고 보면 인터넷은 미국 고위공무원 두 명이 탄생시킨 것이다. 인터넷의 역사를 문헌상에서 보면 미국 캘리포니아 로스앤젤레스 UCLA 교수인 레오나드 클라인록 교수가 인터넷의 창시자로 등장한다. 학문적으로 보면 맞지만 인터넷이라는 개념을 원래 처음 착안한 사람은 미국 국방부 공무원 두 사람이었다. 대학에서 연구를 발의해서 연구비가 지원된 케이스가 아니라 정반대로 그 둘이 1966년 연구개발을 발의해 대학에 연구비를 제공한 끝에 3년 뒤인 1969년에 나온 게 인터넷이다. 그 공무원 이름은 조셉 릭라이더 그리고 로버트 테일러. 1969년 10월까지는 이 둘이 세계 문명을 바꿀 것이라고는 아무도 생각하지 못했다. 이 둘은 나중에 MIT 등에서 대학교수 생활을 하며 인터넷 개발 당시를 회고했다. 지금도 그런 동영상을 쉽게 검색해 볼 수 있다. 요즘 젊은이들이 짧은 영상에 매료되어 버스나 지하철에서 보고 있는데 인터넷 개발 주역의 인터뷰 영상을 한 번쯤은 봐야 하지 않을까. 인류의 선조들이 왜 언제 어떻게 인터넷 같은 것을 만들 수 있었는지 더욱이 그런 편리한 기술이 새로운 기술 개발 도전을 시도하는 학자나 수익을 도모하는 기업인의 머릿속에서 나온 것이 결코 아니라 공직자 머릿속에서 나왔다는 것에 대하여 깨달음이 있을 수 있지 않을까. 그렇다면 우리 공무원은 무엇을 하고 있는가. 세계 역사상에 상기 두 사람처럼 큰 족적을 남긴 자가 있는가. 봇물처럼 터져 나오는 각종 사건·사고를 처리하는 일에 공직 생활이 지나가고 있는가 아니면 인터넷 같은 꿈을 실현하기 위해 도전하고 있는가. 충격적이고도 신선한 해법을 동원하는 발상의 전환을 통해 행정망 마비 같은 문제도 해결 가능하건만 새로운 시도조차 해보지도 않은 채 사회 전반에 걸쳐 문제는 여전히 진행형 아닌가. 업계의 단순 땜질 처방을 통한 유지보수를 벗어나지 못하는 형국을 보면 더 이상 설명이 필요 없을 것이다. 인터넷은 탄생시키는 데 들어 간 돈은 3년간 불과 10억원. 지금으로 환산하면 500억원 이하 수준이다. 국내 정치권에서 수조 원을 허투루 소모하는 것을 감안하면 무척 대조적이다. 개혁이 더딘 것은 생각이 짧은 탓이지 예산 규모 문제가 결코 아닌 것이다. 문송천 필자 이력 ▷카이스트 경영대학원 교수 ▷미국 일리노이대(어바나 샴페인) 전산학 박사 ▷유럽IT학회 아시아 대표이사 ▷대한적십자사 친선홍보대사 ▷카이스트·케임브리지대·에든버러대 전산학과 교수
[문송천의 디지털 산책] 국가데이터통합지도 제작 콘트롤 타워는 어디인가
정보 시스템 결함에도 불구하고 정부가 무리하게 개통했다는 감사원 결과가 최근 나왔다(아주경제 2024년 7월 30일). 보건복지부 사회복지행정시스템 이야기다. 그로 인해 1900억원을 소요한 시스템이 실패했다. 줄곧 말썽을 부려온 행정망과 무관할 수도 있지만 정부 부처 시스템이라는 점에서는 시스템 설계 및 개발 접근 방법론에서 결코 무관하지 않은 일이다. 왜 이런 일이 자꾸 반복되는 것일까. 이율배반적이지만 2024년 1월 30일자에 나온 디지털 정부 평가에서 한국이 세계 1위를 차지했다. 디지털 하면 다름아닌 정보화의 동음이의어인데 지난 행정망 먹통 사태를 본 시민 입장에서 보면 앞뒤가 전혀 맞지 않는다는 의견을 갖는 이들이 주위에 많다. 이런 모순에 대해 행안부 평가 기준이 다르기 때문이라고 설명한다(조선일보 2024년 1월 31일자 제8면). 그렇다. OECD 5개 평가항목이 정부나 지자체가 자체 보유하고 있는 정보를 얼마나 대외적으로 시민들과 공유할 개방 의지가 있는가 보는 것 위주다. 데이터공개 평가항목 등이 그 예다. 이렇듯 국제기구에서는 정보공개 개방성에 초점을 둔다. 개방 의지에 대해서는 한국은 앞서 있지만 정부의 데이터 대 시민 데이터 서비스를 보는 학계의 시각은 다르다. 데이터의 품질에 더 관심을 둔다. 그것이 데이터의 진가를 나타내는 정량적 지표인 까닭이다. 이런 품질 요인을 고려하지 않은 것이 국제기구 평가의 한계다. 데이터의 품질은 데이터의 군살 빼기에서 시작한다. 필요 없는 것들은 완전 제거함으로써 데이터 비만도를 낮추는 것이 시스템의 질과 속도를 개선해주는 핵심이라는 점은 학계 정설이다. 마치 인체 비만도를 낮추는 것과 같이. 그러나 현장에서는 필요가 있든 없든 중복을 무분별하게 허용하는 게 관행처럼 돼있다. 학계에서 중시하는 불필요 데이터의 비율, 즉 데이터 중복률 수치까지 고려한다면 다른 평가 순위가 나올 가능성이 있다. 따라서 OECD 발표에 자족하지 말고 정부는 물론 업계는 부단히 데이터 품질 개선 노력을 펼쳐 나가야 할 것이다. 그게 데이터 품질을 특별히 강조하는 클라우드 시대에 맞는 자세다. 통합 데이터 설계도면(이하 데이터 맵)을 따로 유지 보수하지 않는 정부 및 업계 관행도 문제 중 하나다. 데이터와 코딩은 본래 물과 기름 격으로 다른 것임에도 불구하고 둘을 임의로 섞어 시스템을 구축하는 관행은 더 큰 문제다. 건물로 말하면 건축설계 청사진에 해당하는 것이 데이터고 시공에 해당하는 것이 코딩이다. 그런데 통합되지 않고 분산 단절된 시스템에 내재된 문제는 데이터맵이 따로 없고 맵 자체가 코딩 속에 섞여 혼재한 모습이라는 점이다. 분명한 데이터맵이 없다는 이야기는 데이터 설계조차 원론적으로 안 한 채 바로 시공에 들어갔다는 말이다. 따라서 시스템 튜닝을 하는 과정에서 코딩을 건드리면 본의 아니게 데이터 설계 부분까지도 건드리게 되는 화를 불러일으켜 데이터 오류를 유발할 수 있는 것이다. 실제로 이런 류의 잘못이 교육행정정보시스템에서 발생한 중대 오류, 즉 시험지 데이터를 검색했더니 엉뚱하게도 다른 학교 답안지 데이터를 출력하는 어처구니없는 경우가 발생했다. 행정망에서도 민원서류를 요청했더니 요청하지도 않은 다른 서류까지 출력됐다는 보도(전자신문)는 이런 류의 동종사고다. 만일 그런 식으로 오작동한 것이 사실이라면 문제 발생 과정 역추적 노력이 필요하다. 따라서 행정망 먹통 사태의 가장 유력한 단서는 첫째 바로 시스템 발주 컨트롤 타워 없이 분절된 시스템 개발 관행과 둘째 데이터맵 없이 성급하게 바로 코딩해버리고 마는 고질적 행태에서 유래했을 가능성이 유력하다. 2024년 1월 31일자에 나온 정부 디지털행정 장애 방지대책을 봐도 문제의 근원을 벗어난 지엽적인 것들 위주다. 데이터 품질에 대한 언급은 한마디도 없다. 그 대책의 요지는 이렇다. 앞으로 행안부 국가정보자원관리원(이하 국자원)이 중심이 되어 위험 징후 조기 판단과 시스템 안전성 진단 지원을 하겠다는 것이다. 그러나 이것은 국자원이 이미 해 오던 일이 아닌가. 대책에 따르면 시스템 유지보수 체계를 개편하고 소프트웨어 구축에 대기업 참여를 허용하겠다고 하나 이런 것만으로는 별로 달라지기를 기대하기 곤란하다. 왜 그런가. 행정망 먹통 사태의 원인에 대한 해석이 행안부 측과 학계 측이 판이하게 다르기 때문이다. 학계에서는 분절된 시스템을 문제의 고질적 근원으로 지적한다. 실국별로 발주된 시스템이 국자원 산하에 한두 개도 아니고 정부 발표에 의하면 무려 1만9000여 개(연합뉴스 2024년 4월 1일자)에 달할 정도로 방대하게 분산된 규모다. 한두 개가 아니란 말의 뜻은 1만9000여 개가 아니라 단지 한두 개만 나오게끔 애초부터 시스템을 대통합해 나갔어야 한다는 뜻이다. 시스템 발주 컨트롤 타워가 딴 곳 아닌 국자원일진대 이런 중차대한 의미를 갖는 일을 수행해야 할 것이다. 다른 부차적인 일보다도. 정부의 해법 중의 하나는 그간 금지돼왔던 대기업 참여를 전격 허용한다는 내용도 나온다. 그러나 대기업이 참여해도 크게 달라질 가능성이 없다. 다음 세 가지 관점에서다. 첫째 상기한 사회복지행정시스템에서 드러났듯이 대기업이 개발을 주도했음에도 시스템 먹통사태는 심각했다. 개통 당일에만 오류가 무려 10만건에 달했다. 서너건이라할지라도 많은 편인데 상상조차 힘든 일이 벌어졌다. 그 대기업은 문제해결을 위해 그후 많은 노력을 해왔으나 6개월이 지난 뒤에도 문제 해결 기미가 보이지 않았다. 정부의 압박이 강도 높은 상황에서 그 기업은 결국 사업 전체 포기를 선언하며 완전 철수했다. 이런 경우에 기업 프로젝트 개발팀은 책임 때문에 풍비박산 나는 게 보통이다. 그만 한 고급인력을 다시금 충원하기는 힘든 상황에서도 팀원 전체 보통 일괄 퇴사 조치 당한다. 프로젝트 규모는 1900억원 수준이었다. 보통 금융업계나 통신업계에서는 그 규모가 더 크다. 1조원 수준이다. 그러니 대기업 입장에서는 국가 사업에 이윤보고 들어가지 않는다는 뜻이다. 그렇다면 정부로서는 대기업 참여를 대폭 기대하기는 어려울 전망이다. 둘째 이번 행정망 오류도 그렇지만 대부분의 사고는 유지보수 과정에서 발생한다. 그런데 대기업이 개발을 주도할지라도 유지보수는 어차피 중소기업 몫이 될 가능성이 크다. 시스템 안정화를 위해 대기업 측에 유지보수를 2~3년간 강제한다고 해도 수익구조 상 결국 유지보수는 중소기업 손으로 넘어갈 수밖에 없다. 셋째 먹통사태의 주요 원인이 실상은 데이터와 코딩이 섞여 터지는 성격의 것들이라 이런 관행이 기업 규모에 무관하게 팽배해 있는 한 대기업이 참여해도 데이터 설계 품질 개선에 별 도움이 안될 것이라는 점이다. 따라서 앞으로는 시스템 개발이나 유지보수 시에도 참여 기업 규모보다는 데이터와 코딩을 절대로 섞지 않도록 강제하는 규정이 무엇보다 시급하다. 유지보수 체계를 개선하겠다는 국자원의 의지는 인정할 만하다. 그러나 유지보수도 이렇듯 데이터 통합 관점에서 접근하지 않고는 성공하기 힘들다. 따라서 국자원이 컨트롤 타워 역할에 충실하려면 다음 세 가지가 필수다. 첫째 앞으로는 발주 창구를 단일화하고 실국별 시스템 분절 발주를 근절해야 하며 창구는 국자원이 되어야 한다. 둘째 발주 창구 단일화에 그치지 말고 유지보수 창구 역시 단일화해야 하며 그 창구도 국자원이 직접 맡아야 한다. 셋째 금융권의 사례를 보면 시스템은 통상 이원화되어 단 두개의 시스템으로 통합되어 돌아간다. 국자원 산하에 흩어져있는 1만9000여 개의 시스템을 이처럼 단 두개로 줄여 가볍게 만들어야 한다. 부처간 데이터 중복이 존재하는데 이걸 제거해야 하기 때문이다. 교통 지도로 말하자면 전국도로교통지도를 한눈에 볼 수 있도록 만들어야 한다는 뜻이다. 큰 국가데이터지도 하나를 만든다고 생각하면 된다. 국가지도를 하나 만들어 놓고 부처별로 업무는 겹치지 않을 것이므로 국가지도 기반 프로그램은 부처별 및 지자체별로 제작하면 된다. 이를 위해서는 시스템 대통합이 필요하며 통합하는 방법론도 알아야 한다. 이런 통합은 해 본 경험이 없는 경우 엄두가 나지 않을 수 있다. 그러나 과거 성공사례들을 살펴보면 산발 분절된 시스템도 1년 넘지 않는 단기간 내에 단 하나로 통합 가능하다는 사례가 증명돼 있다. 기재부 금융정보분석원 시스템과 산업부 특허청 시스템이 그런 사례다. 행안부에서는 그런 사례를 참고해야 할 것이다. 시스템 통합에는 방법론이 엄연히 있다. 그런 세부적 방법론을 상기 모범사례는 물론 대구시 행정데이터통합 사례에서도 확인 가능하다. 국자원이 국가 데이터 인프라 설계 컨트롤 타워 역할을 하고자 한다면 이런 데이터 통합 문제를 확실히 다룰 데이터 전문가를 확보하고 있는지에 대해서도 자문해봐야 한다. 국가 정보 자원을 관리한다는 말 자체가 원래부터 잘못 제정된 것이기도 하다. 국가 데이터 자원이지 정보 자원이 아니기 때문이다. 정보는 그의 원료인 데이터를 가공하여 만들어지는 것이다. 데이터를 제2의 원유라고 부르듯이 정보 이전의 데이터가 진정한 자원인 까닭이다. CIA는 그 조직 역할을 잘 드러내듯이 중앙첩보국이다. 모든 첩보가 중앙에 집결된다는 의미다. 잘 지어진 이름이다. 우리나라 국가정보원도 따라서 국가첩보원으로 이름이 지어져야 어울린다. 이름의 적격성을 지적하는 이유는 어느 조직이든 본연의 역할에 충실한 임무를 수행해야지 다른 엉뚱한 임무를 수행하면 아니 된다는 뜻이다. 국가정보 관리라고 하면 국가데이터를 정작 관리해주는 곳이 국가 조직 상으로 다른 어느 곳에 별도로 있어야 한다는 뜻과 같아진다. 문송천 필자 이력 ▷카이스트 경영대학원 교수 ▷미국 일리노이대(어바나 샴페인) 전산학 박사 ▷유럽IT학회 아시아 대표이사 ▷대한적십자사 친선홍보대사 ▷카이스트·케임브리지대·에든버러대 전산학과 교수
[문송천의 디지털 산책] 반복되는 공직자 부정부패와 횡령 …불록체인이 사각지대 해소하나
디지털 기술은 지문보다도 더 강한 흔적을 남긴다. 개인 동선 취향 등 동태 파악에 중요한 단서를 누구의 먹잇감이 될는지도 모른 채 즉각 남기고 다니는 까닭이다. 그것도 영구적으로. 이 특성이 부인불가성을 가능케 해준다. 증거가 어딘가 남아 있기 때문에 훗날 결코 부정할 방법이 없다는 뜻이다. 따라서 영화 ‘태양은 가득히’에서와 같은 완전 범죄가 통하지 않는다. 디지털 포렌식으로 못 잡아내는 건 없다고 보면 된다. 사회에서 부정 부패를 없애 사회를 정화시키는 데 있어서는 디지털 순기능으로 작용한다. 블록체인 기술을 도입하면 투명성을 한층 더 증대시킬 수 있으나 블록체인이란 단어를 듣는 순간 왠지 모르게 가상화폐를 먼저 떠올리게 되면서 부정적 선입관이 작용하여 그런 좋은 기술을 일상 속에 받아들일 준비도 안 돼있는 편이다. 지자체들마다 앞다투다시피 하면서 현금 없는 버스 서비스를 디지털 전환 사례로 소개하면서 시범 서비스에 들어가 일부 시민들의 큰 반발을 사고 있다. 그러나 디지털 기술이란 사회 속에서 부정부패의 고리가 조성될 기미를 선제 차단하여 국가와 사회에 기여하는 바가 중대하며 거기엔 어느 누구의 반발도 있을 리 없다. 그러므로 공공 정책개발과 결정에는 그런 중대한 부분들을 발굴해내는 선제 노력이 필요하다. 좋은 후보의 하나가 가상화폐 코인 시장 쪽이다. 작년 이맘때 코인이 개입된 자금세탁 의혹을 불러일으킨 어느 공직자 사건은 별도 설명하지 않아도 누구나 알고 있을 것이다(경향신문 2024년 5월 12일자, 조선일보 5월 17일자). 우리나라 금융계 FBI 격인 금융정보분석원(FIU)에서 이상거래 색출 컴퓨터 시스템에 의해 기계적으로 자동 포착된 케이스가 그것이다. 참고로 그 시스템은 사람의 손을 거치지 않게 애초부터 설계돼 있다. 포착 후 혐의가 농후한 경우에 한해 검찰에 수사 요청하는 게 통례다. 자동 검출된 경우 10분의 1 정도가 검찰로 이관된다. 그 의원은 이 순서에 따라 검찰로 넘겨졌다. 그러나 이관 후 검찰이 지지부진한 행보를 보인 일은 불가사의 중 하나다. 또한 검찰 수사에 앞서 그 정도 규모의 사건이면 의혹 하나만으로도 당장 자신이 국민 앞에 직접 정치계 퇴장 기자회견을 자청해야만 할 일이었다. 영국과 미국에서는 그런 회견이 많다. 그러나 그 의원은 오히려 무슨 법을 어긴 게 있냐고 항변하며 의원실을 떠나 있더니 수개월 뒤 탈당에 들어갔고 최근에는 복당하는 일련의 행보를 보였다. 총선에서 야권이 승리한 까닭일까. 우리가 얼마나 정치 및 사법 후진성을 면치 못하고 있는지에 대해 더 이상 긴 설명이 필요 없는 대목이다. 바로 그 사건이 도화선이 되어 공직자 대상 가상자산거래 신고법이 여야 만장일치로 국회에서 통과되기에 이르렀다. 그런데 문제가 되는 것은 그 법에 빠져나갈 여지를 주는 허점이 한두 가지가 아니라는 점이다. 최근 몇 년간의 동태를 살펴보면 이렇다. 2024 총선 과정에서 여당 국민의힘은 가상자산에 대한 과세 시점을 가상자산기본법 시행 이후로 유예하자는 방침을 정했다. 당초 가상자산에 대한 과세는 2023년부터 시행됐어야 했지만 시스템 정비와 투자자 보호 제도 마련을 이유로 1년 미뤄졌고, 금융투자소득세 시행에 맞춘다며 더 유예돼 내년 2025년으로 연기된 상황이다. 2년 전 논의 때 국회 기획재정위원회에서도 과세 신뢰도와 형평성을 고려해야 한다면서 투기성 자금을 막고 투자위험을 줄이기 위해 조속한 과세가 필요하다고 밝혔으나 아직껏 그대로 지켜진 것은 하나도 없었다. 이렇듯 우리의 뒷북치기는 상상을 초월한다. 가상화폐 거래 규모가 큰 국회의원의 코인 거래 액수가 단기간에 1000억원이 넘을 정도로 추산됐음에도 불구하고 결국은 그대로 용인된 채 넘어갔다. 거래액수 차이가 있긴 하지만 역시 불법으로 코인 거래한 의원이 무려 12명이나 된다. 그들도 물론 현재 모두 면죄부를 받은 상태다. 놀라운 일이 아닐 수 없다. 영·미에서는 불가능한 이런 범죄행위가 어떻게 한국에서는 가능했을까. 단적으로 2018년 비트코인 광풍이 불 때 선진국처럼 그 당시 시차 없이 바로 입법 제정하지 않은 탓이다. 코인 광풍과 발맞춰 가상자산공직자신고법과 가상자산이용자보호법을 제정한 나라는 영·미뿐이 아니다. 일본과 싱가포르도 있다. 그들은 디지털 기술에 대한 이해가 앞서 그런 기술들을 입법에 적극 활용하여 완벽한 법을 갖추는 데 성공했다. 우리도 지체없이 전방위적으로 선제 입법을 통해 잠재적 부정 거래행위를 차단했더라면 소위 김치코인이라는 로컬 코인이 무분별하게 난립하는 일조차 없었을 것이다. 또한 국내거래소가 전 세계에서 코인가격 조작 독무대로 불명예 낙인이 찍히는 일도 없었을 것이다. 우리의 경우는 가상자산신고법 자체가 2022년 1월 이후 코인 거래에 대해서만 당국에 신고하게 돼있어 그 시점 이전 거래에 대해서는 실질적으로 눈감아주는 꼴이 된 게 가장 큰 한계다. 자금 세탁 의혹 당사자인 국회의원의 경우 대부분의 코인거래를 2021년과 그 이전에 종료한 것으로 드러나 그 의원을 포함한 다수 공직자의 과거 코인거래를 사실상 소급하여 묵인해준 결과가 됐다. 그런 법을 뒤늦게 도대체 뭣하러 만들었냐는 말이 그래서 나오는 것이다. 이 정도면 오히려 공직자 면죄부법이라고 불러야 마땅할 것이다. 이미 해외 검은 코인 세력의 놀이터로 변모한 국내 가상화폐거래소에서 코인 거래가 이루어질 때 가장 큰 손해를 볼 투자자는 작은 손, 즉 소위 개미들이 될 수 있다. 이런 가상자산 이용자를 보호하기 위한 가상자산이용자보호법도 역시 국회를 통과했지만 내년 7월에나 가서야 시행될 예정이라 코인 투기꾼들로 하여금 가상자산법 시행 전 제도의 시간상 공백을 노려 충분히 한탕 할 수 있는 여지를 주고 있다. 가상자산법의 또 다른 허점은 국내거래소와 해외거래소 간 코인 전송을 막을 방법이 실질적으로 없어 국내 시세 조작 세력이 해외 시세 조작 세력과 결탁하는 날에는 개미들의 피해가 눈덩이처럼 커질 수 있다는 것이다. 한탕 시나리오를 가능하게 해주는 허점은 군데군데 박혀 있다. 그런 교묘한 내막은 이렇다. 시세조작 세력이 코인 계정 몇 개만 가지고도 자기들끼리 코인을 사고파는 자전거래를 발생시켜 코인 가격 요동을 야기한 다음 가격 상승 틈을 타 코인 물량을 털어내면 코인 가격을 상당 수준으로 폭락시킬 수 있다. 이 다음 가격 최저점에서 싼값에 재매수한 다음 해외거래소로 전송하면 해외 현지에서 코인 가격 조작을 거쳐 다시 국내거래소로 코인 유입이 가능해진다. 그후 국내거래소에서는 또다시 검은 세력끼리 자전거래를 통해 다시 가격 급등에 이어 급락, 재매수, 해외거래소로 다시 전송할 수 있는 악성 사이클이 드디어 완성된다. 이런 사이클이 계획적으로 무한 반복해서 벌어지더라도 코인거래소나 코인 거래 감독 당국 입장에서 할 수 있는 일은 아무것도 없다. 고작해야 소수 계정에 의한 거래 집중과 이상 급등만 관망할 뿐 실제로 제동을 걸 방법과 권한이 전혀 없다. 더구나 해외 거래소에서 국내 거래소로 코인을 옮기는 데에는 상당한 시차가 존재하기 때문에 시세를 조작하는 시간 동안은 코인거래 감독당국이나 제3자에 의해 간섭 받을 확률도 낮아진다. 요약하면 모두가 선제 대응 안 했기 때문에 빚어지는 참사다. 이런 시세조작 검은 내막을 훤히 꿰뚫어 보는 이가 과연 몇이나 될까. 따라서 국민의 대표답게 머리 좋다는 국회의원들이 왜 선제 대응 안 했는지에 대해서도 의심 가는 정황이 사실 한두 가지가 아니다. 또 다른 디지털 기술 외곽지대 대표 중의 하나가 대선이나 총선 투표의 경우다. 우리나라의 투표 광경을 보면 투표 방식의 획일화가 두드러진 특징이다. 다양한 투표 방식을 허용하는 선진국과 매우 대조적인 부분이다. 우리는 투표 시 거동이 불편한 유권자에게 대해서도 반드시 투표장에 가지 않으면 투표권을 행사할 수 없게 돼있지만 선진국에서는 그렇지 않다. 배려의 차원이 다르다. 국내거주자라 할지라도 거동 불편자에 대해서도 마치 해외 주둔 군 인력 수준급에 해당하는 처우를 적용한다, 원격 우편 투표는 물론 이메일 투표까지도 허용하고 있다. 만일 우리나라에서 그런 식으로 한다면 과연 어떤 반응이 나올까. 그건 시기상조라 말도 안된다는 반응이 대부분이라면 한국 사회 투표 관행이 획일적인 사회주의 체제 국가 관행과 과연 어디서 어떻게 다르다는 것인지 곰곰이 생각해 볼만한 대목이다. 보안을 위해 이메일 투표에서 블록체인 기술을 적용하여 투표 신뢰도를 기하는 방법도 선진국 투표의 특징이다. 디지털 기술을 선택지 확대를 위해 적극적으로 활용하는 경우에 해당하는 것으로서 우리같이 현금 없는 버스 식으로 선택 폭을 축소화하는 방향과는 근본적으로 철학이 다른 것이다. 유권자가 됐든 탑승자가 됐든 우리가 결정적으로 부족한 부분은 디지털 기술과 관련된 배려 정신이다. 전자는 디지털 기술 활용의 사각지대, 후자는 역으로 디지털기술 남용의 사각지대에 해당한다. 우리가 선진국 따라가기도 바쁜데 생각의 속도와 유연성에서 차이가 난다면 선진국과의 거리는 그만큼 더 멀리 벌어지는 것 아닐까. 총선 결과 국회의원의 대다수가 법조인으로 채워졌다. 판사 검사 변호사 출신이 무려 61명에 달한다. 디지털 트렌드에 조예가 있는 이는 소수일 것이다. 정보기술 IT 전문가도 총선 결과 모두 7명에 불과하여 법조인 수의 10분 1 수준밖에 되지 않는다. 이래서는 입법을 주도하는 국회가 급변하는 IT 기술을 이해할 방법이 없고 따라서 영·미처럼 선제 대응할 방도도 없다. IT 전문가를 국회의원으로 적어도 30명 정도는 보유하고 있어야 뒷북치는 입법활동을 겨우 막을 수 있을 것이다. 향후에는 이에 대해 여야가 같은 생각을 갖고 특히 비례대표 인선에 임하지 않고는 전방위적 입법을 펼치는 선진국의 의정 철학을 따라가기 불가능할 것이다. 지금 같은 위성정당식 비례대표로는 어림도 없다. 문송천 필자 이력 ▷카이스트 경영대학원 교수 ▷미국 일리노이대(어바나 샴페인) 전산학 박사 ▷유럽IT학회 아시아 대표이사 ▷대한적십자사 친선홍보대사 ▷카이스트·케임브리지대·에든버러대 전산학과 교수