70여년 대한민국 교육사에서 처음 시행된 온라인 개학이 마무리 수순을 밟고 있다. 코로나19 확진자 수가 현저히 줄어들자 교육부는 오는 13일 고등학교 3학년을 시작으로 내달 1일까지 전국 초·중·고등학생의 오프라인 개학 일정을 발표했다. 온라인 개학은 말도 많고 탈도 많았다. 3월 31일 교육부가 온라인 개학을 발표하자 업계의 반응은 '과연 가능할까?'였다. EBS 온라인클래스, 한국교육학술정보원(KERIS) e학습터 등 공공 학습관리시스템(LMS)을 통한 온라인 개학이 4월 9~20일 단계적으로 실시되고, 약 600만명에 달하는 전국의 학생과 선생님이 한꺼번에 몰리자 접속 장애를 일으켰다. 하지만 두 공공 LMS는 두세 번의 장애 후 급격히 안정화됐다. 약 한 달 동안 진행된 온라인 개학 기간에 교육 자료를 제공하고 학생들의 교육 상황을 평가하는 온라인 교실이라는 본연의 임무를 수행해냈다.
성공적인 공공 LMS 구축과 운영 뒤에 국내외 IT 기업의 노력이 숨어 있다. 대표적인 국내(로컬) 클라우드 사업자인 네이버비즈니스플랫폼(NBP)과 전 세계 1위(인프라+소프트웨어 기준) 클라우드 사업자인 마이크로소프트(MS)가 한국 학생들의 학습권을 지키기 위해 발 벗고 나섰다. 두 회사는 e학습터(NBP)와 온라인클래스(MS)에 클라우드 인프라를 제공했을 뿐만 아니라, 온라인 개학 태스크포스(TF)에 합류해 공공 LMS 규모 확대를 위한 다양한 기술적 지원을 '무상'으로 제공했다. 온라인 개학을 남의 일이 아니라 "국가의 일, 학생의 일"로 여겼기 때문에 가능했던 대응이다. 온라인 개학을 앞두고 급박했던 30일간의 상황을 박기은 NBP 최고기술책임자(CTO)와 김영욱 한국마이크로소프트 공공사업부문 부장에게 들었다. [편집자주]
성공적인 공공 LMS 구축과 운영 뒤에 국내외 IT 기업의 노력이 숨어 있다. 대표적인 국내(로컬) 클라우드 사업자인 네이버비즈니스플랫폼(NBP)과 전 세계 1위(인프라+소프트웨어 기준) 클라우드 사업자인 마이크로소프트(MS)가 한국 학생들의 학습권을 지키기 위해 발 벗고 나섰다. 두 회사는 e학습터(NBP)와 온라인클래스(MS)에 클라우드 인프라를 제공했을 뿐만 아니라, 온라인 개학 태스크포스(TF)에 합류해 공공 LMS 규모 확대를 위한 다양한 기술적 지원을 '무상'으로 제공했다. 온라인 개학을 남의 일이 아니라 "국가의 일, 학생의 일"로 여겼기 때문에 가능했던 대응이다. 온라인 개학을 앞두고 급박했던 30일간의 상황을 박기은 NBP 최고기술책임자(CTO)와 김영욱 한국마이크로소프트 공공사업부문 부장에게 들었다. [편집자주]
![](https://image.ajunews.com/content/image/2020/05/05/20200505113800991800.png)
김영욱 한국마이크로소프트 공공사업부문 부장.[사진=한국마이크로소프트 제공]
Q. 한국MS가 온라인 개학을 위한 TF에 합류한 시기는?
한국MS가 온라인 개학 TF에 합류한 것은 3월 13일이다. EBS에서 연락이 왔다. 유비온에서 만든 EBS 온라인클래스가 온라인 개학을 감당할 만큼 최적화가 되어있지 않은 것 같으니 한국MS의 지원이 필요하다는 요청이었다. 이에 한국MS의 엔지니어들이 TF에 파견되었다.
온라인클래스는 MS의 클라우드 '애저' 위에 구축된 서비스이지만, EBS와 MS가 직접 계약을 맺은 것은 아니다. 유비온이 온라인클래스의 원형인 EBS의 소프트웨어 교육 플랫폼 '이솦'을 구축할 당시 애저를 인프라로 선택한 상황이었다.
Q. 온라인 개학을 위해 한국MS는 어떤 준비를 했나?
처음에는 TF의 누구도 온라인 개학이라는 상황을 예상치 못했다. 처음 온라인클래스의 목표는 대구·경북 지역 고등학생의 수업 공백을 온라인으로 지원하는 것이었다. 온라인클래스는 최대 3만명의 동시 접속자 수를 감당할 수 있도록 설계된 서비스였다. 이에 5만~6만명 정도의 접속자 수를 예측하고 2개의 온라인클래스를 만들었다.
하지만 교육부의 온라인 개학 계획이 공개된 후 TF는 급격히 바빠졌다. 1~3단계 온라인 개학에 맞춰 온라인클래스의 숫자를 2개에서 20개(1단계), 50개(2단계), 최종적으로 100개(3단계)로 확대했다. 이를 통해 온라인클래스는 20분 동안 150만명에 달하는 동시 접속자 수를 감당할 수 있는 서비스로 다시 태어났다. 보통 6개월이 걸리는 작업을 2주 만에 해낸 것이다.
단순히 서비스의 숫자만 늘린다고 해서 실제 서비스 규모가 확대되는 것은 아니다. 데이터베이스 규모도 함께 확대해야 한다. 그 과정에 한국MS가 강력하게 개입해서 필요한 작업을 수행했다.
4월 6일 한국MS는 광화문 사옥에 온라인 개학 지원을 위한 추가 TF를 구성했다. 한국 지사에서 20명의 의사결정권자와 엔지니어가 투입됐고, 시애틀 본사에서 CDN(콘텐츠 서버), MySQL(데이터베이스), 사이버 공격, 인프라 관리 등을 담당하는 10명의 엔지니어가 함께했다.
이들 10명의 본사 엔지니어는 서비스 오픈과 운영에 최적화된 MS 최고의 지원팀이다. 기업이 신규 온라인 게임을 오픈했을 때 100만명이 넘는 동시 접속자 수가 몰려 장애가 발생할 경우 이를 실시간으로 확인하고 해결하는 팀이다. 이들을 다른 서비스 지원에서 빼서 온라인클래스 지원에 투입했다. MS 본사가 한국의 온라인 개학을 얼마나 중요하게 생각했는지 알 수 있는 부분이다.
한국MS의 엔지니어들도 광화문과 서울 구로구 유비온 사무실에 설치된 TF를 오가며 온라인클래스 규모 확장과 오류 해결을 도왔다. 이들도 24시간 내내 MS 본사의 코어 엔지니어링팀과 연락하며 서비스 장애를 해결하는 전문인력이다. 정부나 기업의 요청을 새벽에도 해결할 수 있도록 5분 대기조 같은 삶을 살고 있다. 실제로 TF에서 0시에 퇴근하고 집에 와보니 엔지니어들로부터 연락이 와있었다. 이들과 새벽 1시에 1시간 동안 서비스 상태를 함께 점검하고 다음 날 대응 체계를 새로 짜기도 했다.
Q. 온라인 개학 당시 가장 아찔했던 순간은 언제인가?
1차 온라인 개학 당시 온라인클래스가 장애를 일으켜 서비스가 중단되었을 때가 가장 급박한 순간이었다. 서비스가 왜 정지되었는지 원인을 파악하는 것조차 힘들었다.
Q. 문제를 해결하기 위해 TF가 내놓은 해결책은?
클라우드 이용 시 가장 중요한 원칙은 서비스를 분산형으로 구성하는 것이다. 반면 온라인클래스는 분산이 제대로 되어 있지 않았다. 구조 자체를 바꾸기에는 시간이 너무나도 촉박해서 소프트웨어 전체를 한꺼번에 업데이트하는 방식으로 장애를 해결했다.
온라인클래스의 원형인 이솦은 처음부터 300만명에 달하는 대규모 이용자 수를 염두에 두고 만든 서비스가 아니었다. 때문에 온라인클래스로 변경하고 서비스 규모를 늘리면서 여기저기서 문제가 터져 나왔다. 원래 서비스 규모를 확장하려면 비공개와 공개 테스트를 거쳐 정식 서비스를 하는 것이 관례다. 반면 온라인클래스는 관련 절차를 거칠 시간이 부족해 일단 규모를 늘리고 터져 나오는 문제를 해결하는 급박한 대응을 할 수밖에 없었다.
온라인클래스에는 수업 자료의 용량을 400MB(메가바이트) 이상으로 할 수 없는 제한이 걸려있다. 이는 CDN에 몰리는 부하를 줄이기 위한 방책이었다. 또한 교육부는 선생님들에게 오전 9시부터 오후 6시까지 수업 자료 업로드를 자제하라는 공문을 보냈다. 이러한 노력으로 별다른 추가 대책 없이 CDN과 전체 네트워크에 부하를 주지 않고 온라인클래스를 운영할 수 있었다.
온라인클래스의 성능을 끌어올리기 위해 TF 내의 엔지니어들도 다양한 아이디어를 냈다. 예를 들어 온라인클래스에 접속한 학생들이 자신의 학교를 찾지 못하고 헤매면서 메인 페이지의 트래픽이 폭증하는 문제가 생기자 동영상뿐만 아니라 정적 데이터인 자바스크립트와 HTML도 CDN에 올리자는 아이디어가 나왔다. 메인 서버에 몰리는 트래픽을 CDN으로 분산하고, CDN이 IP주소를 가려주면서 보안성이 증가한 일석이조의 효과를 거뒀다.
또한 엔지니어들은 온라인클래스 규모 확장을 일일이 모니터링하면서 어느 정도로 클라우드 용량을 증설해야 적은 비용으로 최대의 효과를 거둘 수 있는지 찾아내 공공 LMS 운영에 필요한 데이터를 확보했다.
Q. 온라인 개학을 지원함으로써 MS가 얻은 것은?
무상으로 지원에 나섰기 때문에 관련 비용은 받지 못한다. 이지은 한국MS 신임 대표의 결단이 있었기 때문에 가능한 일이었다. '국가와 학생의 일'이며, 동시에 클라우드 업계에서 MS의 저력을 보여줄 기회라고 판단했다. MS 플랫폼 위에 서비스를 구축했으니 끝까지 책임을 져야 한다는 의무감도 있었다. 한국MS가 글로벌 기업의 한국지사가 아니라 한국 기업의 일원으로 국가의 어려움을 함께했다고 생각한다.
굳이 얻은 것이 있다면, 교육과 같은 공공 사업에서 글로벌 클라우드를 배제할 이유가 없음을 증명한 것이다. 온라인 개학의 성공을 위해 한국MS와 MS 본사가 합심해 최선의 지원을 나섰음을 정부와 교육계가 기억해주었으면 한다.
Q. 오프라인 개학 이후 온라인클래스는 어떻게 되는가?
늘려놓은 클라우드 서버를 조금씩 줄이는 작업은 이미 시작됐다. 운영 비용 절감을 위해 급격히 확장한 서버를 저용량 서버로 교체 중이다. 오프라인 TF 상황실도 정리했다 TF 구성원 간의 온라인 핫라인만 연결해서 운영 중이다. 다만 오프라인 개학을 하더라도 코로나19가 다시 확산되어 온라인 수업을 진행해야 할 수도 있으니 이에 대응하기 위한 방안도 TF 내에서 함께 찾고 있다.
한국MS가 온라인 개학 TF에 합류한 것은 3월 13일이다. EBS에서 연락이 왔다. 유비온에서 만든 EBS 온라인클래스가 온라인 개학을 감당할 만큼 최적화가 되어있지 않은 것 같으니 한국MS의 지원이 필요하다는 요청이었다. 이에 한국MS의 엔지니어들이 TF에 파견되었다.
온라인클래스는 MS의 클라우드 '애저' 위에 구축된 서비스이지만, EBS와 MS가 직접 계약을 맺은 것은 아니다. 유비온이 온라인클래스의 원형인 EBS의 소프트웨어 교육 플랫폼 '이솦'을 구축할 당시 애저를 인프라로 선택한 상황이었다.
Q. 온라인 개학을 위해 한국MS는 어떤 준비를 했나?
처음에는 TF의 누구도 온라인 개학이라는 상황을 예상치 못했다. 처음 온라인클래스의 목표는 대구·경북 지역 고등학생의 수업 공백을 온라인으로 지원하는 것이었다. 온라인클래스는 최대 3만명의 동시 접속자 수를 감당할 수 있도록 설계된 서비스였다. 이에 5만~6만명 정도의 접속자 수를 예측하고 2개의 온라인클래스를 만들었다.
하지만 교육부의 온라인 개학 계획이 공개된 후 TF는 급격히 바빠졌다. 1~3단계 온라인 개학에 맞춰 온라인클래스의 숫자를 2개에서 20개(1단계), 50개(2단계), 최종적으로 100개(3단계)로 확대했다. 이를 통해 온라인클래스는 20분 동안 150만명에 달하는 동시 접속자 수를 감당할 수 있는 서비스로 다시 태어났다. 보통 6개월이 걸리는 작업을 2주 만에 해낸 것이다.
단순히 서비스의 숫자만 늘린다고 해서 실제 서비스 규모가 확대되는 것은 아니다. 데이터베이스 규모도 함께 확대해야 한다. 그 과정에 한국MS가 강력하게 개입해서 필요한 작업을 수행했다.
4월 6일 한국MS는 광화문 사옥에 온라인 개학 지원을 위한 추가 TF를 구성했다. 한국 지사에서 20명의 의사결정권자와 엔지니어가 투입됐고, 시애틀 본사에서 CDN(콘텐츠 서버), MySQL(데이터베이스), 사이버 공격, 인프라 관리 등을 담당하는 10명의 엔지니어가 함께했다.
이들 10명의 본사 엔지니어는 서비스 오픈과 운영에 최적화된 MS 최고의 지원팀이다. 기업이 신규 온라인 게임을 오픈했을 때 100만명이 넘는 동시 접속자 수가 몰려 장애가 발생할 경우 이를 실시간으로 확인하고 해결하는 팀이다. 이들을 다른 서비스 지원에서 빼서 온라인클래스 지원에 투입했다. MS 본사가 한국의 온라인 개학을 얼마나 중요하게 생각했는지 알 수 있는 부분이다.
한국MS의 엔지니어들도 광화문과 서울 구로구 유비온 사무실에 설치된 TF를 오가며 온라인클래스 규모 확장과 오류 해결을 도왔다. 이들도 24시간 내내 MS 본사의 코어 엔지니어링팀과 연락하며 서비스 장애를 해결하는 전문인력이다. 정부나 기업의 요청을 새벽에도 해결할 수 있도록 5분 대기조 같은 삶을 살고 있다. 실제로 TF에서 0시에 퇴근하고 집에 와보니 엔지니어들로부터 연락이 와있었다. 이들과 새벽 1시에 1시간 동안 서비스 상태를 함께 점검하고 다음 날 대응 체계를 새로 짜기도 했다.
Q. 온라인 개학 당시 가장 아찔했던 순간은 언제인가?
1차 온라인 개학 당시 온라인클래스가 장애를 일으켜 서비스가 중단되었을 때가 가장 급박한 순간이었다. 서비스가 왜 정지되었는지 원인을 파악하는 것조차 힘들었다.
Q. 문제를 해결하기 위해 TF가 내놓은 해결책은?
클라우드 이용 시 가장 중요한 원칙은 서비스를 분산형으로 구성하는 것이다. 반면 온라인클래스는 분산이 제대로 되어 있지 않았다. 구조 자체를 바꾸기에는 시간이 너무나도 촉박해서 소프트웨어 전체를 한꺼번에 업데이트하는 방식으로 장애를 해결했다.
온라인클래스의 원형인 이솦은 처음부터 300만명에 달하는 대규모 이용자 수를 염두에 두고 만든 서비스가 아니었다. 때문에 온라인클래스로 변경하고 서비스 규모를 늘리면서 여기저기서 문제가 터져 나왔다. 원래 서비스 규모를 확장하려면 비공개와 공개 테스트를 거쳐 정식 서비스를 하는 것이 관례다. 반면 온라인클래스는 관련 절차를 거칠 시간이 부족해 일단 규모를 늘리고 터져 나오는 문제를 해결하는 급박한 대응을 할 수밖에 없었다.
온라인클래스에는 수업 자료의 용량을 400MB(메가바이트) 이상으로 할 수 없는 제한이 걸려있다. 이는 CDN에 몰리는 부하를 줄이기 위한 방책이었다. 또한 교육부는 선생님들에게 오전 9시부터 오후 6시까지 수업 자료 업로드를 자제하라는 공문을 보냈다. 이러한 노력으로 별다른 추가 대책 없이 CDN과 전체 네트워크에 부하를 주지 않고 온라인클래스를 운영할 수 있었다.
온라인클래스의 성능을 끌어올리기 위해 TF 내의 엔지니어들도 다양한 아이디어를 냈다. 예를 들어 온라인클래스에 접속한 학생들이 자신의 학교를 찾지 못하고 헤매면서 메인 페이지의 트래픽이 폭증하는 문제가 생기자 동영상뿐만 아니라 정적 데이터인 자바스크립트와 HTML도 CDN에 올리자는 아이디어가 나왔다. 메인 서버에 몰리는 트래픽을 CDN으로 분산하고, CDN이 IP주소를 가려주면서 보안성이 증가한 일석이조의 효과를 거뒀다.
또한 엔지니어들은 온라인클래스 규모 확장을 일일이 모니터링하면서 어느 정도로 클라우드 용량을 증설해야 적은 비용으로 최대의 효과를 거둘 수 있는지 찾아내 공공 LMS 운영에 필요한 데이터를 확보했다.
Q. 온라인 개학을 지원함으로써 MS가 얻은 것은?
무상으로 지원에 나섰기 때문에 관련 비용은 받지 못한다. 이지은 한국MS 신임 대표의 결단이 있었기 때문에 가능한 일이었다. '국가와 학생의 일'이며, 동시에 클라우드 업계에서 MS의 저력을 보여줄 기회라고 판단했다. MS 플랫폼 위에 서비스를 구축했으니 끝까지 책임을 져야 한다는 의무감도 있었다. 한국MS가 글로벌 기업의 한국지사가 아니라 한국 기업의 일원으로 국가의 어려움을 함께했다고 생각한다.
굳이 얻은 것이 있다면, 교육과 같은 공공 사업에서 글로벌 클라우드를 배제할 이유가 없음을 증명한 것이다. 온라인 개학의 성공을 위해 한국MS와 MS 본사가 합심해 최선의 지원을 나섰음을 정부와 교육계가 기억해주었으면 한다.
Q. 오프라인 개학 이후 온라인클래스는 어떻게 되는가?
늘려놓은 클라우드 서버를 조금씩 줄이는 작업은 이미 시작됐다. 운영 비용 절감을 위해 급격히 확장한 서버를 저용량 서버로 교체 중이다. 오프라인 TF 상황실도 정리했다 TF 구성원 간의 온라인 핫라인만 연결해서 운영 중이다. 다만 오프라인 개학을 하더라도 코로나19가 다시 확산되어 온라인 수업을 진행해야 할 수도 있으니 이에 대응하기 위한 방안도 TF 내에서 함께 찾고 있다.
![](https://image.ajunews.com/content/image/2020/05/05/20200505195101639808.jpg)
[사진=아주경제 그래픽팀]
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지