말뭉치란 언어 연구를 위해 텍스트를 컴퓨터가 읽을 수 있는 형태로 모아 놓은 언어 자료로 최근 인공지능 스피커가 음성인식을 하고 자동으로 답을 하는 기술 등에 활용될 수 있다.
소강춘 국립국어원장은 6일 서울 광화문 인근에서 기자들과 만나 “정부 예산 204억원을 투입해 내년 7억7000개의 말뭉치를 구축할 계획”이라며 “중소기업 등이 인공지능 개발 등에 가져다 활용할 수 있도록 저작권 문제도 해결하도록 할 것”이라고 말했다.
문체부는 앞으로 10년간 150억 어절의 말뭉치를 구축하는 중장기 계획을 마련했다.
국어원은 기존 21세기 세종 계획을 통해 3000만개의 말뭉치를 개발했으나 10년간 사업이 중단돼 왔다. 국어원은 말충치 구축을 위한 내년 예산 30억원을 신청했으나 정부가 기업 요구 등을 반영해 말뭉치 구축 사업에만 내년 204억원을 투입하기로 결정했다. 국어원의 연간 사업 예산 140억원을 뛰어넘는 대규모 예산 투입이다.
소 원장은 남북한의 언어 통일과 관련해서는 "표준어 규범이 달라 통일이 어렵지만 통합으로 방향을 바꿔 전문용어 차이를 담아 놓고 많이 쓰는 것을 표준어를 삼는 것이 실현 가능한 방안"이라며 "남북연락사무소를 통해 언어 통합 관련 논의를 시작하자고 제안할 예정"이라고 밝혔다.
소 원장은 "세종대왕은 백성을 사랑하는 마음에서 한글을 만들었는데 우리는 그 정신을 이어가고 있는가 고민을 하게 된다"며 "관공서의 공문부터 어려운 용어를 쓰고 있지 않은가 살펴봐야 한다"고 말하기도 했다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지