국립국어원 “10년간 150억개 어절 말뭉치 구축 추진”

기자정보, 기사등록일
이한선 기자
입력 2018-12-06 14:58
    도구모음
  • 글자크기 설정
  • 내년 204억원 투입 7억7000만 어절 구축 예정

소강춘 국립국어원장 [국립국어원]

국립국어원이 앞으로 10년간 150억개 어절의 말뭉치를 구축할 예정이다.

말뭉치란 언어 연구를 위해 텍스트를 컴퓨터가 읽을 수 있는 형태로 모아 놓은 언어 자료로 최근 인공지능 스피커가 음성인식을 하고 자동으로 답을 하는 기술 등에 활용될 수 있다.

소강춘 국립국어원장은 6일 서울 광화문 인근에서 기자들과 만나 “정부 예산 204억원을 투입해 내년 7억7000개의 말뭉치를 구축할 계획”이라며 “중소기업 등이 인공지능 개발 등에 가져다 활용할 수 있도록 저작권 문제도 해결하도록 할 것”이라고 말했다.

문체부는 앞으로 10년간 150억 어절의 말뭉치를 구축하는 중장기 계획을 마련했다.

미국이 3000억 어절, 중국이 300억에서 800억 어절, 일본이 150억 어절을 구축한 것에 비해서는 적지만 기본적인 수요는 충족할 수 있을 것으로 정부는 예상하고 있다. 정부는 우선 양을 확보해놓고 차후 정확성을 확보하는 방안을 추진할 계획이다.

국어원은 기존 21세기 세종 계획을 통해 3000만개의 말뭉치를 개발했으나 10년간 사업이 중단돼 왔다. 국어원은 말충치 구축을 위한 내년 예산 30억원을 신청했으나 정부가 기업 요구 등을 반영해 말뭉치 구축 사업에만 내년 204억원을 투입하기로 결정했다. 국어원의 연간 사업 예산 140억원을 뛰어넘는 대규모 예산 투입이다.

소 원장은 남북한의 언어 통일과 관련해서는 "표준어 규범이 달라 통일이 어렵지만 통합으로 방향을 바꿔 전문용어 차이를 담아 놓고 많이 쓰는 것을 표준어를 삼는 것이 실현 가능한 방안"이라며 "남북연락사무소를 통해 언어 통합 관련 논의를 시작하자고 제안할 예정"이라고 밝혔다.

소 원장은 "세종대왕은 백성을 사랑하는 마음에서 한글을 만들었는데 우리는 그 정신을 이어가고 있는가 고민을 하게 된다"며 "관공서의 공문부터 어려운 용어를 쓰고 있지 않은가 살펴봐야 한다"고 말하기도 했다.

©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지

컴패션_PC
0개의 댓글
0 / 300

로그인 후 댓글작성이 가능합니다.
로그인 하시겠습니까?

닫기

댓글을 삭제 하시겠습니까?

닫기

이미 참여하셨습니다.

닫기

이미 신고 접수한 게시물입니다.

닫기
신고사유
0 / 100
닫기

신고접수가 완료되었습니다. 담당자가 확인후 신속히 처리하도록 하겠습니다.

닫기

차단해제 하시겠습니까?

닫기

사용자 차단 시 현재 사용자의 게시물을 보실 수 없습니다.

닫기
실시간 인기
기사 이미지 확대 보기
닫기