최근 인공지능(AI) 학습데이터를 둘러싸고 AI 개발사에 대한 저작권 소송이 잇따르고 있다. 특히 뉴스 콘텐츠를 보유하고 있는 언론사들을 중심으로 저작권 침해 문제를 제기하고 있다. 뉴스가 AI 모델의 고도화를 위한 학습 데이터로 사용되면서다.
AI 개발사들은 이미 뉴스 콘텐츠를 AI 학습에 활용해왔고, 최근 AI 모델의 수익화가 실현됨에 따라 저작권 문제가 불거지고 있다. 이런 상황에서 오픈AI 등은 언론사와 계약을 맺어 합법적으로 뉴스 데이터를 활용하기 위한 라이선스 계약을 체결하기도 했다.
9일 업계에 따르면 캐나다 언론 5곳(토스타, 포스트미디어 네트워크 캐나다, 글로브앤드메일, 캐네디언프레스, CBC/라디오-캐나다) 등은 최근 캐나다 온타리오 고등법원에 오픈AI를 상대로 하는 손해배상 청구 소송을 제기했다. 오픈AI가 캐나다 언론사들의 콘텐츠를 대량 수집해 저작권을 침해하고 있다는 취지다. 앞서 미국에서는 뉴욕타임스(NYT) 등 매체들이 오픈AI를 상대로 비슷한 소송을 제기한 바 있다. NYT는 회사의 기사가 챗GPT 등 AI 챗봇 훈련에 무단으로 사용돼 수십억 달러 손해를 봤다고 주장했다.
이 같은 문제가 잇따르자 오픈AI 등 AI 개발사들이 직접 언론사와 라이선스 계약을 체결해 협력하는 사례도 늘고 있다. 오픈AI는 최근 월스트리트저널 등을 보유한 뉴스코퍼레이션과 향후 5년간 2억5000만 달러(약 3400억원)에 이르는 콘텐츠 라이선스 협약을 체결했다. 구글 역시 뉴스코프와 AI 콘텐츠 이용과 제품 개발을 위한 계약을 체결했고, 뉴스코프에 연간 500만~600만 달러(약 83억원)를 지급하기로 했다. 비용을 지불해 공식적으로 뉴스 콘텐츠를 이용하고 AI 기술 교육과 개발에 활용할 수 있게 된 것이다.
AI 개발사들이 뉴스 콘텐츠 확보에 나선 이유는 AI 개발에 있어서 뉴스가 양질의 데이터이기 때문이다. AI 모델을 고도화하려면 언론사와 상생 협력이 필요하다는 주장이 나온다.
이대희 고려대 법학전문대학원 교수는 "기존에 훈련받은 AI 모델에 최신 데이터를 지속적으로 학습시키지 않으면 할루시네이션(환각) 현상이 계속 나타날 수밖에 없다"면서 "뉴스 데이터는 이러한 문제를 해결하고 신뢰할 수 있는 정보를 제공하는 데 결정적 역할을 한다"고 말했다. 이어 그는 "오픈AI가 최근 언론사와 협력한 사례에서 알 수 있듯이 뉴스를 학습 데이터로 이용하는 것은 뉴스 저작권자인 언론사와 AI 개발사 모두에게 상생의 길"이라고 덧붙였다.
이런 가운데 국내 언론단체는 뉴스 콘텐츠에 대한 저작권 보호와 합리적인 대가 산정이 이루어져야 한다고 주장한다. 지난 3월 국내 6개 언론단체(한국기자협회·한국신문협회·한국방송협회·한국신문방송편집인협회·한국인터넷신문협회·한국온라인신문협회)는 언론계·산업계·학계 전문가 위원 32명으로 구성된 포럼을 발족했다. 포럼은 △법제도개선분과 △대가산정분과 △AI준칙제정분과로 나눠 관련 내용을 다루고 있으며 12월 중 포럼 종합보고서를 발간하는 등 국내 언론 저작권 보호를 위해 노력하고 있다.
뉴스 콘텐츠의 공정 이용 여부와 저작권법 개정, 대가 산정 등을 집중적으로 다룬다. 특히 외국과 달리 국내에서 뉴스 콘텐츠에 대한 저작권 보호가 취약하다는 입장이다. 국내에선 데이터의 공정 이용을 판단할 AI 저작권 소송이 제기된 사례가 없을뿐더러 저작권법 보호 대상에 뉴스 기사가 명시돼 있지 않아 뉴스 저작권자에게 불리하게 작용할 수 있다. 일례로 저작권법 제7조 5호에 사실의 전달에 불과한 시사보도를 보호받지 못하는 저작물로 명시하고 있는데, 이는 저작권 소송 발생 시 뉴스 저작권자에게 일방적으로 불리하게 작용할 수 있다.
이와 관련해 양진영 법무법인 민후 변호사는 "현재 네이버 뉴스콘텐츠 제휴 약관 규정은 새로운 서비스 개발 연구에 정보를 이용할 수 있다고 명시하고 있는데, 뉴스 서비스 이용의 범위와 활용을 모호하게 표현하고 있다"면서 "AI개발을 위한 뉴스 콘텐츠 이용 약관에는 뉴스 저작권자의 권리를 보호할 수 있는 합리적 기준들이 제시될 필요가 있다"고 강조했다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지