
올해 초 미국을 대표하는 래퍼 에미넴의 한 뮤직비디오가 온라인을 뜨겁게 달궜다. 뮤직비디오의 제목은 ‘푸틴의 몰락: 독재자의 죽음’(FALL OF PUTIN: The DEATH of a DICTATOR). 이 영상은 공개 직후 우크라이나 등으로부터 폭발적인 반응을 일으키며 단 2주 만에 조회수 42만1000회를 기록했다. 6일 기준, 조회수는 66만회를 넘어섰다.
영상에는 에미넴이 우크라이나인들과 시위에 나가는 모습, 블라디미르 푸틴 러시아 대통령을 닮은 남성을 심문하는 모습 등이 담겨있다. 이 영상 속 목소리는 에미넴의 진짜 목소리와 판박이지만, 인공지능(AI)으로 만든 가짜다. 에미넴의 팬으로 알려진 유튜버 릴 바이트(Lil Byte)가 만든 패러디 영상.
에미넴의 목소리를 활용하는 아티스트는 많다. 프랑스 출신의 세계적인 DJ이자 프로듀서인 다비드 게타(David Guetta)는 2023년 AI 기술을 이용해 에미넴의 목소리와 똑같은 곡을 만들어 공연에서 선보였다. 그의 팬들은 열광했지만, 저작권 논란을 불러일으켰다.
이러한 ‘에미넴 흉내 내기’는 더 쉬워지고, 더 활발해질 것이란 게 대체적인 평가다. 진짜와 구별하기 어려운 수준의 ‘AI 클론 래퍼’들이 늘어날 것이란 관측이다.

최근에는 목소리를 150개의 캐릭터 음성으로 바꿀 수 있는 AI 서비스까지 등장했다. AI 오디오 기업 수퍼톤이 선보인 ‘수퍼톤 플레이’에서는 텍스트만 입력하면 개성이 넘치는 무수한 음성이 즉석에서 생성된다. 발화 스타일은 물론이고 감성 정보까지 AI가 학습하기 때문에 한층 자연스러운 음성을 생성할 수 있다. 남성의 목소리가 여성, 아이, 노인 등 다양한 캐릭터로 변신할 수 있는 것이다.
기술 업계에서는 앞으로 ‘멀티모달 생성형 AI 엔진’의 시대가 올 것으로 예측했다. 텍스트를 입력하면, 영상, 음악, 가사, 보이스 등 뮤직비디오 같은 영상이 뚝딱 만들어질 것이란 시각이다. 이성욱 버시스 대표는 “‘멀티모달 생성형 AI 엔진’은 여러 미디어를 동시에 생성하는 기술”이라며 “진정한 1인 미디어가 가능해질 것”이라고 말했다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지