구글, 아마존에 이어 마이크로소프트도 자체 인공지능(AI) 반도체 개발에 뛰어들며 '지속가능한 AI' 전략을 힘 있게 추진한다. KT클라우드, 리벨리온 등 국내 클라우드·AI 반도체 기업도 차세대 반도체 로드맵을 공개하며 지속가능한 AI와 '탈(脫) 엔비디아' 기조에 속도를 내고 있다.
18일(현지시간) 미국 IT 매체 디인포메이션은 두 명의 업계 관계자를 인용해 "마이크로소프트가 자체 AI 반도체 '아테나'를 개발하고 이를 챗GPT를 포함한 초거대 언어모델(LLM) 학습과 추론(실행)에 사용할 계획"이라고 보도했다.
아테나 개발은 지난 2019년부터 시작됐으며 현재 TSMC 5nm(나노미터) 공정에서 샘플 칩셋이 제작되어 마이크로소프트에 전달됐다. 일부 마이크로소프트 직원들은 해당 AI 반도체를 AI 모델 개발에 시험적으로 사용하고 있다.
디인포메이션에 따르면 마이크로소프트는 아테나가 엔비디아에서 구매한 AI 반도체보다 더 높은 전력대성능비(TDP)를 내고, 초거대 AI로 인해 촉발된 AI 반도체 수급 문제를 해결하는 데 도움이 될 것으로 기대하고 있다. 미국 반도체 전문가들에게 자문을 구한 결과 아테나는 엔비디아 AI 반도체 대비 도입·운영 비용을 최대 3분의 1 수준으로 낮출 수 있을 것으로 기대된다.
마이크로소프트는 빙을 시작으로 마이크로소프트365(오피스), 깃허브 등 자사 모든 앱과 서비스에 GPT-4 기반 초거대 AI를 적용할 계획인데, 이때 엔비디아 AI 반도체만 활용할 경우 서비스 운영에 수십억 달러의 막대한 비용이 필요할 전망이다. 때문에 AI 운영 비용 감축을 위해 자체 개발한 AI 반도체 상용화에 속도를 낸 것으로 풀이된다고 디인포메이션 측은 보도했다.
마이크로소프트가 자사 클라우드 서비스인 '애저'로 아테나를 외부 기업에 공개할지는 미정이다. 경쟁사인 구글클라우드는 'TPU(텐서플로유닛)', 아마존웹서비스는 '인퍼런시아'라는 자체 AI 반도체를 개발해 클라우드를 통해 외부 기업에 공개한 상황이다. 페이스북도 엔비디아 일변도에서 벗어나기 위해 자체 AI 반도체 개발에 속도를 내고 있다.
얼마 전 방한해 국회를 찾은 브래드 스미스 마이크로소프트 부회장은 "초거대 AI 개발에는 큰 비용이 수반된다. AI는 엄청나게 자본집약적인 산업"이라며 "오픈AI의 챗GPT는 마이크로소프트가 미국 중부 아이오와주에 구축한 클라우드 AI 반도체(GPU)팜에서 운영된다"고 밝힌 바 있다.
스미스 부회장은 이어 기업과 정부가 초거대 AI로 인한 막대한 데이터센터 전력 소모를 해소할 방법을 찾고 지속가능한 AI를 만들어야 한다고 강조했다. 그는 "AI 학습·추론을 위해 각국 데이터센터 규모는 앞으로 더 커질 수밖에 없고 최선의 노력을 기울여도 더 많은 전기를 소비하는 것을 피할 수 없다"며 "원자력·태양력·풍력 등 신재생에너지 활용 방안에 대해 더 많이 고민해야 한다"고 말했다.
AI 반도체가 지속가능한 AI 환경을 조성하려는 마이크로소프트의 노력의 일환임을 암시한 것이다.
◆"초거대 AI는 돈 먹는 하마"...AI 반도체는 선택 아닌 필수
KT클라우드, NHN클라우드, 네이버클라우드 등 국내 클라우드 업체도 AI 반도체 업체와 협력하거나 자체 AI 반도체를 개발하는 형태로 지속가능한 AI 환경 만들기에 힘을 보탠다.
윤동식 KT클라우드 대표는 18일 열린 KT클라우드 서밋 2023 행사에서 기자들과 만나 "AI 모델 학습·추론에 천문학적인 운영비(전기료)가 필요하다. 탄소중립이라는 전 세계적인 추세에 반한다"고 지적하며 "AI 운영 비용에 대한 고민이 큰 기업을 위해 KT가 투자한 리벨리온의 AI 반도체 '아톰'도 KT클라우드에서 제공할 것"이라고 밝혔다.
윤 대표는 "빠르면 5월부터 아톰을 클라우드로 제공할 수 있을 것"이라며 "아톰은 엔비디아 AI 반도체 'A100' 대비 전력대성능비(TDP)가 5분의 1 수준에 불과하면서 더 우수한 AI 모델 추론 성능을 낸다. KT클라우드도 인프라 최적화를 좀 더 진행하면 TDP를 10분의 1 수준으로 줄일 수 있을 것으로 기대하고 있다"고 설명했다.
KT클라우드는 이날 전 세계 2위 AI 반도체 업체인 AMD와 협력해 기업의 초거대 AI 학습·추론 비용을 절감하는 방안을 공개했다. AMD의 AI 반도체 '인스팅트 MI250'을 KT클라우드와 모레가 자체 개발한 세계 최초 다중·동적 AI 반도체 할당 서비스 'HAC(Hyperscale AI Computing)'와 함께 기업에 제공함으로써 유사한 엔비디아 시스템(DGX) 대비 장비 성능은 1.17배 더 우수하면서 구축 비용을 3분의 1 수준으로 낮추는 게 목표다. HAC는 KT클라우드 데이터센터에 있는 다수의 AI 반도체를 하나의 가상 AI 반도체로 재구성해서 기업·개발자가 필요로 하는 성능만큼만 실시간으로 할당해 주는 기술이다.
리벨리온도 이날 아톰의 뒤를 잇는 차세대 AI 반도체 로드맵을 공개하며 엔비디아의 대안을 찾는 전 세계 AI·클라우드 기업을 공략할 것이라고 강조했다.
오진욱 리벨리온 최고기술책임자(CTO)는 "올해 1세대 아톰을 출시한 데 이어 내년에는 2세대 아톰을 선보여 60W급 추론용 AI 반도체 시장을 공략할 것"이라며 "2024년 이후에는 현재 엔비디아가 장악하고 있는 250W급 AI 반도체 시장을 공략하기 위한 초거대 AI용 반도체 '1세대 리벨(가칭)'도 공개할 계획"이라고 밝혔다.
오 CTO는 이어 "리벨리온은 현재 AI 업체가 단일 AI 반도체에서 자사 AI 모델을 추론할 수 있도록 최적화하는 매핑 솔루션을 만들고 있다"며 "다수의 아톰을 병렬 연결하는 분산 추론 시스템으로 엔비디아의 비싼 AI 반도체(A100·H100)와 동일한 AI 모델 추론 성능을 낼 것"이라고 덧붙였다.
NHN클라우드도 SK 계열 AI 반도체 기업인 사피온과 협력해 패션 특화 AI 서비스 '버츄얼 트라이온'을 상용화하는 등 엔비디아의 고가 AI 반도체를 대체할 솔루션 찾기에 분주하다. 사피온은 올 하반기에 데이터센터뿐 아니라 자율주행차(커넥티드카)와 사물인터넷 기기(에지)를 지원하는 차세대 AI 반도체 X300 시리즈를 공개할 방침이다.
18일(현지시간) 미국 IT 매체 디인포메이션은 두 명의 업계 관계자를 인용해 "마이크로소프트가 자체 AI 반도체 '아테나'를 개발하고 이를 챗GPT를 포함한 초거대 언어모델(LLM) 학습과 추론(실행)에 사용할 계획"이라고 보도했다.
아테나 개발은 지난 2019년부터 시작됐으며 현재 TSMC 5nm(나노미터) 공정에서 샘플 칩셋이 제작되어 마이크로소프트에 전달됐다. 일부 마이크로소프트 직원들은 해당 AI 반도체를 AI 모델 개발에 시험적으로 사용하고 있다.
디인포메이션에 따르면 마이크로소프트는 아테나가 엔비디아에서 구매한 AI 반도체보다 더 높은 전력대성능비(TDP)를 내고, 초거대 AI로 인해 촉발된 AI 반도체 수급 문제를 해결하는 데 도움이 될 것으로 기대하고 있다. 미국 반도체 전문가들에게 자문을 구한 결과 아테나는 엔비디아 AI 반도체 대비 도입·운영 비용을 최대 3분의 1 수준으로 낮출 수 있을 것으로 기대된다.
마이크로소프트가 자사 클라우드 서비스인 '애저'로 아테나를 외부 기업에 공개할지는 미정이다. 경쟁사인 구글클라우드는 'TPU(텐서플로유닛)', 아마존웹서비스는 '인퍼런시아'라는 자체 AI 반도체를 개발해 클라우드를 통해 외부 기업에 공개한 상황이다. 페이스북도 엔비디아 일변도에서 벗어나기 위해 자체 AI 반도체 개발에 속도를 내고 있다.
얼마 전 방한해 국회를 찾은 브래드 스미스 마이크로소프트 부회장은 "초거대 AI 개발에는 큰 비용이 수반된다. AI는 엄청나게 자본집약적인 산업"이라며 "오픈AI의 챗GPT는 마이크로소프트가 미국 중부 아이오와주에 구축한 클라우드 AI 반도체(GPU)팜에서 운영된다"고 밝힌 바 있다.
스미스 부회장은 이어 기업과 정부가 초거대 AI로 인한 막대한 데이터센터 전력 소모를 해소할 방법을 찾고 지속가능한 AI를 만들어야 한다고 강조했다. 그는 "AI 학습·추론을 위해 각국 데이터센터 규모는 앞으로 더 커질 수밖에 없고 최선의 노력을 기울여도 더 많은 전기를 소비하는 것을 피할 수 없다"며 "원자력·태양력·풍력 등 신재생에너지 활용 방안에 대해 더 많이 고민해야 한다"고 말했다.
AI 반도체가 지속가능한 AI 환경을 조성하려는 마이크로소프트의 노력의 일환임을 암시한 것이다.
KT클라우드, NHN클라우드, 네이버클라우드 등 국내 클라우드 업체도 AI 반도체 업체와 협력하거나 자체 AI 반도체를 개발하는 형태로 지속가능한 AI 환경 만들기에 힘을 보탠다.
윤동식 KT클라우드 대표는 18일 열린 KT클라우드 서밋 2023 행사에서 기자들과 만나 "AI 모델 학습·추론에 천문학적인 운영비(전기료)가 필요하다. 탄소중립이라는 전 세계적인 추세에 반한다"고 지적하며 "AI 운영 비용에 대한 고민이 큰 기업을 위해 KT가 투자한 리벨리온의 AI 반도체 '아톰'도 KT클라우드에서 제공할 것"이라고 밝혔다.
윤 대표는 "빠르면 5월부터 아톰을 클라우드로 제공할 수 있을 것"이라며 "아톰은 엔비디아 AI 반도체 'A100' 대비 전력대성능비(TDP)가 5분의 1 수준에 불과하면서 더 우수한 AI 모델 추론 성능을 낸다. KT클라우드도 인프라 최적화를 좀 더 진행하면 TDP를 10분의 1 수준으로 줄일 수 있을 것으로 기대하고 있다"고 설명했다.
KT클라우드는 이날 전 세계 2위 AI 반도체 업체인 AMD와 협력해 기업의 초거대 AI 학습·추론 비용을 절감하는 방안을 공개했다. AMD의 AI 반도체 '인스팅트 MI250'을 KT클라우드와 모레가 자체 개발한 세계 최초 다중·동적 AI 반도체 할당 서비스 'HAC(Hyperscale AI Computing)'와 함께 기업에 제공함으로써 유사한 엔비디아 시스템(DGX) 대비 장비 성능은 1.17배 더 우수하면서 구축 비용을 3분의 1 수준으로 낮추는 게 목표다. HAC는 KT클라우드 데이터센터에 있는 다수의 AI 반도체를 하나의 가상 AI 반도체로 재구성해서 기업·개발자가 필요로 하는 성능만큼만 실시간으로 할당해 주는 기술이다.
리벨리온도 이날 아톰의 뒤를 잇는 차세대 AI 반도체 로드맵을 공개하며 엔비디아의 대안을 찾는 전 세계 AI·클라우드 기업을 공략할 것이라고 강조했다.
오진욱 리벨리온 최고기술책임자(CTO)는 "올해 1세대 아톰을 출시한 데 이어 내년에는 2세대 아톰을 선보여 60W급 추론용 AI 반도체 시장을 공략할 것"이라며 "2024년 이후에는 현재 엔비디아가 장악하고 있는 250W급 AI 반도체 시장을 공략하기 위한 초거대 AI용 반도체 '1세대 리벨(가칭)'도 공개할 계획"이라고 밝혔다.
오 CTO는 이어 "리벨리온은 현재 AI 업체가 단일 AI 반도체에서 자사 AI 모델을 추론할 수 있도록 최적화하는 매핑 솔루션을 만들고 있다"며 "다수의 아톰을 병렬 연결하는 분산 추론 시스템으로 엔비디아의 비싼 AI 반도체(A100·H100)와 동일한 AI 모델 추론 성능을 낼 것"이라고 덧붙였다.
NHN클라우드도 SK 계열 AI 반도체 기업인 사피온과 협력해 패션 특화 AI 서비스 '버츄얼 트라이온'을 상용화하는 등 엔비디아의 고가 AI 반도체를 대체할 솔루션 찾기에 분주하다. 사피온은 올 하반기에 데이터센터뿐 아니라 자율주행차(커넥티드카)와 사물인터넷 기기(에지)를 지원하는 차세대 AI 반도체 X300 시리즈를 공개할 방침이다.
네이버클라우드는 삼성전자와 함께 메모리 성능을 강화한 AI 반도체를 개발해서 자사 초거대 AI 하이파클로바X 운영 등에 활용할 계획이다. 다만 샘플칩 개발에 이어 실제 칩 양산에 돌입하며 상용화 절차를 밟고 있는 국내외 경쟁사들과 달리 아직 칩 설계 단계에 머무르고 있어 일각에선 대응이 늦다는 지적이 나온다.
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지