중앙처리장치(CPU)의 강자 인텔이 그래픽처리장치(GPU)의 강자 엔비디아에 도전장을 냈다. 생성 인공지능(AI) 열풍으로 GPU 매출과 영업이익이 CPU를 앞지르면서 전 세계 1위 팹리스(반도체 설계 기업) 자리를 양보해야 했기 때문이다.
그런 상황에서 인텔이 AI 반도체 '가우디' 시리즈를 선보이며 반격에 나섰다. 생성 AI 학습·추론(실행)에 엔비디아의 데이터센터 GPU(AI 반도체)가 필수나 다름없는 상황에서 가우디는 글로벌 반도체 업계에 큰 충격을 가져왔다.
그동안 수많은 기업이 엔비디아 대항마를 자처했지만 AI 학습·추론 성능 면에서 엔비디아의 현역 AI 반도체를 넘어서는 제품을 선보이는 데 성공한 곳은 인텔과 가우디가 유일했기 때문이다.
이를 두고 나승주 인텔코리아 상무는 "기술이 발전하려면 특정 기업의 독점보다 경쟁이 있어야 한다"며 "인텔은 가우디를 시장에 공개함으로써 AI 업계 산업 표준 생태계를 만들고 기업 고객들의 AI 반도체 선택의 폭을 넓힐 것"이라고 강조했다.
그러면서 "기업이 특정 기업(엔비디아)에 구속되지 않고 다양한 AI 반도체 가운데 원하는 제품을 골라 쓸 수 있는 오픈 생태계가 구축되는 게 산업 전체가 더 빠르게 발전할 수 있는 계기가 될 것"이라고 덧붙였다.
다음은 인텔 가우디 사업과 인텔-네이버-KAIST 협력에 관계된 나 상무와 일문일답이다.
-인텔의 AI 반도체 가우디는 어떤 제품인가.
"가우디는 AI 학습·추론을 위한 데이터센터용 AI 가속기(AI 반도체)다. 인텔의 CPU에서도 생성 AI·학습 추론이 가능하다. 하지만 범용 처리장치이기 때문에 실제 학습·추론 효율은 전용 AI 가속기를 넘어서진 못한다.
때문에 인텔은 기업이 CPU를 대신해 효율적으로 AI를 학습·추론할 수 있는 반도체를 개발했고, 그것이 가우디다."
-현재 AI 반도체 시장 상황과 전망은?
"시장조사업체 등에 따르면 AI 반도체 시장은 2024년 182억 달러에서 2027년 485억 달러로 3년 만에 2.5배 이상 성장할 것으로 예측된다.
현재 AI 반도체 시장은 폐쇄적인 행보를 보이는 특정 업체(엔비디아)가 사실상 독점하고 있다. 기술과 시장이 함께 성장하려면 독점보다 경쟁이 있어야 한다. 특정 업체가 시장을 독점하면 사용자의 선택 폭이 줄어들고 기술 발전 속도도 경쟁 시장보다 느려진다. 역사적으로도 증명된 사실이다.
인텔은 언제나 반도체 업계 산업 표준을 제정하는 데 앞장서왔다. CPU 시장 초창기에 처리장치 아키텍처(설계자산)가 RISC에서 x86 기반으로 전환되도록 기술을 공개해 서버 시장이 커지는 데 일조했고, 그것이 지금 IT 시장이 발전하는 계기가 됐다.
AI 반도체 시장도 마찬가지다. 인텔이 가우디라는 AI 반도체를 개발하고 관련 기술을 외부에 공개함으로써 기업 고객들은 특정 업체에 구속되지 않고 산업 전체가 발전할 수 있을 전망이다."
-올 상반기 가우디2를 출시한 데 이어 하반기 후속 제품인 가우디3 출시를 예고했다. 사업 목표는?
"인텔이 가우디2에 이어 가우디3를 공개하면서 가우디3 기반 AI 서버를 만들겠다는 서버 기업이 크게 늘었다. 예전에는 슈퍼마이크로 한 군데뿐이었으나, 앞으로는 델·HPE·슈퍼마이크로 등 주요 글로벌 서버 업체와 대만 8개 중견 서버 업체가 가우디3 기반 AI 서버를 만들어 기업 고객들에게 공급할 예정이다.
이는 가우디가 시장 점유율을 확대할 수 있는 발판을 마련한 것이다. 초거대 AI 추론·학습을 위해 AI 서버를 대규모로 구매하려는 기업들도 가우디에 많은 관심을 보내고 있다.
현재 인텔은 네이버를 필두로 여러 한국 기업이 가우디 기반 생성 AI 서비스를 구축할 수 있도록 협력하고 있다. 지금은 가우디2를 기반으로 테스트를 진행 중이지만 향후 가우디3로도 관련 테스트를 진행할 예정이다."
-팻 겔싱어 인텔 CEO가 가우디를 직접 공개하며 경쟁사 AI 반도체보다 3분의 1에서 5분의 1까지 낮은 가격에 공급하겠다고 했다. 시장 반응은?
"경쟁사의 동급 AI 반도체보다 크게 저렴한 가격 정책을 발표한 이후 시장에서 가우디에 대한 관심이 커졌다. 가우디가 IT 업계에서 가격을 책정하는 기준인 TCO(총소유비용) 측면에서 매력적인 제품이란 증거다.
먼저 글로벌 사례를 들어보겠다. 전 세계 1위 서버 업체인 델의 경우 가우디2 발표 때까지만 해도 인텔 AI 반도체 사업과 큰 접점이 없었으나, 가우디3는 긴밀히 협력하며 '인텔 디벨로퍼(개발자) 클라우드'에 자사 가우디3 기반 AI 서버를 공급하기로 했다. 인텔과 델은 인텔 디벨로퍼 클라우드를 활용해 고객이 더 비용 효과적으로 가우디3를 이용할 수 있도록 지원할 계획이다.
국내에서도 가우디 도입 문의가 급증했다. 예를 들어 국내 대형 AI 학회에서 회원들이 가우디에 대한 관심도가 높다며 관련 설명을 들은 후 도입 논의를 해보자는 연락이 오기도 했다. 특정 업체 AI 반도체 대안을 찾으려는 시장 요구가 큰 것을 체감할 수 있었다. 이밖에 제조·의료·자동차 업계 기업과 지방자치단체가 가우디 도입을 원하는 사례도 있다."
-인텔-네이버-KAIST가 가우디 기반 오픈 AI 생태계를 창출하기 위한 협력은 앞으로 어떻게 진행될까.
"인텔은 네이버를 오픈 AI 생태계 구축을 위한 중요 파트너 업체로 보고 있다. 네이버는 AI 서비스, 운용 엔지니어, 서비스 경험 등 세 가지 측면에서 글로벌 AI 기업에 절대 뒤떨어지지 않는 강점을 가진 기업이다.
인텔은 단순히 AI 반도체 소프트웨어 스택을 개발하는 것을 넘어 이에 대한 고객들의 실제 피드백(반응)을 중요하게 여기고 있다. 단순히 소프트웨어 스택이 좋다 나쁘다를 넘어 실제 전문가 레벨의 피드백을 얻기 위해 네이버와 함께하기로 한 것이다.
인텔이 잘하는 부분이 있고 네이버가 잘하는 부분이 있는 만큼 가우디를 활용한 AI 서비스를 구축하면서 상호 밀접한 보완관계를 맺을 것으로 기대하고 있다."
-가우디는 과거 인텔이 만든 부가연산장치와 어떤 차이가 있나.
"인텔은 CPU 외에도 컴퓨팅 성능 발전을 위해 많은 노력을 해왔다. 과거 제온파이 등 부가연산장치(코프로세서)는 과학연산을 위한 HPC(슈퍼컴퓨터) 구축에 초점을 맞췄다.
당시에도 병렬컴퓨팅에 대한 논의가 활발했지만 지금처럼 많은 소프트웨어 개발자가 병렬컴퓨팅 개발에 진심이진 않았다.
대규모 병렬컴퓨팅이 필요한 AI가 등장하면서 얘기가 달라졌다. 이에 인텔은 AI를 위한 가속기 개발에 착수했고 그 성과가 가우디라는 형태로 가시화된 것이다.
현재 인텔의 데이터센터용 처리장치는 '제온', 'GPU맥스', '가우디' 등 세 가지로 구분된다. 제온은 기업용 앱과 서비스를 구동하기 위한 범용처리장치다. 여기에 AI 추론 등을 위한 부가 기능을 더하는 방향으로 발전시키고 있는데, 이것이 '제온 스케일러블'이다.
단순한 AI 기능 추가를 넘어 전문적인 AI 학습·추론이 필요하면 여기에 특화한 가우디를 선택하면 된다.
GPU맥스는 원래 과학연산과 슈퍼컴퓨터 구축에 특화한 반도체이지만, 다음 세대부터는 가우디와 통합한다. 가우디3의 후속 제품인 '팔콘쇼어'는 가우디와 GPU맥스의 특징을 합친 제품으로, AI 학습·추론뿐만 아니라 과학연산을 위한 대규모 슈퍼컴퓨터 구축에도 효과적으로 활용할 수 있다. 구체적으로 하나의 팔콘쇼어 아키텍처를 토대로 AI에 특화한 모델과 과학연산에 특화한 모델을 선보이며 시장 공략에 나설 방침이다."
-인텔을 필두로 다수의 빅테크가 뭉쳐 반 엔비디아 전선인 'UA(울트라 가속기)링크' 컨소시엄을 결성했다. 가우디에도 UA링크 기술이 적용되나.
"가우디는 아직까지는 이더넷 기반으로 AI칩과 칩을 상호연결한다. 이더넷은 특정 업체의 칩 간 연결방식(NV링크)과 달리 개방형 산업 표준이라 더 쉽고 빠르게 비용효율적으로 대규모 AI 시스템을 구축할 수 있는 이점이 있다.
최신 네트워크 기술을 적극 수용함으로써 데이터 대역폭과 지연시간 등 성능 면에서도 크게 뒤지지 않는다. 가우디를 64대, 128대 연결한 중소형 시스템뿐만 아니라 1000대 이상을 연결한 대형 시스템 구축도 지원한다.
UA링크에 인텔이 주도적으로 참가하는 것은 사실이지만, 관련 기술을 적용한 AI 반도체가 나오는 것에 아직은 시간이 걸릴 것이다. 아직까지는 NV링크의 대안이 될 수 있는 AI 반도체간 상호연결 기술을 개발하기 위해 전 세계 기업들이 협력한다는 데 의의가 있다."
-가우디는 어느 정도 규모 AI 모델 학습·추론에 특화되어 있을까.
"가우디는 AI 전용 가속기인 만큼 현존하는 모든 AI 모델 학습·추론이 가능하다. 엔비디아는 되는데, 인텔은 되지 않고 그런 일은 없다.
가우디3의 경우 엔비디아 H100 제품과 비교해 AI 모델 학습 속도가 40~50%가량 더 빠르다는 벤치마크 결과도 있다.
가우디는 처리장치와 HBM(고대역폭 메모리) D램 간 균형 잡힌 구조로 설계되어 있다. 때문에 H100과 비교하면 HBM D램 용량도 더 크면서 대역폭도 더 앞선다. 시장에서도 가우디가 성능표에 기재된 만큼의 실제 성능이 나온다고 호평하고 있다."
◆나승주 상무는?
현) 인텔 데이터센터 및 AI 사업부 한국 영업 총괄
전) 인텔 아시아태평양 및 일본 지역 HPC 제품 마케팅
전) 인텔 아시아태평양 및 일본 지역 데이터센터그룹 서버 아키텍처 매니저
전) 삼성전자 컴퓨터사업부 노트북 개발 엔지니어
©'5개국어 글로벌 경제신문' 아주경제. 무단전재·재배포 금지