‘AI=엔비디아’ 공식 어떻게 완성됐나?

reporter-profile
Sejin Kim 2024.03.20 16:53 PDT
‘AI=엔비디아’ 공식 어떻게 완성됐나?
(출처 : GTC2024/디자인: 김현지)

엔비디아 독주의 비밀: 현재를 주고 미래를 얻었다
애플과 닮았다. ‘하드웨어-소프트웨어-구독’ 유사
‘원맨쇼’ 언제까지? 주목할 변수: 미국 정부, 경쟁자, 리드타임
게임의 룰, 또 바꾼 엔비디아

오픈AI의 챗GPT가 발표된 이후 대다수 비즈니스가 일제히 생성AI를 자사의 제품과 서비스에 접목하면서 인공지능(AI) 모델 훈련의 핵심 재료인 엔비디아(NVIDIA)의 그래픽처리장치(GPU) 등 AI 반도체칩 수요가 급증하고 있다. 이에 엔비디아는 반도체 기업 사상 처음으로 시가총액 2조달러를 넘어섰다. 아마존과 구글 모회사 알파벳을 제치고 애플과 마이크로소프트에 이어 세 번째로 큰 회사다.

업계 전문가들은 엔비디아가 AI 기술, 산업 분야에서 독보적인 지위를 갖고 있다고 입을 모은다. 게임용 그래픽칩 제조 업체였던 엔비디아는 어떻게 AI 산업에 없어선 안될 기업이 됐을까?

엔비디아의 시작은 약 14년전 게이머를 위한 그래픽카드였다. 당시 프로세서는 일종의 부업이었다. 이제 이들의 AI 프로세서는 산업 자체를 움직인다.

그 비결은 쿠다(CUDA)라는 인프라를 제공한 대신 신기술 흐름이라는 정보를 얻은 데 있다. 엔비디아는 당초 과학자들이 천문학적인 숫자의 과학 연산을 할 수 있도록 자사 병렬프로그래밍 모델 쿠다를 제공했는데, 이때 대부분 과학자들이 엔비디아 GPU를 사용해 연구한 덕분에 엔비디아는 AI 기술의 변화를 가장 빠르게 알 수 있었다.

엔비디아는 당초 게이머를 위해 GPU를 설계했으나 매우 많은 픽셀에 단순한 연산을 동시에 대량으로 하는 연산 구조가 인공지능의 대량 정보 학습에 좋은 구조를 가지고 있다는 것을 깨달았다. 당시 주류던 중앙처리장치(CPU)는 메모리로부터 전송받은 데이터를 한 번에 하나씩 처리할 수 있는 구조다. AI와 딥러닝으로 처리해야 할 데이터의 양이 기하급수적으로 늘어나자 CPU 병목현상이 생겼다. 이에 엔비디아가 AI가속기, 즉 AI반도체 수요가 생기자 엔비디아가 그래픽처리장치(GPU)로 파고든 것.

회사는 2016년경부터 게임 그래픽카드 사업에서 인공지능 GPU로 전환했다. 이후 주요 사업을 게임용콘솔, PC, 노트북용 GPU 디자인에서 인공지능 컴퓨팅을 위한 디자인으로 바꿨다. GPU는 한 번에 다량의 데이터를 처리하는 병렬 처리 구조다. 한 번에 많은 양의 데이터를 학습하고 처리해야 하는 AI를 구현하기에 적합하다. 과거에는 그저 단순히 실감나는 게임에 대용량의 그래픽 처리를 수월하게 하기 위한 목적으로 GPU가 사용됐지만 AI가 발전하면서 새로운 사용처를 찾게 된 것이다.

GPU는 트랜스포머에 좀 더 최적화되기도 했다. 트랜스포머는 문장 속 단어와 어순 간 관계를 추적해 맥락과 의미를 학습하는 신경 모델로, 오픈AI의 챗GPT의 근간이 된 모델이다. 이 트랜스포머 알고리듬은 대부분 대용량 메모리 및 GPU가 한 패키지(단위)에 들어가는 AI 반도체를 사용한다. 엔비디아의 GPU H100을 8개 붙인 엔터프라이즈용 가속기 DGX H100은 초거대 AI를 뒷받침하는 서버, 데이터센터에 잘 맞는다. 이미 유연성이 있는 GPU에 새로운 알고리듬을 누구보다 먼저 적용, 이를 지원하는 AI 반도체 설계 역시 경쟁사보다 수년 이상 먼저 시작할 수 있었던 셈이다.

회사 초창기였던 2016년 젠슨 황 엔비디아 CEO는 AI 전용 슈퍼컴퓨터 ‘DGX-1’을 오픈AI에 기증, 손수 전달하기도 했다. 당시 오픈AI는 ‘일반인공지능(AGI)’라는 업계에서 인정받지 못하던 목표를 추구하는 회사였다. 챗GPT가 나오기 몇 달 전인 2년 전부터는 벤처투자조직을 만들어 유망한 AI 스타트업들에 본격적으로 투자해 왔다. 그때 투자한 기업들이 유니콘 스타트업인 코히어(Cohere), 허깅페이스(Huging Face), 인플렉션(Inflection) 등이다.

인공지능 산업이 획기적인 도약을 보인 시기는 2012년이 꼽힌다. 당시 이미지넷(ImageNet)이 주최한 인공지능 대회에서 알렉스넷(AlexNet)은 사진 인식 성능으로 시장을 놀라게 했고, AI 연구에 불을 붙였다. 알렉스넷은 엔비디아의 그래픽처리장치(GPU) 칩을 이용해 합성곱신경망(Convolutional Neural Network, CNN) 아키텍처로 개발됐다.

반면 알렉스넷이 나왔을 당시 새 알고리듬인 CNN이 제공하는 화상 인식 기술에 매료된 다른 기업들은 당시 GPU 같은 범용 AI 반도체보다 전력효율이 뛰어나고, 성능도 뛰어난 CNN 전용 AI 반도체에 뛰어들었다. 대형 클라우드 기업을 비롯해 영국의 그래프코어, 미국 실리콘밸리의 삼바노바 시스템, 세레브라스 등 스타트업들이 수천억원이 넘는 투자를 받고 자체 개발에 나섰다. 그러나 기존 엔비디아를 제외한 AI 반도체들은 전력효율, 가격에 큰 장점이 있는 반면 이런 거대한 알고리듬의 변화에 대응하기에는 유연성이 떨어진 것으로 보인다.

회원가입 후 뷰스레터를
주 3회 무료로 받아보세요!

단순 뉴스 서비스가 아닌 세상과 산업의 종합적인 관점(Viewpoints)을 전달드립니다. 뷰스레터는 주 3회(월, 수, 금) 보내드립니다.