‘AI의 왕’ 즉위식 된 젠슨 황 GTC 2026 기자회견

reporter-profile
박원익 2026.03.18 11:00 PDT
‘AI의 왕’ 즉위식 된 젠슨 황 GTC 2026 기자회견
자동차 전문 매체 모터트렌드(MotorTrend)가 17일(현지시각) 열린 젠슨 황 엔비디아 CEO 기자회견에서 황 CEO를 올해의 인물(Person of the Year)로 선정, 트로피를 증정하고 있다. (출처 : 더밀크 박원익)

[위클리AI브리핑] 2026년 3월 04일~3월 10일
🏅젠슨 황 “AI의 99%는 새로운 수요”
⚡컴퓨팅 혁신: 멀티 에이전트를 잡아라
♾️AI 클라우드가 만드는 새로운 지형도

구독자 여러분 안녕하세요, 실리콘밸리와 글로벌 혁신 현장에서 최신 AI 산업 트렌드와 인사이트를 전해드리는 박원익의 AI인사이트입니다. 


저는 현재 미국 산호세에서 열리는 엔비디아 GTC 2026 현장에 나와 있습니다. 31도까지 치솟는 초여름 날씨만큼이나 GTC 현장 분위기가 뜨거운데요, 젠슨 황 엔비디아 CEO는 17일(현지시각) 비공개 프레스 컨퍼런스에서 “여러분은 추론 왕(Inference King)을 보고 있다”며 강한 자신감을 드러냈습니다.

젠슨 황 엔비디아 CEO가 16일(현지시각) GTC 2026 기조연설에서 반도체 전문 리서치 업체 세미애널리시스가 선정한 ‘추론 왕(Inference King)’ 챔피언 벨트(화면)를 들어 보이는 퍼포먼스를 하고 있다. (출처 : NVIDIA)

전날 2시간 이상 진행된 기조연설에서 강조한 에이전틱 AI라는 청사진을 다시 한번 내세운 것이죠. 인간을 대신해 스스로 작동하는 AI 에이전트(Agent, 대리인)가 기하급수적으로 늘어나고, 이에 따라 폭발적으로 증가하는 추론 수요를 엔비디아 칩이 가장 효율적으로 지원할 수 있다는 주장입니다.  

흥미로운 건 이런 엔비디아의 전략을 한국 기업들이 뒷받침하고 있다는 점입니다. 엔비디아는 이번 GTC 2026에서 추론에 최적화한 그록3(Groq 3) LPU(언어처리장치)를 공개, 베라 루빈 플랫폼에 통합해 추론 속도를 높이는 전략을 발표했는데, 이 그록3 LPU칩을 삼성전자 파운드리(Foundry, 반도체 위탁 생산)가 제조합니다. 

차세대 GPU 베라 루빈 플랫폼에 탑재되는 6세대 HBM(고대역폭메모리)도 마찬가지입니다. 삼성전자와 SK하이닉스가 HBM을 공급하고 있죠. 황 CEO는 기조연설에서 삼성에 대해 “고맙다”라고 언급했고, 이날 기조연설 후 삼성전자와 SK하이닉스 부스에 들러 HBM에 서명도 남겼습니다. 최태원 SK그룹 회장과 만나 반갑게 대화를 나누며 한국을 치켜세우기도 했습니다.

🏅젠슨 황 “AI의 99%는 새로운 수요”

GTC 2026 SK하이닉스 부스를 방문한 젠슨 황 엔비디아 CEO(왼쪽)와 최태원 SK그룹 회장(오른쪽) (출처 : 더밀크 박원익)

팩트 요약: 젠슨 황 GTC 2026 기자회견 분석

1. 젠슨 황 엔비디아 CEO는 17일 진행한 GTC 2026 기자회견에서 “앞으로 발생하는 AI 수요의 99%는 신규 수요일 것”이라고 단언했습니다. 

2. 차세대 GPU 플랫폼인 베라 루빈이 블랙웰 수요를 잠식하는 것 아니냐는 질문에 AI 산업의 성장 방식 자체가 기존 IT와 근본적으로 다르다고 선언한 것입니다. 

왜 중요한가: 

황 CEO는 “지금은 추론의 변곡점이 지나는 첫해”라고 강조했습니다. 기존 IT 산업의 경우 기존 제품을 신제품으로 교체하는 사이클이 핵심이었다면 AI 인프라는 존재하지 않던 수요를 창출하는 새로운 개념이라는 주장입니다. 

이는 아마존 AWS, 마이크로소프트 애저, 구글 클라우드의 설비 투자를 정당화하는 논리이기도 합니다. 실제로 이들 하이퍼스케일러들은 AI 인프라 구축을 위해 천문학적 투자금을 쏟아붓고 있습니다.

👉더 알아보기: 젠슨 황, GTC에서 AI 버블 논쟁 끝내다

⚡컴퓨팅 혁신: 멀티 에이전트를 잡아라

엔비디아 베라 루빈과 그록3 LPU (출처 : NVIDIA)

팩트 요약: 그록 3 LPU 결합… 추론 효율 최대 35배

1. 코딩을 비롯한 에이전틱 AI 작업이 확산하면서 추론 수요가 급증하자 전력 대비 더 높은 추론 성능 효율을 내는 것이 중요해졌습니다. 

2. 엔비디아가 이번 GTC 2026에서 새로운 LPU 결합 아키텍처 NVIDIA Groq 3 LPX를 공개한 것도 이런 기업의 니즈를 포착했기 때문입니다. 

왜 중요한가: 

엔비디아는 차세대 AI 가속기인 베라 루빈에 그록3 LPU를 탑재한 뒤 대규모 연산(높은 처리량)은 GPU가, 신속한 답변(낮은 지연시간)은 그록3 LPU가 처리하는 방식으로 운영할 예정입니다.

이 방식으로 다중 에이전트 작업 시 메가와트 당 최대 35배 높은 추론 처리량을 제공할 수 있다는 설명이죠. 이런 컴퓨팅 환경 변화는 여러 에이전트 간 협업, 에이전트가 에이전트에 일을 맡겨 빠르게 업무를 완수하는 새로운 흐름을 가속할 전망입니다. 

👉더 알아보기: AI가 AI를 고용… GTC가 보여준 충격적 미래

♾️AI 클라우드가 만드는 새로운 지형도

GTC 2026 네비우스 전시관. 중국 휴머노이드 로봇 유니트리가 복싱 동작을 하고 있다. (출처 : 더밀크 박원익)

팩트 요약: 엔비디아, 네비우스에 20억달러 투자

1. 생태계를 확장해 시장을 창출하는 엔비디아의 전략은 지난 11일 발표된 네비우스(Nebius) 투자에서도 확인됩니다. 

2. 엔비디아는 GTC 2026을 앞두고 AI 클라우드 업체 네비우스에 20억달러(약 2조9000억원)를 투자하고, 차세대 하이퍼스케일 AI 클라우드를 함께 구축하기로 했습니다. 

왜 중요한가: 

이번 계약을 통해 네비우스는 엔비디아 차세대 GPU 루빈에 대한 접근권과 함께 2030년 말까지 5기가와트(GW) 이상의 엔비디아 시스템을 배포할 수 있는 역량을 갖추게 됐습니다. 1기가와트는 약 70만 가구에 전력을 공급할 수 있는, 일부 국가의 하루 전체 전력 사용량과 맞먹는 엄청난 양의 에너지죠. 

아마존웹서비스(AWS), 마이크로소프트 애저(Microsoft Azure), 구글 클라우드(Google Cloud) 등 전통적 하이퍼스케일러 의존도를 줄이고, 에이전틱 AI 및 추론에 최적화된 첨단 AI 클라우드 생태계를 자체적으로 키우는 전략이라는 게 업계의 관측입니다.

👉더 알아보기: 풀스택 AI로 간다... 엔비디아의 큰 그림

구독자 여러분들의 성공과 꾸준한 성장을 위해 더밀크는 계속해서 혁신의 현장, 미래가 바뀌는 순간을 목격하고 전달해 드리겠습니다. 감사합니다.

실리콘밸리에서
박원익 드림

회원가입 후 뷰스레터를
주 3회 무료로 받아보세요!

단순 뉴스 서비스가 아닌 세상과 산업의 종합적인 관점(Viewpoints)을 전달드립니다. 뷰스레터는 주 3회(월, 수, 금) 보내드립니다.