추론 왕국의 확장… 엔비디아-그록 통합 칩이 보여준 한국의 기회
[엔비디아 추론 칩 기술 분석] 그록 LPU 통합이 중요한 이유
①AFD란 무엇인가: LLM 추론 효율을 높이는 비밀
②프리필, 디코드 분리 서빙의 경제학… 삼성 파운드리 역할
③그록 LP30 칩 아키텍처, 무엇이 다른가?... 하이닉스 주목할 이유
④루빈 울트라·파인만 로드맵: 밀도·광학 혁명
“추론의 변곡점(inference inflection)이 왔다.”
젠슨 황 엔비디아 CEO는 GTC 2026에서 현재 AI 컴퓨팅 수요가 “상상을 초월하는” 수준에 이르렀다고 강조했다. ‘클로드 코드(Claude Code)’ 같은 코딩 에이전트(agent, 대리인)가 토큰(token, AI가 처리하고 생성하는 데이터의 최소 단위) 수요를 기하급수적으로 증가시키고 있다는 것이다.
지난 2025년 12월 엔비디아가 AI 칩 스타트업 그록(Groq)의 IP(설계자산)를 200억달러(약 29조원)에 확보하고, 핵심 인력 대부분을 영입한 것도 이런 이유 때문이었다.
내용은 인수였지만, 외형은 라이선스 계약 형식을 취했다. 완전한 인수였다면 독과점 규제 심사를 피할 수 없었을 것이다. 철저히 계산된 전략, 발 빠른 통합작업을 거쳐 엔비디아는 계약 후 단 4개월 만에 그록의 기술을 베라 루빈 추론 스택(stack, 기술 및 도구의 집합)에 통합한 시스템 컨셉을 GTC 2026에서 선보일 수 있었다.
👉엔비디아, 그록 29조원에 흡수… AI 산업 ‘훈련에서 추론 시대로’
엔비디아는 왜 200억달러라는 거액을 투자했을까. GPU만으로는 갈수록 복잡해지는 추론 작업량(workload)을 최적의 효율로 처리하기 어렵기 때문이다. 에이전틱 AI 시대의 추론은 두 가지 근본적으로 다른 연산을 요구하고 있다. 이 두 연산을 하나의 하드웨어로 처리하는 것은 구조적으로 비효율적이다. 그록의 LPU는 그중 하나에 특화돼 있었다.