"로봇은 데이터 빈곤층"... 갤봇 로봇용 통합 두뇌 '아스트라브레인' 만들다
[STK2026] 중국 휴머노이드의 공습 '갤봇'
아오이 후카와 갤봇 부사장, 테크콘 2026서 Sim2Real 전략과 상용화 실적 공개
중국 100개 이상 매장에서 커피 파는 로봇... "하나의 뇌가 여러 몸을 움직인다"
로봇이라는 단어를 들으면 무엇이 떠오르는가. 공장의 기계, 아니면 영화 속 존재인가. 오늘 보여줄 것은 다른 미래다. 로봇은 더 이상 멀리 있지 않다. 이미 우리의 실생활로 들어오고 있다아오이 후카와(Aoi Fukawa) 갤봇 부사장, STK2026 테크콘에서
베이징 기반 체화AI 스타트업 갤봇(Galbot)의 아오이 후카와(Aoi Fukawa) 부사장은 10일 서울 코엑스에서 열린 '테크콘(TechCon) 2026' 첫째 날 무대를 이 질문으로 열었다.
제15회 스마트테크 코리아(STK 2026)와 동시 개최된 이날 로봇 세션에서 갤봇은 유니트리와 함께 중국 휴머노이드 진영을 대표했다. 지난 2023년 5월 왕허(Wang He) 베이징대 교수가 창업한 갤봇은 CATL이 주도한 투자 라운드를 포함해 누적 수천억원대 자금을 조달하며 중국 임바디드 AI의 선두권으로 부상한 회사다.
LLM은 인터넷을 먹고 컸다, 로봇은 무엇을 먹나
후카와 부사장이 정의한 체화AI는 '물리적 몸을 가진 AI'다. 컴퓨터 안에서 텍스트를 생성하는 소프트웨어가 아니라 세상을 보고, 이해하고, 상호작용하는 AI, 한마디로 '현실 세계에서 살아갈 수 있는 AI'다.
문제는 식량이다. 대규모 언어모델은 인터넷이라는 거대한 데이터 저수지를 갖고 출발했다. 로봇이 배워야 할 데이터는 다르다. 물건을 집고, 넘어지지 않고, 예측 불가능한 환경에서 행동하는 물리 데이터는 수집 비용이 높고 속도가 느리다.
후카와 부사장은 "LLM과 비교하면 임바디드 AI는 데이터 빈곤층(data poor)"이라고 말했다.
갤봇은 이를 가상 세계에서 데이터를 제조하고 이 것을 로봇에 이식한다. 3D 시뮬레이션 환경에서 로봇을 학습시킨 뒤 현실로 전이하는 일명 '심투리얼(Sim2Real)' 방식이다.
후카와 부사장은 "3D 합성 데이터가 공간 이해 효율을 최대 1만 배까지 끌어올리고 데이터 생성을 무한히 확장할 수 있으며, 현실보다 빠르고 안전하게 훈련할 수 있다"고 설명했다.
발표에서 공개된 파지(grasp) 데이터셋의 규모가 이 전략을 보여준다. 30x50cm 공간에 최대 11개 물체를 밀집 배치한 학습 장면 7600개에 장면당 평균 5만 개씩, 총 4억2600만 개의 유효 파지 라벨을 합성했다. 검증에는 1000개 이상의 신규 물체를 포함한 테스트 장면 670개를 쓴다. 사람이 로봇을 일일이 조작해 모으려면 수년이 걸릴 분량을 시뮬레이터가 찍어낸다.
[더밀크 휴머노이드 혁명 2026 시리즈]
▲총론
젠슨 황의 선언 "모든 산업은 로봇 기업 된다"... GTC26서 드러난 로봇 르네상스
“멋진 데모는 끝났다"... 이젠 ‘돈 되는 로봇’의 시대
▲기업별 전략
유니트리 : "춤만 춘다고?"... 유니트리의 신전략 '로봇 두뇌'에 올인
현대차그룹 : “가장 발전된 휴머노이드”... ‘피지컬 AI’로 모빌리티를 다시 정의하다
어질리티 로보틱스 : “로봇, 99.9999% 신뢰성 없으면 데모에 불과”
제너럴리스트AI : 로봇 파운데이션 모델 ... 로봇 최초 스케일링 법칙 확인
▲비판론
“휴머노이드 혁명은 아직 착각”… 진짜 돈은 ‘공장 밖’에 있다
하나의 뇌, 여러 개의 몸
이 데이터 위에 갤봇이 올린 아키텍처가 아스트라브레인이라는 '통합 두뇌 시스템'이다. 합성 데이터와 실데이터를 결합해 학습하며 만든 단일 시스템이 인식과 추론, 동작 제어를 통합하고, 이 뇌가 휴머노이드부터 로봇개까지 서로 다른 플랫폼에 이식된다.
후카와 부사장은 이를 "범용 로봇을 위한 통합 두뇌"라고 불렀다. 로봇마다 별도의 소프트웨어를 만드는 것이 아니라 하나의 파운데이션 모델이 여러 형태의 몸을 운용하는 구조다.
갤봇은 쇼를 하거나 동영상에서만 보이는 시연성 로봇이 아닌 '손에 잡히는 상용화'를 내세웠다. 후카와 부사장은 무대 영상으로 로봇이 실제로 일하고 있는 현장들을 차례로 보여줬다.
가장 먼저 등장한 것은 소매 매장이다. 갤봇 로봇은 이미 중국 전역 100개 이상의 무인 매장에 배치돼 문화상품과 음료, 커피, 아이스크림, 스낵을 직접 판매하고 있다. 고객이 주문하면 로봇 팔이 진열대에서 상품을 집어 건네는 방식이다. 베이징에서는 약국 매장 자체를 로봇이 자율 운영하는 사업도 진행하고 있다. 사람 점원 없이 로봇이 의약품을 찾아 내주는, 규제와 정확성이 까다로운 영역까지 발을 들인 것이다.
공장과 창고에서는 성격이 다른 일을 한다. 같은 로봇이 손끝의 엔드이펙터, 곧 작업 도구만 갈아 끼우면 물건을 분류하고 쌓고, 박스를 옮기고, 자재를 다루는 서로 다른 작업으로 전환된다. 한 대의 로봇이 여러 공정을 떠맡을 수 있다는 뜻이다.
창고에서는 사람이 퇴근한 뒤에도 멈추지 않고 24시간 무인으로 돌아간다. 이날 함께 공개된 신모델 'S1'은 50kg에 달하는 무거운 짐을 다루는 중량물 작업용으로, 사람이 들기 버거운 하중까지 로봇의 몫으로 넘기겠다는 포석이다.
갤봇 로봇의 적용 범위는 헬스케어로도 넓어지고 있다. 건강검진을 보조하고, 만성질환을 관리하며, 재활 동작을 안내하고, 복약을 챙기고, 건강 교육까지 맡는 식이다. 후카와 부사장이 특히 힘줘 든 사례는 수술 분야였다.
갤봇이 직접 솔루션을 만들어 넣은 것은 아니다. 의료 현장의 엔지니어가 갤봇 시스템을 가져다 수술 시나리오에 필요한 데이터를 수집하고 모델을 학습시켜 배포하는 과정을 스스로 해냈다는 것이다. 자사 로봇이 얼마나 다양한 일을 하느냐를 넘어 외부 개발자가 알아서 새로운 쓰임을 만들어낼 만큼 다루기 쉬운 플랫폼이라는 점을 증명하려는 대목이었다.
테니스 치는 휴머노이드, 사람을 따라 걷는 로봇개
기술 시연의 백미는 테니스 로봇이었다. 갤봇은 세계 최초로 휴머노이드가 예측 불가능한 공의 낙하 지점과 시시각각 변하는 궤적에 밀리초 단위로 반응해 랠리를 이어가는 실시간 계획·제어 알고리즘을 개발했다고 소개했다.
동작을 기계적으로 모방하는 단계에서 의사결정 기반 반응으로 넘어갔다는 의미다. 연령과 스타일이 다른 상대와도 안정적으로 랠리를 유지했다는 설명이 따라붙었다.
로봇개 시연도 이어졌다. 자체 개발한 내비게이션 파운데이션 모델 '트랙VLA(TrackVLA)'를 탑재한 갤봇의 로봇개는 360도 시야로 환경을 인식하며 갑자기 나타나는 보행자를 피하고, 추적 대상과 비슷한 외형의 방해 요소가 있어도 목표를 놓치지 않으며, 대상이 시야에서 사라지면 재탐색해 다시 따라붙는다. 칭화대와 공동 개발 중인 정밀 핸드 모델은 가상 입력만으로 저울 눈금 조정 같은 미세 동작을 수행하는 단계까지 왔다.
후카와 부사장은 "우리는 아직 시작점에 있지만 잠재력은 거대하다"며 "미래의 로봇은 모든 산업과 모든 가정에 들어갈 것"이라는 말로 발표를 맺었다.
왜 중요한가: 피지컬 AI의 원유는 합성된다
STK2026 테크콘에서는 중국의 휴머노이드 빅5 중 핵심인 유니트리와 갤봇의 현황과 전략을 확인할 수 있었다.
갤봇의 전략은 유니트리와 달랐다. 유니트리가 실제 로봇 배치를 늘려 데이터 플라이휠을 돌리겠다는 쪽이라면, 갤봇은 시뮬레이터로 데이터를 무한 복제하겠다는 쪽이다. 실데이터와 합성 데이터, 피지컬 AI 시대의 원유를 둘러싼 두 노선이 같은 날 같은 무대에서 경쟁한 셈이다.
둘은 대립처럼 보이지만 실은 같은 병목의 앞뒤다. 로봇이 배워야 할 데이터는 LLM의 인터넷 텍스트처럼 공짜로 쌓여 있지 않다. 갤봇은 그 희소성을 가상 세계에서 찍어내 푸는 것이고, 4억 건의 파지 라벨이 그 산물이다. 문제는 시뮬레이터가 잘 복제하는 것과 못 하는 것이 갈린다는 점이다.
물체를 집고 쌓고 옮기는 정형 동작, 물리 법칙이 명확한 작업은 가상 환경이 거의 무한히 생성한다. 그러나 소재가 변형되고 마찰과 힘이 매번 달라지는 비정형 접촉, 곧 사람이 '손맛'으로 처리하는 영역에서는 시뮬레이션과 현실의 간극(sim-to-real gap)이 남는다.
합성 데이터가 데이터의 80%를 싸게 메울수록, 승부는 시뮬레이터가 복제하지 못하는 나머지 20%로 옮겨간다. 그리고 그 20%야말로 실제 공정의 암묵지와 현장 데이터다.
한국 기업에 던지는 질문이 여기서 나온다. 합성 데이터 경쟁이 격화될수록 차별화 요소는 역설적으로 '시뮬레이터가 흉내 낼 수 없는 진짜 현장'으로 회귀한다.
그 현장을 한국만큼 많이, 또 정교하게 가진 나라가 드물다. 반도체 후공정, 2차전지 양극재 라인, 자동차 의장 공정에서 숙련공의 손이 수십 년간 축적한 동작 하나하나가 곧 학습 데이터다.
그러나 갤봇의 로봇이 베이징에서 커피를 파는 동안, 한국 제조 현장의 그 숙련 데이터는 아직 아무 모델에도 들어가지 않은 채 흩어져 있다. 광맥은 한국에 있는데, 금광을 캐서 자기 모델에 넣을 주체가 보이지 않는 것이 진짜 문제다. 합성 데이터로 출발선을 따라잡은 다음, 결승선을 가르는 것은 결국 누구도 복제할 수 없는 현장을 누가 먼저 데이터로 바꾸느냐의 여부가 될 것이다. 휴머노이드 데이터에 대한 투자가 절실한 시점이다.