“맥락 없으면 AI는 추측할 뿐”… 데이터브릭스 ‘지니 온톨로지’ AI 판 흔든다

reporter-profile
박원익 2026.06.16 12:18 PDT
“맥락 없으면 AI는 추측할 뿐”… 데이터브릭스 ‘지니 온톨로지’ AI 판 흔든다
알리 고드시 데이터브릭스 공동창업자 겸 CEO가 16일(현지시각) 샌프란시스코에서 열린 데이터 AI 서밋 2026에서 기조연설을 하고 있다. (출처 : 더밀크 박원익)

[데이터 + AI 서밋 2026] 알리 고드시 데이터브릭스 CEO 기조연설
“AGI 이미 왔지만, 아직 조직 안으로 스며들지 못해”
지니 원, ‘전사 AI 동료’로의 진화… 지메일·슬랙 데이터도 연결
지니 에이전트, 대화 한 번으로 자율형 에이전트 생성
‘실시간 맥락’ 엔진 지니 온톨로지... 정답률 압도
더밀크의 시각: ‘AI 데이터’ 접근성 확장된다

AGI(인공일반지능)는 이미 왔지만, 아직 조직 안으로 스며들지는 못했습니다. 여러분의 회사에서 수백 개의 에이전트(agent, 대리인)가 여러분을 위해 일하고 있지 않죠. 우리가 해야 할 일은 AI가 실제로 작동하게 만드는 방법을 찾는 것입니다.
알리 고드시 데이터브릭스(Databricks) CEO

알리 고드시(Ali Ghodsi) 데이터브릭스 공동창업자 겸 CEO는 16일(현지시각) 미국 샌프란시스코에서 개막한 ‘데이터 + AI 서밋 2026’ 기조연설에서 “조직의 모든 데이터, 프로세스, 직원들의 머릿속에 있는 지식을 어떻게 AI에 맥락으로 제공하느냐가 중요하다”며 “똑똑한 AI 모델들에 좋은 맥락만 제공하면 AI가 기업 내부에서 놀라운 일을 할 수 있다”고 강조했다. 

기업이 AI를 제대로 활용하지 못하고, AI 기반 혁신을 만들어 내지 못하는 가장 큰 병목은 ‘데이터 맥락(data context)’이라는 주장이다. 데이터브릭스는 전 세계에 2만 개 이상의 기업 고객을 보유하고 있는 글로벌 데이터 AI 기업이다. 포춘 500대 기업의 70%가 데이터브릭스 플랫폼을 사용하고 있다.

고드시 CEO는 “맥락이란 조직 안에 있는 모든 데이터를 어떻게 AI와 연결할 것인가의 문제다. 예를 들어 회의록도 데이터이므로 모든 회의는 기록돼야 하고, 전사본이 만들어져야 한다”며 “이를 가능하게 하려면 프로세스를 재구성해야 한다. 데이터브릭스에는 현장 배치 엔지니어(FDE, Forward Deployed Engineer)들이 있어서 이런 재구성을 돕는다”고 했다. 

오늘날 대부분의 엔터프라이즈(enterprise, 기업용) AI는 ‘자신감 넘치는 추측(guessing with false confidence)’에 불과하다는 게 고드시 CEO의 지적이다. 충분한 맥락이 없는 상황에서 AI가 부정확한 결과를 매우 자신감 있게 정답으로 제시하는 경우가 많다는 것. 

데이터브릭스는 이런 문제를 해결하기 위해 이날 새로운 기업용 AI 제품군을 대거 공개했다. 핵심은 세 가지다. 모든 임직원이 사용할 수 있는 AI 동료 ‘지니 원(Genie One)’, 누구나 자율형 AI 에이전트를 만들 수 있는 ‘지니 에이전트(Genie Agents)’, 그리고 이 둘의 두뇌 역할을 하는 맥락 엔진 ‘지니 온톨로지(Genie Ontology)’다.

에이전틱 동료(Agentic Coworker) 데이터브릭스 지니 원 화면 (출처 : Databricks)

지니 원, ‘전사 AI 동료’로의 진화… 지메일·슬랙 데이터도 연결

지니 원은 데이터브릭스가 기존에 제공하던 대화형 분석 도구 지니를 전면 개편한 제품이다. 기존 지니가 데이터브릭스 플랫폼 안에 저장된 데이터에 대한 자연어 질의응답에 국한됐다면 지니 원은 조직 내외부의 모든 데이터에 연결하는 것을 목표로 한다.

지니 원은 데이터브릭스 레이크하우스 페더레이션, 레이크플로우 커넥트와 구글 지메일·슬랙·마이크로소프트 팀즈 등 일상적인 업무 도구의 양방향 통합을 통해 기업 전체의 데이터 자산에서 인사이트를 추출하고 업무를 자동화할 수 있도록 설계됐다. 

고드시 CEO는 기조연설에서 “예를 들어 10만 명의 임직원이 있는 조직이라도 누구나 로그인 만으로 지니 원을 이용할 수 있다”며 “데이터 웨어하우스나 데이터브릭스의 다른 인프라에 접근하는 것이 아니라 단순한 인터페이스에서 질문을 던지면 된다”고 설명했다. 

지니 원은 웹 브라우저뿐 아니라 아이폰 앱(iOS) 및 안드로이드 앱으로도 이용할 수 있다. 임직원들은 모바일에서도 그래프·차트 형태의 시각적 답변을 받거나 알림을 설정하는 등 언제 어디서든 데이터 기반 업무를 수행할 수 있게 된다. 

실제 도입 기업의 반응도 공개됐다. 미국 슈퍼마켓 체인 앨버트슨스(Albertsons Companies)는 상품 기획자들이 자연어로 복잡한 상품 데이터를 탐색하고, 가격·프로모션·상품 배치 등 4가지 핵심 요소에 걸친 의사결정을 더 빠르고 명확하게 내릴 수 있도록 지니를 활용하고 있다. 

스포츠용품 소매업체 풋 로커(Foot Locker)는 “지니 에이전트가 경영진과 사업 팀에 북미 전 브랜드에 걸친 AI 기반 인사이트를 제공하는 허브가 되고 있다”며 "데이터와 상호작용하고 중요한 의사결정을 내리는 방식 자체가 바뀌고 있다”고 했다.

지니 에이전트, 대화 한 번으로 자율형 에이전트 생성

지니 에이전트는 기존 ‘지니 스페이스(Genie Spaces)’를 발전시킨 제품이다. 데이터브릭스 고객들은 지금까지 100만 개 이상의 지니 스페이스를 만들어왔다. 이번에 이를 자율 실행 가능한 에이전트로 진화시켰다.

지니 에이전트는 지니 원 또는 지니 코드(Genie Code, 데이터 엔지니어링 에이전트)에서 프롬프트 하나만으로 생성할 수 있으며 구조화 데이터와 비구조화 데이터 모두 추론할 수 있다. MCP(모델 컨텍스트 프로토콜) 연결·예약 작업·문서 생성·외부 시스템 쓰기 등 다단계 워크플로도 사람의 개입 없이 완료할 수 있다. 

고드시 CEO는 “에이전트가 매일 세일즈포스(영업, 마케팅, 고객 서비스 등 CRM 도구)에서 정보를 가져와 준비하고 워크데이(Workday, HR 도구)에 넣은 뒤 보고서를 보내고 다른 에이전트와 협업하는 것까지 처리할 수 있다”고 했다.  

데이터브릭스는 데이터 파이프라인과 머신러닝 모델을 24시간 자율 모니터링, 오류를 감지하면 별도 환경에서 수정 코드를 테스트한 뒤 승인 요청을 보내는 ‘지니 제로옵스(Genie ZeroOps)’도 이날 함께 발표했다. 지니 제로옵스는 데이터 + AI 서밋 이후 프라이빗 프리뷰(비공개 사전 접속)로 제공될 예정이다.

알리 고드시 데이터브릭스 CEO는 AI 모델 성능을 볼 때 이미 AGI(인공일반지능)은 도래했지만, 기업 내에 적용인 안 되고 있다고 강조했다. (출처 : 더밀크 박원익)

‘실시간 맥락’ 엔진 지니 온톨로지... 정답률 압도

지니 온톨로지는 지니 원과 지니 에이전트의 정확도를 뒷받침하는 핵심 기술이다. 지니 온톨로지는 데이터브릭스 플랫폼은 물론, 50개 이상의 외부 업무 도구와 데이터 시스템에 연결해 테이블·쿼리·대시보드·파이프라인·파일·티켓·채팅·회의 내용 등 전방위에서 기업 지식을 자동으로 추출하고 지속적으로 업데이트하는 실시간 맥락 레이어로 작동한다. 

구글 드라이브, 지라(Jira), 슬랙, 컨플루언스(Confluence), 셰어포인트(SharePoint) 등을 연동할 수 있다.

지니 온톨로지의 핵심 혁신 중 하나는 ‘권위 판단 방식’이다. 구글의 페이지랭크(PageRank)와 유사한 접근법을 활용, 특정 정의가 어디서 왔는지, 해당 출처 작성자의 권위가 어느 정도인지, 얼마나 자주 참조되는지, 인증된 데이터 자산과 얼마나 밀접하게 연결돼 있는지, 얼마나 최신 정보인지 등을 종합적으로 평가해 가장 신뢰할 수 있는 출처에서 답변을 생성한다. 

성능 벤치마크도 공개됐다. 데이터브릭스 내부 벤치마크에서 지니는 실제 기업 데이터 분석 과제에 대한 첫 번째 시도에서 정답률 84.5%를 기록했다. 가장 강력한 범용 코딩 에이전트(52.4%)와 비교해도 매우 높은 정확도다. 

속도 면에서도 지니는 가장 강력한 코딩 에이전트보다 2배 빨랐다. 이 벤치마크는 2026년 6월 기준 28개 실제 데이터 분석 과제로 구성됐으며 경쟁 에이전트는 익명으로 처리됐다. 

지니는 좌석(account, 어카운트) 기반 가격 정책을 적용하지 않으며 조직은 사용자 1인당 매월 최대 10달러의 무료 크레딧을 활용할 수 있다. 이번 데이터 AI 서밋 행사는 역대 최대 규모로 열렸다. 174개국에서 10만 명 이상이 등록했으며 현장 참석자는 약 3만 1309명으로 집계됐다.

지니 온톨로지 작동 화면 (출처 : Databricks)

더밀크의 시각: 기업 내 누구에게나 ‘AI 데이터’ 접근성 확장된다

데이터브릭스는 기존 데이터 엔지니어·데이터 과학자 중심의 플랫폼에서 마케팅·재무·영업 등 일반 비즈니스 사용자까지 AI 데이터 접근성을 확장하는 전략적 전환을 공식화했다. 

지니 원이 세일즈포스의 아인슈타인, 마이크로소프트 코파일럿, SAP의 줄 등 기업용 AI 어시스턴트 시장 주요 플레이어들과 직접 경쟁하게 될 것이란 게 업계 관측이다. 

특히 데이터브릭스는 특정 벤더 생태계에 종속되지 않는 오픈 레이크하우스 아키텍처 위에서 멀티 클라우드·멀티 모델 환경을 지원한다는 강점이 있다. 

“우리에게는 더 똑똑한 AI가 아니라 기업 맥락이 AI에 제대로 연결되는 AI가 필요하다"고 강조한 알리 고드시 CEO의 주장처럼 데이터 관리, 맥락 유지 차원에서 경쟁력을 가지고 있는 것이다. 

실제로 AI 도입, AX(AI 전환)는 AI 모델의 성능이 아니라 기업의 데이터 자산 자체에서 성패가 갈리고 있다. 엔터프라이즈 AI 시장의 경쟁 축이 ‘데이터 맥락의 품질과 거버넌스’로 이동하는 추세는 앞으로 더 강화될 전망이다.  

한국 기업이 얻을 수 있는 시사점도 크다. 삼성전자·SK하이닉스·현대자동차·LG 등 국내 주요 기업들은 방대한 데이터를 축적하고 있지만, AI가 실시간으로 활용 가능한 형태로 데이터를 통합하는 데 여전히 어려움을 겪고 있기 때문이다. 

데이터브릭스의 지니 온톨로지가 제시한 맥락 자동화 접근법은 사내 데이터 거버넌스와 보안 정책을 유지하면서도 AI의 실질적 업무 활용도를 높이려는 국내 기업들에 구체적인 기술 경로를 제시한다. 

데이터 전문 인력이 부족한 중견·중소기업의 경우 비개발자도 AI 에이전트를 생성하고 공유할 수 있는 지니 에이전트 같은 환경이 AI 내재화의 현실적인 진입점이 될 수 있다.

더밀크 인뎁스 리포트 토큰 팩토리 혁명 (출처 : 더밀크)

회원가입 후 뷰스레터를
주 3회 무료로 받아보세요!

단순 뉴스 서비스가 아닌 세상과 산업의 종합적인 관점(Viewpoints)을 전달드립니다. 뷰스레터는 주 3회(월, 수, 금) 보내드립니다.