애플, 대화형 AI 투자 늘렸다... 음성비서 경쟁 2라운드 개막

reporter-profile
박원익 2023.10.15 16:42 PDT
애플, 대화형 AI 투자 늘렸다... 음성비서 경쟁 2라운드 개막
(출처 : 디자인=장혜지)

대화형 AI 핵심은 ‘아이폰 & 시리’… 투자 확대 잰걸음
애플, 2011년부터 관련 기술 개발... 아이폰 신기능 탑재 기대
LLM 집중 4년 만의 성과… 구글 어시스턴트도 비슷한 움직임

애플이 고성능 대화형 AI 서비스 구축에 박차를 가하고 있다. 관련 예산을 확대 투입하며 대규모 언어모델(LLM) 기술 면에서 앞서 나가고 있는 구글, 마이크로소프트를 추격하는 양상이다.  

6일(현지시각) 디인포메이션에 따르면 애플은 최근 대화형 AI 구축을 위한 내부 예산을 하루에 수백만 달러로 확대하고 있다. 오픈AI가 선보인 AI 챗봇 ‘챗GPT(ChatGTP)’, 그리고 음성인식(automatic speech recognition, ASR) 모델 ‘위스퍼(Whisper)’ 같은 AI 시스템을 개발하기 위해서다. 

왜 중요한가… 음성비서, 대화형 AI 개발의 역사

애플이 대화형 AI 분야에 집중하는 이유는 ‘똑똑한 대화형 AI’가 애플 고객에게 새로운 사용자 경험을 제공할 수 있기 때문이다. 예컨대 애플 매출 비중의 약 50%를 책임지는 아이폰에 간단한 음성 명령으로 복잡한 작업을 수행하도록 돕는 새로운 기능을 추가할 수 있다. 

대화형 AI에 대한 애플의 투자는 오랜 역사를 가지고 있다. 애플이 AI 음성비서 시리(Siri)를 처음 발표한 건 지금으로부터 12년 전인 2011년이었다. 애플 시리는 아이폰 4s에 탑재, 큰 관심을 받았고 2014년 출시된 아마존 알렉사, 2016년 처음 등장한 구글 어시스턴트와 경쟁하며 꾸준히 발전해 왔다. 

문제는 이들 음성비서로 할 수 있는 일들의 한계가 뚜렷하다는 점이다. 사람의 목소리를 인식하고 응답한다는 점은 흥미롭지만, 마치 ‘룰베이스(Rule-based, 규칙 기반)’ 시스템처럼 작동하기 때문에 특정 명령, 예컨대 “음악 켜줘” 같은 중심으로만 활용돼 왔다. 

하지만, 생성형 AI의 등장으로 상황이 바뀌었다. AI 시스템이 지금까지의 음성비서 수준을 넘어 사람처럼 말하며 맥락을 이해하고, 응답할 수 있게 된 것이다. 

예를 들어, 발전된 생성 AI 모델을 활용하면 스마트폰에 탑재된 시리에 “최근 촬영한 사진 여러 장을 사용해 GIF 파일을 만들고, 그걸 친구에게 문자로 보내줘” 같은 복잡한 작업을 요청하는 게 가능해진다.

팀 쿡 애플 CEO. 애플은 오는 12일(현지시각) 아이폰 15 발표 이벤트를 앞두고 있다. (출처 : Gettyimages)

LLM 집중 4년 만의 성과… 구글 클라우드 활용 관측

디인포메이션에 따르면 애플의 이런 움직임은 관련 팀 구성이 승인된 지 4년 만에 나온 성과다. 애플의 머신러닝 및 AI 전략 부문 책임자인 존 지아난드레아(John Giannandrea) 부사장이 4년 전 LLM 및 대화형 AI 개발팀 구성을 승인했고, 그 사이 챗GPT가 등장하며 관련 서비스를 선보일 환경이 무르익었다는 것이다. 

현재 애플 내 LLM 및 대화형 AI 팀에는 구글 출신 엔지니어들도 다수 포진해 있다. 약 15년간 구글에서 일한 후 2021년 애플에 합류한 ‘대프니 르엉(Daphne Luong)’이 대표적이다. 

최근 애플이 ‘에이잭스(Ajax)’라는 자체 프레임워크를 설계, 챗GPT와 비슷한 AI 챗봇을 테스트하고 있다는 보도가 나오기도 했다. 블룸버그에 따르면 애플 내부 엔지니어들은 이 챗봇을 ‘애플GPT’라고 부르는 것으로 알려졌다. 

또 자체 프레임워크인 에이잭스는 구글의 기계학습 프레임워크인 ‘잭스(Jax)’를 토대로 만들어졌고, 구글 클라우드를 기반으로 운영되고 있는 것으로 전해진다. Jax에 애플의 A를 붙여 에이잭스라는 이름이 만들어졌다는 설명이다. 

구글은 구글 클라우드 기반의 AI 모델 및 애플리케이션 개발 서비스인 ‘버텍스AI’를 제공 중이다.

순다르 피차이 구글 CEO가 29일(현지시각) 샌프란시스코 모스코니 센터에서 열린 구글 클라우드 넥스트 2023에서 기조연설을 하고 있다. (출처 : Google)

더밀크의 시각: 구글도 비슷한 움직임… 음성비서 경쟁 새국면

디인포메이션에 따르면 애플이 개발한 가장 발전된 언어 모델인 Ajax GPT는 챗GPT의 엔진 역할을 하는 GPT-3.5를 능가하는 성능을 갖춘 것으로 알려졌다. 

애플은 구글의 AI 반도체 TPU(텐서 처리 장치)에 최저화된 AI 개발 프레임워크 ‘AXLearn’도 개발한 것으로 전해진다. Ajax GPT 훈련을 위해 AXLearn을 사용하는 것이다. TPU는 시장에서 판매되지 않고, 구글 클라우드를 통해서만 활용할 수 있다는 점에서 구글에 대한 의존도가 적지 않을 것이란 관측이 나온다. AXLearn은 현재 코드 저장소인 깃허브(GitHub)에서 확인할 수 있다. 

구글 역시 애플처럼 음성비서에 발전된 LLM 기술을 적용하려는 시도를 하고 있다. 지난 8월 16일 뉴욕타임스가 입수한 구글 자료에 따르면 구글의 AI 개발 조직 ‘구글 딥마인드(Google DeepMind, 구글 브레인과 딥마인드 통합 조직)’가 사용자에게 필요한 아이디어, 생활 조언(life advice), 계획 수립(planning), 학습 팁 등 제공하는 21가지 도구를 개발 중이다.  뉴욕타임스에 따르면 현재 구글 딥마인드가 테스트 중인 신기능은 구글의 음성비서인 ‘구글 어시스턴트’의 확장 및 업그레이드에 가깝다. 

애플과 구글이 동시에 비슷한 제품 개발에 나섬에 따라 음성비서 경쟁은 새로운 국면을 맞이하게 됐다. 애플은 스마트폰 플랫폼을, 구글은 클라우드 플랫폼이란 무기를 가졌다. 향후 두 기업이 새롭게 선보일 기능이 얼마나 큰 효용성, 만족감을 줄 수 있을지, 스마트폰 및 웨어러블 및 홈 디바이스에 얼마나 잘 녹아들어가 갈지 등이 음성비서 경쟁의 우열을 가르는 관건이 될 전망이다.

회원가입 후 뷰스레터를
주 3회 무료로 받아보세요!

단순 뉴스 서비스가 아닌 세상과 산업의 종합적인 관점(Viewpoints)을 전달드립니다. 뷰스레터는 주 3회(월, 수, 금) 보내드립니다.