이틀간 펼쳐진 AI 쇼케이스 : AI가 인간 행동도 추적하기 시작했다

reporter-profile
권순우 2024.05.14 19:35 PDT
이틀간 펼쳐진 AI 쇼케이스 : AI가 인간 행동도 추적하기 시작했다
데미스 하사비스 구글딥마인드 CEO가 구글의 AI 에이전트 '프로젝트 아스트라'를 공개하고 있다 (출처 : 구글)

[구글I/O 2024]
구글과 오픈AI 다중모드 비전... "놀랍도록 닮았다" 평가
"구글과 오픈AI 잇따른 AI 선점... 애플과 아마존을 위축"
구글 자신감 회복한 듯... 애플 개발자 콘퍼런스 주목

5월 13일과 14일에 열린 구글의 '구글 I/O'와 오픈AI의 '스프링 업데이트'를 통해 AI 기술과 비즈니스의 미래를 엿볼 수 있었다. 구글은 제미나이의 업그레이드 버전을 선보이며 AI 기술을 활용한 다양한 기능을 선보였고, 오픈AI는 GPT-4o를 공개하며 AI 업계의 선두주자로서의 입지를 굳건히 했다.

두 회사는 AI 에이전트를 개발하려는 목표를 공유하며, 이를 통해 인간의 언어와 행동을 이해하고 행동하도록 하는 것을 목표로 삼았다. 또한, 구글은 다중모드 AI 모델을 강조하며 인공 일반지능을 향해 나아가는 열쇠로 물리적 세계에 대한 이해를 강조했다.

한편, 애플의 'WWDC'를 주목해야 한다고 언급되며, 애플이 AI 분야에서 어떻게 발전할지에 대한 기대감이 높아지고 있다. [AI요약 by 구버]

5월 13일과 14일, 양일간 오픈AI와 구글이 각각 '스프링 업데이트'와 '구글I/O'를 통해 미래 산업 구도를 좌우할 최신 AI 기술과 비즈니스를 선보였다. '지상 최대 AI쇼' 였다는 평가다.

구글은 14일(현지시간) 미 캘리포니아주 마운틴뷰 쇼어라인 엠피시어터에서 연례 개발자 회의(I/O)를 열고, 자사의 인공지능 모델 '제미나이'의 업그레이드 버전을 꺼내 들었다. 구글 검색 기능에 제미나이를 탑재해 복잡한 검색을 쉽게 만들고, 카메라에 담긴 사진과 영상을 보고, 질문에 답을 해주는 멀티모달 기능이 특징이다.

이에 앞서 오픈AI는 듣고 말하는 'GPT-4o'를 공개, 세상을 깜짝 놀라게 했다.

구글은 독자 기술과 플랫폼을 기반으로 성장 동력을 만들어내려고 하고 있다. 반면 오픈AI는 마이크로소프트(MS), 애플 등 다른 빅테크 기업들과의 '합종연횡'을 통해 시장을 선점하고 있다. 생성AI가 등장한 지 불과 2년이 채 안된 시점에서 AI 분야 최고 선두주자인 구글과 오픈AI 본격 경쟁이 막이 올랐다.

구글과 오픈AI, 비전은 같다 : AI 에이전트 개발

구글과 오픈AI가 추구하는 공통점은 같았다. 바로 인간의 말을 알아듣고 생각을 유추해내며 행동을 유도하는 'AI 에이전트'를 만들겠다는 것이다. 와이어드는 "구글과 오픈AI가 해당 기술로 이동하는 것은 생성AI의 새로운 시대를 의미한다"고 평가했다.

구글 I/O에서 공개된 구글의 새로운 기술 중에는 딥마인드의 '프로젝트 아스트라(Project Astra)'에 대한 관심이 집중됐다. 아스트라는 구글의 새로운 음성 작동 AI 비서로 휴대전화의 카메라가 보는 화면을 이해할 수 있는 기술이다. 음성 명령에 응답해 장치의 카메라를 통해 사물과 장면을 이해하고 자연어로 대화할 수 있다.

와이어드는 프로젝트 아스트라에 대해 "새로운 챗GPT에 대응한 구글의 '멀티모달' 답변"이라고 해석했다. 매체는 "AI의 미래에 대한 구글의 비전은 오픈AI가 전날 선보인 비전과 놀랍도록 유사하다"고 평가했다.

앞서 오픈AI는 음성을 통해 신속하게 대화하고, 스마트폰 카메라나 컴퓨터 화면을 통해 인식한 것들을 대화할 수 있는 챗GPT의 새로운 인터페이스를 공개한 바 있다. 인간적인 목소리와 감정적인 톤을 사용하면서 감정을 시뮬레이션하는 기술로 업계를 놀라게 했다.

AI와 로봇 공학을 연구하고 있는 MIT 조교수 풀킷 아그라왈은 "다중모드 AI 모델이 얼마나 빠르게 발전했는지를 보여준다"고 언급했다. 다만 "유용성에 있어서는 명확하지 않다"고 말했다.

AGI는 멀었다

하지만 양사가 추구하는 인공 일반지능(AGI) 도달에 대해서는 아직 멀었다는 의견도 나온다.

브렌든 레이크 뉴욕대 부교수는 "주변의 물리적 세계에 대한 정신적 모델을 구축할 수 있는 능력은 더욱 인간과 유사한 지능을 구축하는 데 절대적으로 중요하다"며 "현재 AI 모델 대부분이 책과 웹에서 나온 텍스트 중심이기 때문에 언어 중심적"이라고 설명했다. 그는 "인간이 물리적 세계와 상호작용하면서 언어를 배우는 방식과는 다르다"고 부연했다.

데미스 허사비스 딥마인드 CEO는 "AI 모델에 물리적 세계에 대한 더 깊은 이해를 부여하는 것이 AI의 발전과 프로젝트 아스트라와 같은 시스템을 더욱 강력하게 만드는 열쇠가 될 것"이라고 강조했다. 이어 "다중 모드 범용 에이전트 어시스턴트는 인공 일반지능을 향한 일종의 궤도에 있다"고 덧붙였다.

구글 자신감 회복한 듯... 애플 WWDC 주목

디인포메이션은 'AI 과대광고(Hype)' 시즌이 계속되고 있다고 평가했다. 매체는 "구글은 I/O를 통해 인공지능 분야에서 전진하는 모든 방법을 선보였다"며 "구글 제품에 AI가 도입되지 않은 분야는 없는 것 같다"라고 분석했다.

구글의 현재 스탠스가 오픈AI가 챗GPT를 처음 공개했을 당시와는 달리 자신감을 회복했다는 평가도 나온다. 디인포메이션은 "새로 공개된 많은 제품과 기능에서 오픈AI, 퍼플렉시티(Perplexity) 등 많은 AI 스타트업을 따라잡는 것처럼 보인다"며 "구글 I/O를 통해서 본 구글은 자신의 위치에 대해 자신감을 갖고 있는 것처럼 보인다"라고 평가했다.

그러면서 "AI 분야에서 한발 더 나아가는 빅테크 기업의 모습을 확인하려면 애플의 다가오는 개발자 콘퍼런스를 주목해야 할 것"이라고 덧붙였다.

팀쿡 애플 CEO와 샘 알트먼 오픈AI CEO

"구글과 오픈AI가 애플과 아마존을 위축시켰다"

포춘은 "구글의 제품 발표에 앞서 자사의 제품 출시로 뉴스 흐름을 뺏으려는 오픈AI의 노력은 이번에도 마찬가지였다"라고 전했다. 특히 "모든 챗GPT 사용자에게 GPT-4o를 무료로 제공하면서도 저렴하게 모델을 제공한다는 측면의 기술적인 혁신이 인상적"이라고 설명했다.

포춘지는 "구글은 제미나이 1.5 프로 모델을 개선해 더 자연스러운 음성 대화, 오디오, 이미지에 대한 더 나은 이해, 더 논리적인 추론, 계획 능력, 그리고 더 나은 컴퓨터 코드 생성을 제공한다"면서 의미 부여했다.

포춘지는 오픈AI와 구글의 이번 발표가 명확하게 "애플과 아마존을 위축시켰다"라고 강조했다. 적어도 AI 경쟁 측면에서는 빅테크 경쟁에서 양사가 앞서나가고 있다는 의미다.

포춘지는 "오픈AI가 지금까지 소개한 대부분의 사용 사례는 부모들을 비롯해 도움이 되는 것으로 보인다"며 "이런 어시스턴스 기능이 널리 사용되는 필수 제품이 될 것인지 여부는 불분명하다"라고 분석했다. 이어 "실생활의 개인비서는 절대적으로 필요하다. 온라인 식료품을 구매하거나 보험 양식을 작성하거나, 휴가를 예약하는 등의 개인비서는 진정한 킬러 앱으로 자리 잡을 수 있다"라고 전망했다.

개발자대회에서 보여준 시연(데모)이 실제 서비스에서 구현됐을 때 실망감을 주는 사례가 적잖다. 오픈AI와 구글이 실제 어떤 영향을 줄지는 좀 더 두고봐야 한다는 지적도 나온다.

회원가입 후 뷰스레터를
주 3회 무료로 받아보세요!

단순 뉴스 서비스가 아닌 세상과 산업의 종합적인 관점(Viewpoints)을 전달드립니다. 뷰스레터는 주 3회(월, 수, 금) 보내드립니다.