언어 장벽 사라진다… 메타, 진화된 번역 AI ‘심리스M4T’ 공개

reporter-profile
박원익 2023.08.22 15:17 PDT
언어 장벽 사라진다… 메타, 진화된 번역 AI ‘심리스M4T’ 공개
(출처 : Shutterstock)

번역의 미래... “범용 번역기 가까워져”
심리스M4T로 뭘 할 수 있나… 5대 핵심 기능
메타 “오픈AI 위스퍼(Whisper V2) 능가” 주장
오픈AI 추격 계속된다... AI 모델 쏟아내

소설 ‘은하수를 여행하는 히치하이커를 위한 안내서’에 등장하는 범용 언어 번역기 ‘바벨 피쉬(Babel Fish)’가 현실화할까?’

메타가 22일(현지시각) 최대 100개 언어 번역 및 ‘전사(transcript)’를 수행할 수 있는 다국어 멀티모달(Multi-Modal, 다중모드) AI 모델 ‘심리스M4T(SeamlessM4T)’를 선보였다. 

오픈AI가 개발한 모델 ‘위스퍼(Whisper V2)’보다 음성-음성 번역(speech-to-speech translation), 음성-텍스트 변환(speech-to-text) 작업에서 우수한 성능을 보여준다는 게 메타 측 설명이다. 메타는 이 모델과 함께 총 27만 시간 분량의 음성 및 텍스트로 이뤄진 멀티모달 번역 데이터 세트 ‘심리스얼라인(SeamlessAlign)’도 함께 공개(CC BY-NC 4.0)했다. 

심리스얼라인은 현재까지 오픈소스로 공개된 비상업용 데이터 세트 중 최대 규모를 자랑한다. AI 업계에서는 심리스M4T의 등장으로 언어의 장벽이 더 빠르게 허물어질 수 것으로 예측하고 있다.

회원가입 후 뷰스레터를
주 3회 무료로 받아보세요!

단순 뉴스 서비스가 아닌 세상과 산업의 종합적인 관점(Viewpoints)을 전달드립니다. 뷰스레터는 주 3회(월, 수, 금) 보내드립니다.