Home Artificial Intelligence 메타, 100개 언어 실시간 음성 번역하는 AI 모델 출시

메타, 100개 언어 실시간 음성 번역하는 AI 모델 출시

0
메타, 100개 언어 실시간 음성 번역하는 AI 모델 출시

(사진=셔터스톡)

메타가 최대 100개 언어를 실시간 번역하고 기록할 수 있는 인공지능(AI) 모델을 출시했다. 이 모델은 실시간으로 언어 간 의사소통을 가능하게 하는 도구의 기반이 될 전망이다. 

메타는 ‘심리스M4T(SeamlessM4T)’라는 이름의 새로운 언어 번역 AI 모델을 출시한다고 22일(현지시간) 블로그를 통해 밝혔다.

‘대규모 다국어 및 멀티모달 기계 번역’을 뜻하는 이 AI 모델은 거의 100개 언어에 대한 음성과 텍스트를 원활하게 번역하고 기록할 수 있다. 다만 메타는 지원 언어는 공개하지 않았다.

심리스M4T 모델은 ▲100개 언어 음성 인식 ▲100개 언어 간 음성-텍스트 변환 ▲100개 언어 간 텍스트-텍스트 번역 이외에도 ▲100개 언어와 35개 언어 간 음성-음성 번역 ▲100개 언어와 35개 언어 간 텍스트-음성 번역을 지원한다. 음성 및 텍스트 입력에 대해 음성으로 대답하는 경우가 35개 언어이며, 텍스트로 대답하는 경우는 100개 언어라는 이야기다. 

메타 측은 “이전에는 서로 다른 모델에서만 사용할 수 있었던 기술을 결합해 100개 언어를 지원할 수 있도록 했다”며 “이는 언어 차이를 넘어 실시간 의사소통을 가능하게 하는 기반이 될 것”이라고 강조했다.

(사진=메타)
(사진=메타)

심리스M4T는 총 47만시간 이상의 음성 및 텍스트 정렬 데이터로 구축한 ‘심리스얼라인(SeamlessAlign)’이라는 멀티모달 데이터셋을 통해 학습했다. 텍스트 데이터는 위키피디아, 뉴스 소스, 대본화된 연설 등에서 추출된 문장들에서 나왔으며, 음성 데이터는 공개적으로 사용 가능한 웹데이터에서 얻은 400만 시간의 원본 오디오로부터 수집됐다. 다만, 메타는 사용된 저장소나 오디오 클립의 출처는 명시하지 않았다. 

마크 저커버그 메타 CEO는 이 AI 모델을 “페이스북, 인스타그램, 왓츠앱, 메신저, 스레드에 통합할 것”이라며 “메타가 막대한 투자를 하고 있는 메타버스에서 전 세계 이용자들의 상호 소통을 용이하게 할 것”이라고 말했다.

메타는 대형언어모델(LLM) ‘라마(LLaMA)’나 다른 AI 모델처럼 심리스M4T도 비상업적인 용도로 일반에 오픈소스 공개할 예정이다.

저커버그 CEO는 “AI 모델 이용에 대한 요금을 부과하는 것보다 오픈소스로 일반에 제공하는 것이 더 많은 것을 얻을 수 있다”며 “개방형 AI 생태계가 메타에는 더 낫다”고 말했다.

박찬 기자 cpark@aitimes.com

LEAVE A REPLY

Please enter your comment!
Please enter your name here