Home Artificial Intelligence UAE서 아랍어 LLM 출시…’팰컨’ 이어 두번째

UAE서 아랍어 LLM 출시…’팰컨’ 이어 두번째

0
UAE서 아랍어 LLM 출시…’팰컨’ 이어 두번째

(사진=세레브라스)

아랍에미리트(UAE)에서 두번째 오픈 소스 대형언어모델(LLM)이 등장했다. ‘자이스(Jais)’라는 이 모델은 지난 5월에 등장한 ‘팰컨’에 이어 3개월 만에 나온 UAE산 LLM이다.

로이터는 30일(현지시간) UAE의 연구진 및 엔지니어 그룹이 미국 스타트업 세레브라스와 협력, 아랍어 기반의 LLM 자이스를 선보였다고 보도했다. 

이에 따르면 자이스는 세레브라스와 무함마드 빈 자예드 인공지능 대학교, UAE 기술 대기업 G42 자회사인 인셉션 등이 협력해 개발했다. 

특히 세계적인 GPU 부족으로 세레브라스가 개발한 슈퍼컴퓨터 ‘콘돌 갤럭시(Condor Galaxy)’의 지원을 받았다. 앤드류 펠트먼 세레브라스 CEO는 “이 모델은 매개변수 130억개로, 훈련에는 고작 3.5일이 걸렸다”라며 컴퓨팅 능력을 자랑했다.

자이스는 UAE에서 가장 높은 산인 ‘제벨 자이스(Jebel Jais)’에서 따온 말로, 특히 아랍어와 영어로 학습한 LLM이라는 점을 강조했다. 

아랍어를 지원하는 LLM이 없기 때문에 개발을 시작했으나, 아랍어 데이터 부족으로 LLM 학습에 애를 먹은 것으로 알려졌다.

따라서 티모시 볼드윈 무함마드 빈 자예드 인공지능대학 교수는 영어 데이터의 컴퓨터 코드를 활용했다고 밝혔다. 그는 “코드는 논리적 단계를 설명하기 때문에 추론 능력 측면에서 모델에 큰 도움을 줬다”고 밝혔다.

또 세레브라스는 3개의 모델을 더 생산하기로 합의했다고 발표했다. 이중 1개는 올해 말에, 나머지 2개는 내년에 개발을 마칠 예정이다.

한편 UAE 아부다비 정부의 첨단기술연구위원회(ATRC) 소속인 기술혁신연구소(TII)는 지난 5월 LLM ‘팰컨 40B’ 및 7.5B, 1.3B 모델 등을 오픈소스로 공개해 눈길을 끌었다.

40B 모델은 허깅페이스의 오픈소스 LLM 순위 1위를 차지하는 등 인기를 얻었다. 자이스 역시 오픈 소스 모델이다.

또 UAE는 올 초 유엔이 발표한 ‘2023년 프론티어 기술 준비 지수’에서 5계단 상승한 37위로, 아랍권 최고 자리에 올랐다. LLM의 잇단 공개로 입지를 더욱 굳히게 됐다.

임대준 기자 ydj@aitimes.com

LEAVE A REPLY

Please enter your comment!
Please enter your name here