대형언어모델

올해 출시될 프론티어급 LLM 10여개…”라마 3, GPT-4 능가할 수도” 

2024년 출시가 예정된 굵직한 대형언어모델(LLM)이 10여개가 넘는 것으로 나타났다. 상당수는 LLM 판도를 바꿀만한 중요한 모델이라는 지적이다. 미국 매체 미디엄은 3일(현지시간) 안나 매튜 공인인공지능재단(GSDC) 자문의 기고문을 통해 올해 AI 업계에 대한 예상을 내놓았다. 매튜 자문은 50개 이상의...

업스테이지, 사전학습 sLM ‘솔라’ 공개…”글로벌 LLM 대전 본격 참전”

업스테이지가 자체 개발 소형언어모델(sLM) ‘솔라(Solar)’를 공개했다. 특히 벤치마크 성적을 바탕으로 글로벌 빅테크들과의 경쟁에서 자신감을 내비쳤다.  인공지능(AI) 전문 업스테이지(대표 김성훈)는 솔라의 사양과 벤치마크 결과 등을 공개, 글로벌 대형언어모델(LLM) 대전에 본격 참가한다고 14일 밝혔다. 지난 8월 허깅페이스의 ‘오픈 LLM...

엔비디아, ‘한국 LLM 개발자 데이’ 온라인 개최

엔비디아는 12월4일 국내 대형언어모델(LLM) 개발자들을 위한 ‘한국 LLM 개발자 데이’를 온라인으로 연다고 27일 밝혔다. LLM 기반 애플리케이션 및 서비스를 구축하는 개발자에게 실무적인 지침을 제공하는 행사다. 개발자가 스스로 필요한 리소스와 도구를 얻을 수 있도록 기술과 지식...

미세조정 중 매개변수 줄이는 기술 등장…”비용 획기적으로 절감”

목적에 맞게 미세조정한 수천개의 대형언어모델(LLM)을 단일 GPU에서 실행할 수 있는 기술이 나왔다. 이를 통해 LLM 미세조정 및 미세조정 모델 실행 비용을 획기적으로 줄일 수 있을 전망이다. 벤처비트는 최근 스탠포드 대학교와 UC 버클리 대학교 연구진이 미세조정한...

아마존, 역대 최다 ‘매개변수 2조개’ LLM 훈련 중…빠르면 12월 발표

아마존이 2조개의 매개변수를 갖춘 대형언어모델(LLM)을 개발하고 있는 것으로 알려졌다. 이는 이제까지 알려진 LLM 가운데 매개변수가 가장 많은 것으로, AI로 클라우드 경쟁력을 강화하려는 의지가 담긴 것으로 알려졌다. 로이터는 8일(현지시간) 아마존이 코드명 ‘올림푸스(Olympus)’로 불리는 LLM을 개발 중이라고...

“고작 13억 매개변수로 GPT-4 대체”…MS, 오픈 소스 LMM 공개

마이크로소프트(MS)가 텍스트뿐 아니라 이미지를 이해하고 답변할 수 있는 멀티모달 언어모델 ‘파이-1.5(Phi-1.5)’를 공개했다. 놀라운 것은 매개변수가 고작 13억개(1.3B)에 불과한 경량 모델로, 훨씬 적은 비용과 시간으로 대형언어모델(LLM)에 맞먹는 결과를 얻을 수 있다고 주장했다. 세마포는 2일(현지시간) MS가 지난...

업스테이지, LLM 구축 앞서 저작권 해결 나섰다

업스테이지가 자체 대형언어모델(LLM) 학습에 사용할 데이터 라이선스 확보를 위해 수익 배분에 나선다. 이를 통해 한국어 데이터를 수집, 고성능의 LLM을 구축한다는 의도다. 업스테이지(대표 김성훈)는 한국어 데이터 부족 문제를 해결하고 고성능 LLM 개발을 위해 '1T 클럽’을 발족한다고 14일...

Recent posts

Popular categories

ASK ANA