추론

Artificial Intelligence

LLM 추론 속도 300배까지 향상…’패스트 피드 포워드’ 아키텍처 공개

신경망에서 추론을 위해 활성화되는 뉴런의 수를 최소화하는 새로운 딥러닝 아키텍처가 나왔다. 이를 통해 대형언어모델(LLM)의 추론 속도와 비용을 최대 300배까지 줄였다고 밝혔다. 벤처비트는 24일(현지시간) 취리히 연방 공과대학교 연구진이 LLM의 기반이 되는 트랜스포머 신경망의 피드 포워드 레이어에서 추론에...

ASK ANA - November 27, 2023

Artificial Intelligence

MS, 실수를 통해 배우는 AI 학습 방법 ‘르마’ 공개

인간처럼 실수를 통해 배우는 새로운 인공지능(AI) 학습 방법이 나왔다. 벤처비트는 3일(현지시간) 마이크로소프트(MS) 리서치 아시아와 북경대학교, 시안 자오퉁 대학교 등 연구진이 공동으로 인간처럼 실수를 통해 학습함으로써 대형언어모델(LLM)의 능력을 향상하는 기술 ‘르마(LeMa)’를 공개했다고 보도했다. 이에 따르면 연구진은 르마를...

ASK ANA - November 12, 2023