개인 개발자와 인공지능(AI) 스타트업 중심으로 시작된 '오픈 Ko-LLM 리더보드'에 대기업과 비전문 AI 기업이 속속 가세하고 있다. 이번 주에도 AI 업계에서는 낯선 두곳에 상위권에 진입했다.
업스테이지와 한국지능정보사회진흥원(NIA)이 공동으로 주최하는 이번 주 리더보드에는 금융 솔루션 전문 인스웨이브시스템즈(대표 어세룡)와 종합...
업스테이지와 한국지능정보사회진흥원(NIA)이 공동으로 주최하는 '오픈 Ko-LLM 리더보드' 11월 3주 순위에서는 다수의 개발자가 '직접 선호 최적화(DPO, Direct Preference Optimization)'로 좋은 성적을 거뒀다.
DPO는 지난 5월 스탠포드대학교 연구진이 발표한 강화 학습법이다. '챗GPT'에 사용한 인간 피드백을 통한 강화...