학습 데이터

업스테이지, LLM 구축 앞서 저작권 해결 나섰다

업스테이지가 자체 대형언어모델(LLM) 학습에 사용할 데이터 라이선스 확보를 위해 수익 배분에 나선다. 이를 통해 한국어 데이터를 수집, 고성능의 LLM을 구축한다는 의도다. 업스테이지(대표 김성훈)는 한국어 데이터 부족 문제를 해결하고 고성능 LLM 개발을 위해 '1T 클럽’을 발족한다고 14일...

오픈AI, LLM 학습 데이터 긁어 모으는 ‘GPT봇’ 출시…차단 방법도 공개

오픈AI가 인터넷 콘텐츠를 긁어내 대형언어모델(LLM) 학습에 사용하는 'GPT봇(GPTBot)'을 조용히 출시했다. 더불어 GPT봇을 차단하는 방법도 공개했는데, 저작권 문제에 대비하는 것에 불과하다는 분석이 나왔다. 매셔블과 벤처비트 등은 8일(현지시간) 오픈AI가 별도 발표나 보도자료 배포 없이 홈페이지를 통해 GPT봇의...

Recent posts

Popular categories

ASK ANA