Home Artificial Intelligence “LLM으로 사람의 미래까지 예측 가능”…덴마크공대, 미래 생성하는 모델 개발 

“LLM으로 사람의 미래까지 예측 가능”…덴마크공대, 미래 생성하는 모델 개발 

0
“LLM으로 사람의 미래까지 예측 가능”…덴마크공대, 미래 생성하는 모델 개발 

사람의 미래를 예측하는 영화 ‘마이너리티 리포트’ (사진=20세기 폭스)

언어를 생성하는 데 특화한 대형언어모델(LLM)로 사람들의 삶속에서 일어날 사건을 예측하는 데 성공했다는 연구 결과가 나왔다. 연구진은 통계에 기반으로 둔 사회과학이나 사용자의 움직임을 예측하는 알고리즘 등이 수행하는 이런 기술을 LLM이 해낼 수 있다는 점에 의미를 뒀다.

테크익스플로어는 18일(현지시간) 덴마크공과대학(DTU)과 코펜하겐대학교, 국제전기통신연합(ITU), 미국 노스이스턴대학교 등 연구진이 ‘라이프투벡(life2vec)’이라는 AI 모델을 개발, 사람들의 생활 패턴을 분석하고 예측하는 데 성공했다고 보도했다.

이에 따르면 연구진은 2008년 1월1일부터 2015년 12월31일까지 덴마크 국가에 등록된 600만명에 관한 사회, 경제 및 건강 데이터를 LLM에 학습했다. 여기에는 사람의 나이와 주거지를 포함해 직업, 소득 등이 포함돼 있다.

그다음 이를 기반으로 LLM이 사람들의 인생에서 어떤 사건이 일어났지는지를 출력하도록 했다. 여기에는 상황별 정보와 위치 정보가 결합, 어떤 장소에서 무슨 일이 일어났는지를 예측하는 것은 물론 사망 시간까지 예측하도록 했다. 

이 모델은 ‘4년 내 사망 확률’과 같은 사회과학 분야의 기존 연구 결과와 일치하는 결과를 내놓았다. 예를 들어 모든 조건이 동일하다면 리더십 위치에 있거나 소득이 높은 개인은 생존 가능성이 더 높은 반면, 남성이거나 정신 병력이 있는 사람은 사망 위험이 더 크다는 식이다.

연구진은 라이프투벡이 대규모 벡터 시스템으로 데이터를 인코딩, 출생 시간과 교육, 교육, 급여, 주택, 건강 등에 대한 데이터를 어디에 배치할지 결정한다고 설명했다.

라이프투벡 모델에 대한 개인 데이터 표현 설명도 (사진=arXiv)
라이프투벡 모델에 대한 개인 데이터 표현 설명도 (사진=arXiv)

논문 제1 저자인 수네 레만 DTU 교수는 “우리는 이 모델을 사용해 ‘과거의 조건과 사건을 기반으로 미래의 사건을 어느 정도 예측할 수 있을까’라는 근본적인 질문을 해결했다”라고 밝혔다. 특정 개인이 언제 사망할지까지도 예측할 수 있었다고 전했다.

하지만 연구자들은 예측 자체보다 ‘트랜스포머’ 구조의 LLM이 인간사를 생성해 낼 수 있었다는 점에 주목했다.

레만 교수는 “흥미로운 점은 AI가 언어에서 문장이 일련의 단어로 구성되는 것과 유사하게 인간의 삶을 긴 사건의 연속으로 간주한다는 것”이라며 “이는 AI 트랜스포머 모델이 사용하는 일반적인 작업 유형이지만, 우리 실험에서는 인간의 삶에서 일어난 사건을 분석하는 데 사용할 수 있었다”라고 밝혔다.

또 “이 모델을 사용하면 조기 사망률부터 성격의 미묘한 차이까지 다양한 결과를 예측할 수 있으며, 최첨단 LLM보다 훨씬 뛰어난 성능을 발휘한다”라며 “딥 러닝 모델을 해석하는 방법으로 알고리즘을 조사해 예측을 가능하게 하는 요소를 이해할 수 있었다”라고 전했다.

더불어 이 모델을 윤리적으로 올바르게 사용해야 한다고 주장했다. 예를 들어 특정 개인이 질병에 걸릴 위험이나 기타 예방 가능한 사건을 예측하기 위해서는 모델을 가동하기 전에 민감한 데이터나 개인 정보를 철저하게 보호하는 것은 물론 데이터의 편향성이 미치는 영향에 대해서도 깊은 이해가 있어야 한다고 강조했다.

레만 교수는 “이 모델은 긍정적이면서도 부정적인 몇가지 관점을 시사한다”라고 밝혔다.

단기적으로 인간 행동을 예측하는 기술은 SNS나 이커머스, 유튜브 등 콘텐츠 분야의 빅테크에서는 일반적이다. “이번 모델 개발은 이와 비슷하게 인간 행동을 예측하고 영향을 줄 수 있는 것으로, 이런 기술에 대해 심도있는 논의가 필요하다”라고 지적했다.

연구원들은 다음 연구 과제로 나이나 직업 등 개인 정보 이외에 텍스트나 이미지, 사회적 관계 등 다른 유형의 정보를 적용할 예정이다. 이를 통해 사회과학이나 보건 정보 등에서 새로운 결과를 얻을 수도 있다고 설명했다.

이번 연구 결과는 국제 학술지 ‘네이처’의 컴퓨터 사이언스에 18일 게재됐으며, 온라인 아카이브(arXiv)에서 확인할 수 있다.

임대준 기자 ydj@aitimes.com

LEAVE A REPLY

Please enter your comment!
Please enter your name here