Home Artificial Intelligence 박정호 알에스엔 연구소장 “AI 핵심인 빅데이터 분석 20년…생성 AI로 도약 준비”

박정호 알에스엔 연구소장 “AI 핵심인 빅데이터 분석 20년…생성 AI로 도약 준비”

1
박정호 알에스엔 연구소장 “AI 핵심인 빅데이터 분석 20년…생성 AI로 도약 준비”

박정호 알에스엔 연구소장이 고양시 일산서구 사무실 앞에서 포즈를 취하고 있다.

인공지능(AI) 모델 구축에서 ‘데이터’가 중요하다는 사실은 설명이 필요 없을 정도로 잘 알려져 있다. AI 모델을 어떤 데이터로 학습했느냐는 성능과 직결된다.

그래서 알에스엔(RSN, 대표 배성환)은 생성 AI 시대를 맞아 자신감을 보이고 있다. 이 회사는 2004년 설립 이후 20년간 B2B 데이터 분석에 집중해 온 대표 빅데이터 업체다.

박정호 알에스엔 연구소장은 “회사의 장점인 데이터 분석을 통해 그동안 AI 분야에서 의미 있는 성과를 거둬 왔다”며 “이제는 생성 AI 기능까지 더해, 본격적인 기업용 생성 AI 서비스에 나설 것”이라고 밝혔다.

박 소장은 회사의 강점을 이제까지 무려 1800억건이나 누적한 데이터로 꼽았다. “하지만 정보의 핵심은 정확성과 실시간성”이라며 “이를 고도화하는 데이터 분석의 역할이 사실 핵심”이라고 강조했다.

“사업 초기에는 뉴스가 주를 이뤘으나, SNS와 블로그는 물론 틱톡 등 영상 매체까지 등장하면서 데이터양이 폭발적으로 늘어났다”고 지적했다. 이에 따라 ‘비정형 구어체’ 분석의 고도화 및 전문화가 필요하다고 전했다.

비정형 구어체란 표준어가 아닌 인터넷 용어를 의미한다. 오탈자나 복합명사, 동의어와 신조어 등을 개별 분석해서 정형화하지 않으면, 무의미한 데이터가 될 수 있다. “기사와는 달리 각종 커뮤니티나 웹사이트, 플랫폼은 각각 주로 사용하는 언어나 말투가 다르고 비정형 특성이 크다”고 설명했다. 

또 기업 입장에서는 사업 특성에 따라 필요 데이터가 다르고, 분야별로 맞춤 분석이 필요하다.

알에스엔의 특기는 바로 ‘맞춤 분석형 AI 모델 구축’이다. 자체 개발 AI 모델 ‘루시LLMs’은 3억개의 말뭉치를 학습한 비정형 구어체 전문 모델이다. 일반적으로 AI 기업들은 알고리즘과 데이터 라벨링, ML옵스(MLOps) 등에 집중하지만, 알에스엔은 더 근본적인 데이터 자체를 20년간 파고들었다. 요즘 유행인 ‘전문적인 데이터로 AI를 학습했다’는 말은 이 회사의 주특기다.

이런 탓에 실제 산업에 맞춰 깊이 있는 서비스가 가능하다고 밝혔다.

실제로 한 글로벌 화장품 업체는 유저의 다양한 피드백에 대한 수요가 높았다. 그래서 비정형 데이터를 위주로 ‘해당 브랜드 언급량’ ‘부정적 및 긍정적 피드백 구분’ ‘타 동종 브랜드와의 대중 인식 비교’ ‘가장 언급이 많은 제품군’ ‘핵심 키워드 정리’ 등의 항목을 그래프와 텍스트, 수치 등 다양한 형태로 보여 주는 형태로 모델을 구축했다. 비슷한 핵심 키워드라도 비중에 따라 단어나 표현의 크기를 다르게 표현하는 식으로 UI, UX도 개발했다. 

반면 대기업은 제품 피드백 뿐만 아니라 시장 및 사업 동향을 필요로 하는 경우가 많다. 주요 부품의 공급망 변화 등 ‘직격타’로 다가오는 소식을 실시간으로 접하는 게 중요하다. 이때는 공식 뉴스, 성과 지표 등 거시적인 지표 데이터를 투입하는 것이 효과적이다.

게다가 생성 AI의 문제점인 환각과 실시간 정보 누락 등에서도 알에스엔이 강점을 보인다고 설명했다. 특정 기업 및 분야로 데이터의 범위 자체를 한정하면, 부정확한 답변이나 환각 현상을 최소화할 수 있다. 또 ‘SNS 실시간 업로드 반영’ 기술로 최신 데이터까지 포함할 수 있다.

박정호 알에스엔 연구소장이 회사의 강점을 설명하고 있다. 

이를 바탕으로 이제는 요약 및 문장 생성에 능통한 ‘챗GPT’의 장점을 더해 새 생성 AI 분석 모델을 내놓을 계획이다.

예를 들면 ‘우리 회사에서 가장 언급량이 많은 제품을 알려달라’는 질문을 입력, 챗봇에 답변을 얻어내는 방식이다. 기존 UI에 2차 정리 및 분석 인력이 별도로 필요했던 걸 생각하면 획기적인 발전이라는 설명이다. 한마디로 ‘분석에 한 줄 요약까지’ 단번에 해결하겠다는 목표다. 

박 소장은 “실시간 데이터 및 이슈, 그룹화와 랭크, 텍스트 추출과 요약이 가능한 루시GPT를 개발 완료한 상태”라며 “현재 특허 출원을 완료하고 상용화 서비스를 준비 중”이라고 밝혔다. 

‘모든 비즈니스에 접목 가능한 빅데이터 분석 기업’을 지향해 온 알에스엔은 이제 ‘모든 비즈니스에 맞춤형인 생성 AI 기업’으로 도약할 준비를 마쳤다.

장세민 기자 semim99@aitimes.com

1 COMMENT

LEAVE A REPLY

Please enter your comment!
Please enter your name here