Home Artificial Intelligence GIST, 국제 AI 음향 인식 대회서 심사위원상 수상

GIST, 국제 AI 음향 인식 대회서 심사위원상 수상

0
GIST, 국제 AI 음향 인식 대회서 심사위원상 수상

GIST-한화비전 팀이 국제 AI 음향 인식 대회에서 심사위원상 수상 기념 촬영을 하고 있다. (사진=GIST)

광주과학기술원(GIST, 총장 임기철)은 전기전자컴퓨터공학부 오디오지능연구실(지도교수 김홍국)과 한화비전 공동 연구팀이 지난달 핀란드에서 열린 ‘국제 인공지능(AI) 음향 인식 경진대회(DCASE 챌린지 2023)’ 워크숍에서 ‘심사위원상’을 수상했다고 12일 밝혔다. 

DCASE 챌린지 2023은 세계 최대 전기-전자기술자협회(IEEE)의 신호처리소사이어티가 주관했다. 

GIST 오디오지능연구실 소속 학생(김지원, 손상원 석사과정 학생, 송윤아 석박통합과정 학생)과 한화비전 연구원(송일훈, 임정은 수석연구원)으로 구성한 ‘GIST-한화비전 팀’은 실내 음향 이벤트 탐지 부문(Task 4A)에서 단일 모델 분야 1위는 물론 앙상블 모델 분야 2위를 달성했다. 

특히 워크숍에서 심사위원상을 수상하며 연구의 혁신성과 기술의 완성도, 논문의 품질 등 다수 기준에서 좋은 성적을 거뒀다.

심사위원상은 각 팀이 제출한 기술 리포트를 중심으로 연구의 독창성과 우수성을 검토, 임무별 한 팀에만 수여한다. GIST-한화비전 팀은 ‘실내 음향 이벤트 탐지 기술’을 선보이며 중앙대, 샤오미, 삼성리서치 중국-난징 등 15곳을 제치고 수상했다. 

실내 음향 이벤트 탐지는 실내 환경에서 발생하는 진공청소기 소리, 설거지 소리 등 10가지 다양한 소리를 AI로 탐지 및 구별하는 기술이다. 카메라 식별이 어려운 상황에서도 소리만으로 음향 탐지가 가능, 실내 상황 감시나 AI 스피커 등 다수 애플리케이션에 활용할 수 있다.

구체적으로는 ▲AI 추론한 의사 정답을 학습에 활용하는 준지도 학습 기술 ▲사전 학습 훈련 모델의 추론 결과를 기존 모델의 추론 결과와 융합하는 기술 ▲성능 향상을 위한 데이터를 정제하는 기술 ▲AI의 능력 향상을 위해 다양한 기법을 병합하는 앙상블 기술 접목 등 AI 모델을 적극 이용했다.

김지원 학생이 워크숍에서 논문을 발표하고 있다. (사진=GIST)
김지원 학생이 워크숍에서 논문을 발표하고 있다. (사진=GIST)

김홍국 지도교수는 “개발 기술은 한화비전 CCTV 내 음향 이벤트 탐지에 적용할 예정”이라며 “나아가 소셜미디어 콘텐츠의 음성구간 및 음향 이벤트를 검출해 효율적이고 사용자 친화적인 서비스 개발에 노력하겠다”고 말했다. GIST-한화비전 연구진은 “오디오 AI 분야 연구를 더욱 심화해 실용화 및 사회적 가치 창출에 기여할 계획”이라고 전했다.

한편 GIST 오디오지능연구실은 음성 음향을 위한 AI 모델을 연구 중이며, 음향 이벤트 탐지뿐만 아니라 음성 합성, 음성 잡음 제거, 음성 인식, 이상 상황 감지, 생체정보 처리 등 다양한 연구를 수행하고 있다. 국내 산학연 연구기관 및 매사추세츠공대(MIT) 등 해외 연구기관과 공동으로 진행한다.

이번 연구는 ▲2023년도 한화비전의 CCTV 내 딥러닝 기반 음원 분류 상품화 ▲과학기술정보통신부 및 정보통신기획평가원의 미디어 콘텐츠 음성 언어 현지화 기술개발 지원 사업으로 수행했다.

장세민 기자 semim99@aitimes.com

LEAVE A REPLY

Please enter your comment!
Please enter your name here