마이크로소프트(MS)가 인공지능(AI) 버그를 찾아내는 바운티(현상금) 프로그램을 발표했다. 외부 보안 테스트를 실시, 해커가 취약점을 악용하기 전에 AI 제품의 버그와 결함을 발견하겠다는 의도다.
서치엔진저널은 16일(현지시간) MS가 외부 보안 테스트를 통해 AI 안전성을 향상하는 것을 목표로 최대 상금 1만5000달러(약 2000만원)를 제공하는 버그 바운티 프로그램을 시작했다.
이에 따르면 이번 프로그램은 ‘빙 챗’ ‘빙 챗 엔터프라이즈’ ‘빙 이미지 크리에이터’ ‘MS 엣지’ ‘MS 스타트 앱’ 및 ‘스카이프 빙’ 등 빙(Bing) 기반 AI 서비스 전반을 대상으로 악용할 수 있는 취약점을 찾는다. 발견한 버그의 심각도에 따라 2000~1만5000달러를 제공한다.
AI의 취약점 공격은 주로 윤리적 가드레일에서 벗어나도록 AI를 유도하는 ‘환각’ 및 ‘탈옥’ 프롬프트를 중심으로 이뤄진다.
이번 프로그램에 참여하려면 빙 사용자는 지정한 보안 기준에 따라 ‘중요’ 또는 ‘심각’으로 분류해 이전에 공개되지 않은 취약점을 MS에 알려야 한다. 또 비디오 데모나 서면 문서를 통해 발견한 취약점을 증명해야 한다.
이번 조치는 지난 5월 MS, 구글, 오픈AI 등 AI 빅테크들이 공동으로 발표한 ‘AI 안전 서약’에 따른 것이다. 당시 발표한 8개 조항 중에는 ‘보안 취약점 및 AI의 환각 및 편향성 문제를 보고한다’라는 내용이 포함돼 있다. 구글을 비롯해 메타나 엔트로픽 등도 앞으로 유사한 프로그램을 실시할 것으로 예상할 수 있다.
앞서 지난 4월에는 오픈AI가 챗GPT 등을 사용하는 동안 발견한 문제나 버그, 보안 취약점 등을 보고하면 보상하는 버그 바운티 프로그램을 실시한 바 있다. 당시 오픈AI는 챗GPT의 환각과 탈옥 등 문제를 해결하기 위해 최대 2만달러(약 2700만원)의 보상금을 걸었다.
박찬 기자 cpark@aitimes.com