Home Artificial Intelligence 구글, ‘제미나이 프로’ 클라우드 서비스 본격 스타트

구글, ‘제미나이 프로’ 클라우드 서비스 본격 스타트

0
구글, ‘제미나이 프로’ 클라우드 서비스 본격 스타트

(사진=구글)

구글이 대형멀티모달모델(LMM) ‘제미나이 프로(Gemini Proi)’를 구글 클라우드의 기업 및 개발자용 플랫폼에 전격 도입했다. 아마존과 마이크로소프트(MS)에 뒤처진 클라우드 분야를 따라잡겠다는 의도다.

구글은 13일(현지시간) 구글 클라우드의 AI 플랫폼인 ‘구글 AI 스튜디오’와 ‘버텍스 AI’에 ‘제미나이 프로’를 탑재한다고 밝혔다.

제미나이 프로는 제미나이의 3가지 버전 중 중간급 크기의 모델이다. 제미나이 ‘나노’는 스마트폰와 같은 기기에서 바로 실행된다. 제미나이 프로는 구글의 AI 챗봇인 바드에 맞춰 광범위한 작업에 걸쳐 확장 가능하도록 설계됐다. 매우 복잡한 작업을 위한 가장 크고 뛰어난 제미나이 ‘울트라’는 내년에 일반 대중에 공개되기에 앞서 일부 클라우드 고객과 파트너에게 제한적으로 제공될 예정이다.

구글은 프로 버전을 개발자와 기업을 대상으로 제공한다. ▲국내를 포함해 전 세계 180개국에서 38개 언어를 지원하는 3만2000 토큰 컨텍스트 크기의 텍스트 전용 모델 ‘제미나이 프로’ ▲텍스트, 이미지, 비디오 등을 입력으로 받아들이고 텍스트를 출력하는 ‘제미나이 프로 비전’ 모델로 구분된다.

AI 스튜디오에 접목된 제미나이 프로 시연 화면. (사진=구글)
AI 스튜디오에 접목된 제미나이 프로 시연 화면. (사진=구글)

개발자는 무료 웹 기반 AI 개발 도구인 ‘구글 AI 스튜디오’를 통해 제미나이 프로를 사용할 수 있다. 이를 통해 제미나이 API를 사용, 애플리케이션을 개발할 수 있다. 개발자는 구글 계정으로 가입할 수 있으며 분당 최대 60개의 API 요청을 허용하는 무료 할당량을 받게 된다.

또 기업들은 자체적으로 AI를 개발할 수 있는 구글 클라우드의 완전 관리형 AI 플랫폼인 ‘버텍스 AI’에서 프리뷰 형태로 제미나이 프로를 사용할 수 있다. 기업은 자체 데이터를 사용해 맞춤형 모델을 구축하고, 검색 도구 및 챗봇을 제작할 수 있다.

버텍스AI에 접목된 제미나이 프로 시연 화면. (사진=구글)
버텍스AI에 접목된 제미나이 프로 시연 화면. (사진=구글)

제미나이 프로의 가격 정책도 공개했다. 구글 AI 스튜디오 사용자는 1분당 60개의 API 요청에 대해서는 무료로 제공한다. 내년 초 정식 서비스 공개 이후에는 입력기 1000글자당 0.00025달러, 이미지당 0.0025달러, 출력기준 0.0005달러다. 버텍스 AI에서도 내년 초까지 무료 사용 가능하다.

구글은 “제미나이 프로의 텍스트 기반 기능이 ‘팜 2’보다 입력 비용 4배, 출력 비용은 2배 저렴하다”라며 “궁극적으로 클라우드의 최신 AI 제품을 경쟁력 있는 가격으로 제공할 수 있도록 할 계획”이라고 밝혔다.

개발자용 듀엣 AI (사진=구글)
개발자용 듀엣 AI (사진=구글)

더불어 이날 개발자와 데이터 엔지니어에게 코드 추천, 코드 블록 생성, 코드의 오류 파악, 수정 제안 등을 제공하는 ‘개발자용 듀엣 AI(Duet AI for Developers)’를 정식으로 출시했다. 구글이 코딩 생성 분야에 진출한 것은 처음으로, 이미 이 분야에는 AWS ‘아마존 코드위스퍼’와 MS ‘깃허브 코파일럿’, IBM ‘왓슨x.ai(watsonx.ai)’ 등이 넘쳐나는 실정이다. 

듀엣 AI 도우미는 개발자가 코드를 작성, 테스트, 컴파일 및 배포하는 데 사용하는 여러 통합 개발 환경(IDE)에서 사용할 수 있다. 통합할 수 있는 IDE에는 클라우드 워크스테이션이나 구글 클라우드 콘솔, 클라우드 셸 에디터, VSCode 및 젯브레인용 클라우드 코드 IDE 확장 프로그램 등이 포함된다. 또 파이썬이나 자바, 고우, 타입스크립트 등 20개 이상의 프로그래밍 언어를 지원한다.

구글은 이와 함께  이미지 생성 도구인 ‘이마젠 2(Imagen2)’를 버텍스 A를 통해 제공한다고 밝혔다. 

이마젠2의 가장 큰 특징 중 하나는 텍스트 생성 능력이다. AI 생성 이미지를 텍스트 삽입이 쉽지 않아 추가 작업이 필수였다. 하지만 구글은 이마젠2가 정확한 텍스트를 생성할 수 있다고 강조했다. 텍스트뿐만 아니라 이를 바탕으로 로고를 만드는 것도 가능하다. 멀티모달 기능에 따라 생성된 이미지에 대해서 설명을 듣는 것도 가능하다.

또 의료용 AI 모델인 ‘메드LM(MedLM)’ 제품군도 선보였다. 메드LM 제품군은 지난 3월 처음 발표한 의료 데이터 기반의 LLM ‘메드팜-2’를 기반으로 대형 및 중형의 2개 모델로 출시됐다. 

대형 모델은 의료 기관 전체 환자의 데이터를 사용해 연구하는 등 많은 컴퓨팅 능력을 요구하는 작업에 적합하고, 중형 모델은 의사와 환자 사이의 대화를 요약하는 것과 같은 실시간 기능에 더 어울린다는 설명이다.

이 분야도 경쟁이 치열하다. 아마존, MS, 오라클 등 상당수 빅테크들이 진출을 선언했다. 구글은 메드LM 기술을 테스트한 HCA 헬스케어 등 파트너사와 협력으로 앞서 나가겠다는 전략이다.

향후에는 헬스케어에 특화한 제미나이 AI 모델도 출시할 예정이라고 밝혔다.

이외에도 사용자가 몇 단어만으로 음악을 생성할 수 있는 ‘뮤직FXMusicFX)’를 출시했다. 뮤직FX는 텍스트 설명으로 모든 장르의 음악을 생성할 수 있는 AI 모델인 구글의 ‘뮤직LM(MusicLM)’과 AI가 생성한 콘텐츠를 식별하기 위해 보이지 않는 워터마크를 삽입하는 딥마인드의 ‘신스ID(SynthID)’를 통합한 결과다.

특히 이 도구는 원래 아티스트의 목소리와 스타일을 보호하기 위해 특정 아티스트나 보컬을 언급하는 텍스트 입력에는 반응하지 않는다. 

뮤직FX는 최신 AI 기술을 사용자가 체험할 수 있도록 한 구글 플랫폼 ‘AI 테스트 키친(AI Test Kitchen)’을 통해 체험할 수 있다.

박찬 기자 cpark@aitimes.com

LEAVE A REPLY

Please enter your comment!
Please enter your name here