본문 바로가기
TREND/인공지능

구글 멀티모달 인공지능 제미니 출시 예정

by inniable 2023. 10. 11.

구글 멀티모달 인공지능 제미니 출시 예정

구글 멀티모달 인공지능 제미니가 빠르면 다음달 출시됩니다. 마이크로소프트와 오픈AI의 챗GPT로 생성형 AI 시장의 선두기업을 빼앗겼다는 평가를 받고 있는 구글은 멀티모달 인공지능을 통해 시장을 선도하겠다는 계획입니다. 이를 위해 구글의 인공지능 조직이었던 딥마인드와 브레인을 딥마인드로 통합시키고 프로젝트를 진행중입니다.  

 

목차

구글 인공지능 조직 통합후 멀티모달 인공지능 준비

구글의 생성형 AI 대응

구글 멀티모달 인공지능 제미니 출시 임박

멀티모달 인공지능의 지향점 및 한계

 

구글 멀티모달 인공지능 제미니
구글 멀티모달 인공지능 제미니

 

구글 인공지능 조직 통합후 멀티모달 인공지능 준비

생성형 AI 시장에서 마이크로소프트와 오픈AI에 시장을 빼앗긴 구글은 2023년 4월 딥마인드와 브레인을 구글 딥마인드로 조직 통합하며 새롭게 반격을 준비하고 있습니다. 딥마인드 조직은 통합후 구글 찰스턴이스트 캠퍼스에 7월 입주하였습니다.

딥마인드는 텍스트, 이미지, 음성 등 여러 데이터를 동시에 처리하는 AI 기술인 멀티모달(Multi Modal)을 통해 비밀병기를 준비중입니다.

 

 

 

 

 

 

 

 

구글의 생성형 AI 대응

구글은 인공지능 고도화를 위한 로드맵을 착실히 이행 중에 있습니다. 챗GPT를 뛰어넘을 비밀 병기를 내놓기 위해 공을 들이고 있습니다. 오픈AI의 GPT-3는 3,000억 개의 데이터 토큰을 학습한 것으로 알려졌습니다. 토큰은 인공지능이 답변할 때 꺼내 사용하는 일종의 인공지능용 어휘 사전입니다.

구글은 이미 뛰어난 인공지능 기술을 보유하고 있었지만 인공지능 기술을 상품화하는 것에 주저했습니다. 20여 년 이상 검색 시장에서 절대 우위를 지키고 있었고 이 분야에 인공지능을 섣불리 적용했다가 핵심 수익원인 광고에 악영향을 줄 수도 있다는 판단에서 였습니다. 하지만 챗GPT의 등장으로 시장의 판도가 바뀌었습니다. 구글이 뒤늦게 5월에 발표한 LLM 팜2는 약 3조6,000억 개의 토큰으로 훈련하였습니다. 지난해 출시된 팜은 7,800억 개 토큰으로 학습했었습니다.

 

구글 멀티모달 인공지능 제미니 출시 임박

구글은 LLM 모델을 넘는 멀티모달 AI 시장에서 사활을 걸고 출시 준비중입니다. 마치 어벤져스에 나오는 AI 개인 비서 자비스를 현실에서 구현하겠다는 것이다. 오픈AI의 GPT-4 역시 멀티모달 기술을 제대로 구현하지는 못했다는 평가입니다.

구글은 다음달 공개할 차세대 LLM 제미니를 통해서 멀티모달 AI를 구현하여 경쟁우위에 서겠다는 전략입니다. 제미니는 연산량 기준으로 GPT-4보다 다섯 배 이상 많은 양을 학습을 하는 것으로 알려졌습니다.

이미 일부 기업에 제미니를 공개하였으며, 테스트 중인 것으로 알려졌습니다.

 

멀티모달 인공지능의 지향점 및 한계

구글, MS 등 빅테크의 인공지능 지향점은 누구나 쉽게 영화감독이 되는 수준으로 인공지능 학습량을 늘리는 것입니다. 하지만 아직 갈 길은 멉니다. 비디오 프레임 하나 하나를 어떻게 인식하고 구현할 것인지 풀어야할 기술적 과제가 많습니다.

또, 투자자본수익률(ROI) 문제도 있습니다. 현재 인공지능 기술은 학습 및 추론 과정에 막대한 에너지를 소모하며 초기투자비용이 수십억달러에 달합니다.

클라우드 구축과 운영에 많은 탄소를 배출하고 있기 때문에 지속 가능하지 않다는 것도 문제입니다.

효율성을 유지하고 비용을 낮춘 멀티모달 모델을 개발하는 기업이 인공지능 시장을 선도하게 될 것입니다.

 

 

구글 인공지능조직 통합 개편

구글 인공지능조직 통합 개편 2016년 3월 이세돌 9단과 인공지능 알파고와의 세기의 바둑대결을 아직도 잊혀지지 않습니다. 이때 알파고를 만들었던 회사는 딥마인드였습니다. OpenAI와 Micro Soft에

standstraight.tistory.com

 

 

멀티모달로 진화하는 AI

멀티모달로 진화하고 있는 AI 오픈AI의 챗GPT와 같은 인공지능 챗봇을 비롯하여, 구글의 알파폴드(단백질 구조 분석 AI) 등 LLM(대형언어모델, Large Language Model)이 주로 사용되고 있습니다. LLM은텍스

standstraight.tistory.com

 

반응형