본문 바로가기
TREND/인공지능

구글의 인공지능

by inniable 2023. 4. 26.

구글의 인공지능

 

챗GPT의 놀라운 성능에 밀려 구글은 인공지능 경쟁에서 뒤쳐진 것처럼 보입니다. 하지만, 구글은 이미 오래전부터 대형언어모델 및 생성형 인공지능을 연구해왔고, 그 안정성과 성능을 지속적으로 검증하고 있었습니다. 오늘은 구글이 개발해왔던 인공지능에 대해 간단히 적어보도록 하겠습니다.

1. 구글의 인공지능

 가. BERT

2018년 11월 구글이 공개한 BERT는 자연어(NLP) 처리 딥러닝 모델의 인공지능입니다. 인간의 언어인 자연어 이해를 목적으로 만들었으며, 양방향 학습모델을 모두 지원합니다. 양방향 학습이라는 것은 위키피디아, 도서 등의 언어자료를 통째로 학습하고, fine-tuning을 통해서 특정한 목적에 활용하도록 하는 언어모델입니다. 오픈소스로 만들어져 누구나 사용 가능하고 진화시킬 수 있습니다.

 

나. LaMDA

LaMDA는 Language Model for Dialogue Appllcations의 약자로 대화를 위한 언어모델입니다. BERT는 언어 이해를 목적으로, 챗GPT는 언어 생성에 중점을 두고 만들어졌다면, LaMDA는 이 두가지를 합친 대화를 목적으로 만들어진 언어모델입니다.

 

이미 챗GPT를 통해 언어모델의 엄청난 능력을 확인할 수 있었습니다. 사람과 대화하는 것처럼 텍스트를 생성해 냅니다. 그런데 학계에서는 GPT의 안전성과 팩트의 정확성 문제로 챗GPT가 대중화 되는 것을 꺼려합니다.

 

특히나 안전성 문제는 매우 민감한 문제입니다. 2020년 12월에 출시된 인공지능 챗봇 이루다의 서비스는 약 2주만에 중단되었습니다. 알고리즘의 편향성, 개인정보의 유출 등 민감한 문제를 세상에 던져주었습니다. 2016년 마이크로소프트의 테이는 인종차별과 폭력적인 메시지로 서비스 개시 16시간만에 중단된 적도 있습니다.

 

LaMDA는 안정성과 팩트의 정확성을 위해 측정방식(Metric)을 통해 인공지능의 편향성이나 정보의 부정확성, 환상등의 부정적인 효과를 줄일 수 있도록 Metric을 디자인하였습니다.

 

구조는 GPT와 유사한 거대한 트랜스포머 구조입니다. 약 1,370억 개의 파라미터로 구성되었습니다. 방대한 양의 학습이 필요한 것도 동일합니다. 인터넷 등으로 30억 개의 문서, 11억개의 대화를 학습하였습니다.

 

다른 언어모델과 LaMDA의 차별점은 답변생성후 점수를 예측하는 것입니다. LaMDA는 답변을 여러가지 생성후 안정성이 낮은 답변을 먼저 제거하고, 구체적이고 합리적인 답변중에서 골라 가장 적합한 답변을 제공합니다.

 

다. Bard

2023년 4월, 구글은 대화형 생성 인공지능(generative AI) 및 대형언어모델(Large Language Model, LLM)인 바드(Bard)의 서비스를 시작했습니다. 바드는 구글의 LLM모델인  람다(LaMDA)를 기반으로 개발되었으며, LaMDA의 경량화 버전입니다. 한국에서도 시범 서비스가 가능하지만 아직 한국어 서비스는 지원되지 않습니다.

 

구글 계정에 로그인을 하면 서비스 신청이 가능하며 현재는 구글 계정에 등록된 이메일로 대기상태를 알려줍니다.구글은 점차 대상언어 및 국가를 확대할 것이라고 밝혔습니다.

 

구글은 바드가 검색이 아닌 별도의 채팅서비스라고 밝혔지만, 답변 창 아래에 검색 버튼을 설치하여 구글 검색도 가능하게 하였습니다.

반응형