Multi-Modal1 멀티모달로 진화하는 AI 멀티모달로 진화하고 있는 AI 오픈AI의 챗GPT와 같은 인공지능 챗봇을 비롯하여, 구글의 알파폴드(단백질 구조 분석 AI) 등 LLM(대형언어모델, Large Language Model)이 주로 사용되고 있습니다. LLM은텍스트로 명령어를 입력해야 작동을 합니다. 그런데 이런 언어모델이 텍스트 명령어가 아닌, 소리, 이미지 및 영상 등을 입력해도 작동하는 멀티모달 언어모델을 목표로 MS, 구글 등이 연구에 박차를 가하고 있습니다. 1. 멀티모달이란? 예를 들어, 사람이 태어나서 처음 사과라는 개념을 이해하기 위해서는 맛을 보고, 먹는 소리를 듣고, 사과의 색깔과 크기 그리고 사과를 사용한 여러가지 요리 등을 맛보고 느끼며 인지하게 됩니다. 즉, 단순히 글자로서 사과가 아닌 제대로 된 사과를 인식하게 되.. 2023. 3. 30. 이전 1 다음