본문 바로가기
TREND/인공지능

토요타 리서치 연구소 로봇 학습을 위해 대규모 행동 모델 제시

by inniable 2023. 9. 30.

토요타 리서치 연구소 로봇 학습을 위해 대규모 행동 모델 제시

토요타 리서치 연구소는 로봇의 행동 학습을 위해 인공지능의 대규모 언어 모델과 유사한 대규모 행동 모델을 제시하고 연구중입니다. 연구진이 햅틱 시연을 통해 로봇에게 학습시키고, 이와 관련한 많은 데이터를 제공하면 로봇은 스스로 학습하며 다른 새로운 행동을 할 수 있게 됩니다. 이전과 같이 하나의 행동을 위해 소스코드를 짤 필요도 없고, 시행착오를 겪을 필요도 없습니다.

 

목차

토요타 리서치 연구소

행동모델 적용 실험

현재까지의 성과

 

토요타 리서치 연구소

토요타 리서치 연구소(Toyota Research Institute, TRI)는 로봇의 행동 학습을 위해 생성AI 접근 방식의 모델을 연구하고 있습니다. 이 모델은 로봇 활용도를 높이기 위해 인공지능의 대규모 언어 모델(Large Language Model, LLM)과 유사한 로봇용 대규모 행동 모델(Large Behavior Model, LBM)을 적용시키기 위한 단계라고 할 수 있습니다.

토요타 리서치 연구소의 로봇 행동에 대한 이 연구는 사람을 대체하는 것이 아니라 로봇의 효용성을 확대시키기 위함입니다. 이 방식은 효율적이고 높은 성능의 행동을 생성하게 되므로 로봇의 효용성을 효과적으로 증폭시킬 수 있게됩니다.

 

로봇 학습을 위한 대규모 행동모델을 제시한 토요타리서치연구소
로봇 학습을 위한 대규모 행동모델을 제시한 토요타리서치연구소

 

 

 

행동모델 적용 실험

현재까지의 로봇에게 새로운 행동을 가르치는 기술은 매우 느리고 일관성이 없으며 비효율적이었고 제한된 환경에서만 수행할 수 있는 작업이었습니다. 로봇 공학자들은 하나의 행동에 대해 정교한 코드를 작성하거나 동작을 프로그래밍하기 위해 수많은 시행착오를 겪어야 했습니다. 그러나, 토요타 리서치 연구소의 접근 방식은 다릅니다.

연구팀은 생성 로봇에게 아침 식사를 만드는 방법을 가르쳤습니다. 코딩이나 버그 수정 대신에 연구팀은 로봇에 촉각을 부여하고 인공지능 모델에 이를 연결한 후 실행 방법을 학습시켰습니다. 촉각을 부여받은 로봇은 수행하는 작업을 직접 느끼고 학습하며 더 많은 정보를 제공받을 수 있게 됩니다. 시각적 데이터만 사용할 때보다 훨씬 어려운 작업을 쉽게 수행할 수 있게 되었습니다. 먼저 일련의 기술을 시연하면 모델을 통해 로봇은 백그라운드에서 몇 시간에 걸쳐 학습합니다. 전일 오후에 로봇에게 가르치면 로봇은 밤새 학습하게 되고, 다음 날 아침에 새로운 행동을 취할 수 있게 됩니다.

 

 

토요타 리서치 연구소는 로봇에게 이미 물 붓기, 도구 사용, 물체 조작 등 60개 이상의 어렵고 능숙한 기술을 학습시켰습니다. 이러한 행동에 대해 단 한 줄의 코드도 작성하지 않았습니다. 로봇에 새로운 데이터를 계속 제공하는 것이 유일한 변화입니다.

토요타 리서치 연구소의 목표는 올해 말까지 수백 가지의 새로운 기술을, 2024년 말까지 1,000가지의 새로운 기술을 가르치는 것입니다.

이제 단순히 물건을 집어 새로운 위치에 내려놓는 것에만 국한되지 않습니다. TRI의 로봇은 다양하고 풍부한 방식으로 세상과 상호 작용할 수 있습니다. 머지 않아 로봇은 일상적인 상황과 예측할 수 없고 끊임없이 변화하는 환경에서 사람들을 지원하게 될 수 있습니다.

 

현재까지의 성과

이 개발에 대한 토요타 리서치 연구소의 주요 성과는 다음과 같습니다.

  • 확산 정책
    토요타 리서치 연구소와 연구팀은 행동 학습에 대한 새롭고 강력한 생성AI 접근 방식을 개발했습니다. 확산 정책(Diffusion Policy)이라 하는 이 방식을 활용하면 시연을 통해 빠르고 쉽게 행동 교육이 가능해집니다.

  • 맞춤형 로봇 플랫폼
    토요타 리서치 연구소의 로봇 플랫폼은 햅틱 시연 피드백과 촉각 감지 활성화에 촛점을 맞추고 능숙한 양팔 조작을 위해 맞춤형으로 제작되었습니다.

  • 파이프라인
    토요타 리서치 연구소의 로봇은 현재까지 60개의 기술을 배웠고, 올해 말까지 수백 개, 2024년 말까지 1,000개의 행동을 목표로 합니다.

  • 드레이크
    최첨단 도구 상자와 시뮬레이션 플랫폼을 제공하는 로봇 공학용 모델 기반 설계를 드레이크라고 합니다. 높은 현실감 으로 시뮬레이션과 현실 모두에서 훨씬 더 향상된 규모와 속도로 로봇을 개발할 수 있습니다. 스택은 드레이크 최적화 및 시스템 프레임워크를 사용하여 구축되었고, 로봇 공학 커뮤니티의 작업 촉진을 위해 오픈 소스로 만들었습니다.

  • 안전
    안전은 토요타 리서치 연구소의 로봇공학에서 매우 중요한 부분입니다. 로봇이 자신이나 주변 환경과 충돌하지 않고 안전을 보장하도록 드레이크와 맞춤형 로봇 제어 스택을 기반으로 하는 강력한 보호 장치로 시스템을 설계했습니다.

 

 

Homepage | Toyota Research Institute

At the Toyota Research Institute Expo, held on February 15, 2023, in Los Altos, California, TRI’s top researchers showcased future technology addressing aging society, climate change, and human understanding. Read more about the event in the press re

www.tri.global

 

 

130g 소재로 100Kg이상 들어올리는 소프트 그리퍼

130g 소재로 100Kg이상 들어올리는 소프트 그리퍼 계란, 컵 등 깨지기 쉬운 물체를 다루기 위한 가사용 로봇, 물류용 로봇 등을 위해 연구중인 소프트 그리퍼는 부드럽고 유연한 소재를 사용하여

standstraight.tistory.com

 

 

아바타 로봇으로 달기지 건설을 AVATAR X

아바타 로봇으로 달기지 건설을 AVATAR X 3D 안경과 원격 제어장치로 우주에 있는 아바타 로봇에 신호를 보내 우주기지를 건설하고, 우주선 안에서 달 표면의 아바타 로봇을 통해 달 기지를 건설하

standstraight.tistory.com

 

반응형