🔴 📦 오픈소스 2026년 5월 6일 수요일 · 2 분 읽기 ·

Allen Institute: MolmoAct 2, GPT-5와 Gemini 2.5 Pro를 능가하는 최초의 오픈소스 로보틱스 파운데이션 모델

편집 일러스트: 실험실에서 Franka 암 양팔 로봇이 상자를 열고 있으며, 오픈소스 MolmoAct 2 파운데이션 모델을 상징합니다

MolmoAct 2는 Allen Institute for AI가 5월 5일에 공개한 오픈소스 로보틱스 파운데이션 모델입니다. 구현 추론 벤치마크에서 63.8/100을 달성해 GPT-5와 Gemini 2.5 Pro를 능가하고, 추론 속도를 37배 향상시켰으며, 양손 협조 능력을 내장한 최초의 기반 모델입니다.

🤖

이 기사는 AI가 1차 출처를 기반으로 생성했습니다.

Allen Institute for AI(AI2)는 2026년 5월 5일 MolmoAct 2를 공개했습니다. 이는 구현 추론 벤치마크에서 Physical Intelligence 등의 클로즈드 시스템과 GPT-5, Gemini 2.5 Pro 같은 프론티어 모델을 능가하는 최초의 오픈소스 로보틱스 파운데이션 모델입니다.

로보틱스 파운데이션 모델은 시각 및 행동 데이터 조합으로 학습된 대형 기반 모델로, 새로운 시나리오마다 전용 훈련 없이 자연어로부터 로봇이 다양한 물리적 작업을 수행할 수 있도록 합니다.

MolmoAct 2의 세 가지 핵심 개선사항은 무엇입니까?

첫 번째 개선사항은 순수 성능입니다: 모델은 구현 추론 벤치마크에서 63.8/100을 달성해 GPT-5와 Gemini 2.5 Pro를 능가합니다. 두 번째는 대폭적인 속도 향상——비전 모델과 액션 전문가 간의 KV-cache 브리지를 최적화하여 추론 속도가 37배 향상되어 액션당 6.7초에서 180밀리초로 단축되었습니다. 세 번째는 양손 능력 내장——작업별 파인튜닝 없이 두 손의 협조 동작을 구현하여 MolmoAct 2가 이 종류의 최초 기반 모델이 되었습니다.

모델은 약 300만 개의 추가 구현 추론 샘플로 학습된 Molmo 2-ER 기반 위에 구축되었습니다.

실제 벤치마크 결과는 어떻습니까?

로봇 학습의 표준 학술 벤치마크인 LIBERO 테스트에서 MolmoAct 2는 97.2%의 성공률을 달성했습니다. Franka 암 로봇을 사용한 실제 작업에서는 87.1%, 새로운 MolmoBot 가정 벤치마크(가정 작업 세트)에서는 20.6%를 달성했으며, 이는 2위 모델의 두 배입니다.

LIBERO와 MolmoBot의 차이는 실제 지저분한 가정 환경이 얼마나 어려운지를 보여줍니다: 학술 작업의 97%를 해결할 수 있는 모델도 실제 가정 시나리오에서는 5분의 1 정도만 성공합니다.

AI2는 모델과 함께 무엇을 공개했습니까?

모델 가중치 외에도 AI2는 720시간 이상의 양손 시연을 포함한 YAM 데이터셋을 공개했습니다. 이는 기존 MolmoAct 데이터셋의 30배 규모입니다. 또한 완전한 훈련 코드와 다른 연구실이 재현할 수 있는 참조 하드웨어 설정도 포함됩니다.

모든 결과물——가중치, 데이터셋, 코드, 하드웨어 사양——이 공개적으로 이용 가능합니다. 이로써 MolmoAct 2는 클로즈드 로보틱스 파운데이션 모델에 대한 최초의 진지한 오픈 대안이 되며, 연구자, 대학, 소규모 기업이 라이선스 제한 없이 독자적인 응용 프로그램을 구축할 수 있는 기반을 제공합니다.

자주 묻는 질문

로보틱스 파운데이션 모델이란 무엇입니까?
로보틱스 파운데이션 모델은 시각 및 행동 데이터를 조합하여 학습한 대형 기반 모델로, 새로운 시나리오마다 별도의 파인튜닝 없이 자연어 지시에 따라 로봇이 다양한 물리적 작업을 수행할 수 있게 합니다.
로보틱스에서 양손 협조 능력이란 무엇입니까?
양손 협조 능력은 로봇이 하나의 작업에서 두 팔을 조율하는 능력입니다. 예를 들어 한 손으로 용기를 잡고 다른 손으로 내용물을 붓는 것입니다. MolmoAct 2는 작업별 파인튜닝 없이 이를 구현한 최초의 기반 모델입니다.
YAM 데이터셋이란 무엇입니까?
YAM 데이터셋은 AI2가 모델과 함께 공개한 새로운 공개 데이터셋으로, 720시간 이상의 양손 로봇 시연 데이터를 포함합니다. 이는 기존 MolmoAct 데이터셋 시연 수의 30배에 달합니다.