Microsoft Research:MagenticLite + Fara1.5(4B/9B/27B)— 소형 모델에 최적화된 에이전트 AI가 SOTA 달성
Microsoft Research는 2026년 5월 21일 소형 모델 에이전트 AI를 위한 세 가지를 발표했다. MagenticLite(브라우저 및 파일 시스템 UI 앱), MagenticBrain(Qwen 3 14B에서 파인튜닝한 14B 오케스트레이션 모델), Fara1.5(4B/9B/27B 세 가지 크기의 컴퓨터 사용 모델)다. Fara1.5-27B는 Online-Mind2Web 벤치마크(300개 웹 작업)에서 SOTA 90% 이상을 달성해 전 세대 Fara-7B의 거의 두 배 성능을 기록했다. 목표는 에이전트 AI에 거대 모델이 필요하지 않음을 증명하는 것이다 — 잘 설계된 도구와 실행 프레임워크만으로 충분하다.
이 기사는 AI가 1차 출처를 기반으로 생성했습니다.
Microsoft Research는 2026년 5월 21일 에이전트 AI를 위한 세 가지 패키지를 발표했다. 자율 에이전트를 갖춘 컴퓨터 시스템이 GPT-5나 Claude Opus 규모의 프론티어 모델에 의존할 필요가 없다는 것을 구체적으로 논증한다. 동시에 발표된 것은 MagenticLite(브라우저 및 파일 시스템 UI 앱), MagenticBrain(Qwen 3 14B에서 파인튜닝된 14B 오케스트레이션 모델), Fara1.5(컴퓨터 사용 모델, 세 가지 크기:4B, 9B, 27B)다.
Fara1.5 모델이 경쟁과 다른 점은 무엇인가?
Fara1.5는 컴퓨터 사용 작업을 위해 설계되었다 — 브라우저를 탐색하고, 양식을 작성하고, 링크를 클릭하고, 페이지를 읽고, UI 요소를 해석하는 에이전트다. Microsoft는 세 가지 크기를 제공한다 — 에지 및 모바일 사용 사례에는 4B, 균형 잡힌 추론 비용에는 9B, 최대 성능에는 27B. 세 가지 크기 모두 동일한 아키텍처 원칙을 따른다. 도구와 하네스 레이어의 협동 설계로 방대한 파라미터 수의 필요성을 제거한다.
핵심 지표는 Online-Mind2Web 벤치마크 — 다단계 브라우징, 정보 수집, 실제 사이트와의 상호작용을 포함하는 300개의 실제 웹 작업 세트다. Fara1.5-27B는 해당 벤치마크에서 최신 프론티어 모델 성능의 90% 이상을 달성했으며, 이는 이전 세대 Fara-7B의 거의 두 배 결과다.
MagenticLite와 MagenticBrain의 시스템 내 역할은?
MagenticLite는 클라이언트다 — 에이전트에게 브라우저와 파일 시스템에 대한 접근을 제공하는 애플리케이션. Microsoft Research가 수 년간 개발해온 더 넓은 Magentic 프레임워크의 단순화 버전이지만 무거운 오케스트레이션 인프라 없이 소형 모델을 실행하는 데 집중한다.
MagenticBrain은 오케스트레이션 레이어로 작동하는 14B 모델이다 — 어떤 서브 에이전트를 호출할지, 복잡한 작업을 서브 작업으로 어떻게 분할할지, 실행 단계를 통해 여러 에이전트를 어떻게 조정할지를 결정한다. Qwen 3 14B에서 파인튜닝되어 Microsoft의 실용적 접근 방식을 확인한다 — 처음부터 훈련하는 대신 최고의 사용 가능한 오픈소스 기반을 활용하고 작업 특화 훈련으로 보강한다.
왜 에이전트 AI에 소형 모델을 사용하는가?
경제적 논거는 명백하다 — 에이전트 워크플로는 일반 채팅 사용 사례보다 10배 더 많은 추론 요청을 생성할 수 있다. 프론티어 모델에서 이런 워크플로를 실행하면 빠르게 경제적으로 비실용적이 된다. 좋은 오케스트레이션을 갖춘 소형 모델은 훨씬 낮은 비용으로 90%의 결과를 낼 수 있다.
두 번째 논거는 아키텍처적이다 — 소형 모델은 온디바이스로 실행될 수 있어, 개인 정보 보호가 필요하거나(의료, 금융)저지연 상호작용을 필요로 하는 사용 사례를 열어준다. Microsoft는 Fara1.5-4B의 엣지 배포를 명시적으로 목표로 한다.
Fara1.5는 더 넓은 트렌드에 어떻게 부합하는가?
Microsoft Research 팀은 추론 경제성이 벤치마크 성능만큼 중요하다고 주장하는 성장하는 트렌드(Apple Intelligence, Google Gemini Nano, Anthropic Haiku 4.5)에 합류했다. 차이점은 Microsoft가 모델과 오케스트레이션 프레임워크 모두를 공유한다는 점이다 — MagenticBrain을 오픈소스로 공개하면 연구 커뮤니티에 협동 설계된 에이전트-모델 시스템의 첫 번째 진정한 참조 구현을 제공하게 된다.
기업 사용자에게 이는 명확한 신호다 — 에이전트 AI는 이제 OpenAI나 Anthropic 같은 외부 API에 의존하지 않고도 실현 가능하다. Microsoft는 수직 통합(자체 모델, 자체 오케스트레이션, 자체 UI)에 점점 더 집중하고 있으며, 이는 Azure 생태계 내에서 자체 파트너에 대한 전략적 레버리지를 제공한다.
자주 묻는 질문
- MagenticLite란 무엇인가?
- MagenticLite는 에이전트에게 브라우저와 파일 시스템 접근을 제공하는 Microsoft의 UI 애플리케이션으로, Fara1.5 계열 소형 모델을 위한 플랫폼으로 설계되었다.
- Fara1.5 모델의 크기 변형은 무엇인가?
- Fara1.5는 4B, 9B, 27B 세 가지 크기로 제공되며 모두 전형적인 프론티어 모델보다 훨씬 작다.
- Microsoft는 에이전트 평가에 어떤 벤치마크를 사용하는가?
- 300개의 실제 웹 작업을 포함하는 Online-Mind2Web 벤치마크다. Fara1.5-27B는 SOTA 90% 이상을 달성해 Fara-7B의 거의 두 배 성능을 보였다.