🔴 🤝 에이전트 게시일: · 3 분 읽기 ·

Microsoft Research:MagenticLite + Fara1.5(4B/9B/27B)— 소형 모델에 최적화된 에이전트 AI가 SOTA 달성

편집 일러스트:MagenticLite + Fara1.5(4B/9B/27B)— 소형 모델에 최적화된 에이전트 AI가 SOTA 달성

Microsoft Research는 2026년 5월 21일 소형 모델 에이전트 AI를 위한 세 가지를 발표했다. MagenticLite(브라우저 및 파일 시스템 UI 앱), MagenticBrain(Qwen 3 14B에서 파인튜닝한 14B 오케스트레이션 모델), Fara1.5(4B/9B/27B 세 가지 크기의 컴퓨터 사용 모델)다. Fara1.5-27B는 Online-Mind2Web 벤치마크(300개 웹 작업)에서 SOTA 90% 이상을 달성해 전 세대 Fara-7B의 거의 두 배 성능을 기록했다. 목표는 에이전트 AI에 거대 모델이 필요하지 않음을 증명하는 것이다 — 잘 설계된 도구와 실행 프레임워크만으로 충분하다.

🤖

이 기사는 AI가 1차 출처를 기반으로 생성했습니다.

Microsoft Research는 2026년 5월 21일 에이전트 AI를 위한 세 가지 패키지를 발표했다. 자율 에이전트를 갖춘 컴퓨터 시스템이 GPT-5나 Claude Opus 규모의 프론티어 모델에 의존할 필요가 없다는 것을 구체적으로 논증한다. 동시에 발표된 것은 MagenticLite(브라우저 및 파일 시스템 UI 앱), MagenticBrain(Qwen 3 14B에서 파인튜닝된 14B 오케스트레이션 모델), Fara1.5(컴퓨터 사용 모델, 세 가지 크기:4B, 9B, 27B)다.

Fara1.5 모델이 경쟁과 다른 점은 무엇인가?

Fara1.5는 컴퓨터 사용 작업을 위해 설계되었다 — 브라우저를 탐색하고, 양식을 작성하고, 링크를 클릭하고, 페이지를 읽고, UI 요소를 해석하는 에이전트다. Microsoft는 세 가지 크기를 제공한다 — 에지 및 모바일 사용 사례에는 4B, 균형 잡힌 추론 비용에는 9B, 최대 성능에는 27B. 세 가지 크기 모두 동일한 아키텍처 원칙을 따른다. 도구와 하네스 레이어의 협동 설계로 방대한 파라미터 수의 필요성을 제거한다.

핵심 지표는 Online-Mind2Web 벤치마크 — 다단계 브라우징, 정보 수집, 실제 사이트와의 상호작용을 포함하는 300개의 실제 웹 작업 세트다. Fara1.5-27B는 해당 벤치마크에서 최신 프론티어 모델 성능의 90% 이상을 달성했으며, 이는 이전 세대 Fara-7B의 거의 두 배 결과다.

MagenticLite와 MagenticBrain의 시스템 내 역할은?

MagenticLite는 클라이언트다 — 에이전트에게 브라우저와 파일 시스템에 대한 접근을 제공하는 애플리케이션. Microsoft Research가 수 년간 개발해온 더 넓은 Magentic 프레임워크의 단순화 버전이지만 무거운 오케스트레이션 인프라 없이 소형 모델을 실행하는 데 집중한다.

MagenticBrain은 오케스트레이션 레이어로 작동하는 14B 모델이다 — 어떤 서브 에이전트를 호출할지, 복잡한 작업을 서브 작업으로 어떻게 분할할지, 실행 단계를 통해 여러 에이전트를 어떻게 조정할지를 결정한다. Qwen 3 14B에서 파인튜닝되어 Microsoft의 실용적 접근 방식을 확인한다 — 처음부터 훈련하는 대신 최고의 사용 가능한 오픈소스 기반을 활용하고 작업 특화 훈련으로 보강한다.

왜 에이전트 AI에 소형 모델을 사용하는가?

경제적 논거는 명백하다 — 에이전트 워크플로는 일반 채팅 사용 사례보다 10배 더 많은 추론 요청을 생성할 수 있다. 프론티어 모델에서 이런 워크플로를 실행하면 빠르게 경제적으로 비실용적이 된다. 좋은 오케스트레이션을 갖춘 소형 모델은 훨씬 낮은 비용으로 90%의 결과를 낼 수 있다.

두 번째 논거는 아키텍처적이다 — 소형 모델은 온디바이스로 실행될 수 있어, 개인 정보 보호가 필요하거나(의료, 금융)저지연 상호작용을 필요로 하는 사용 사례를 열어준다. Microsoft는 Fara1.5-4B의 엣지 배포를 명시적으로 목표로 한다.

Fara1.5는 더 넓은 트렌드에 어떻게 부합하는가?

Microsoft Research 팀은 추론 경제성이 벤치마크 성능만큼 중요하다고 주장하는 성장하는 트렌드(Apple Intelligence, Google Gemini Nano, Anthropic Haiku 4.5)에 합류했다. 차이점은 Microsoft가 모델과 오케스트레이션 프레임워크 모두를 공유한다는 점이다 — MagenticBrain을 오픈소스로 공개하면 연구 커뮤니티에 협동 설계된 에이전트-모델 시스템의 첫 번째 진정한 참조 구현을 제공하게 된다.

기업 사용자에게 이는 명확한 신호다 — 에이전트 AI는 이제 OpenAI나 Anthropic 같은 외부 API에 의존하지 않고도 실현 가능하다. Microsoft는 수직 통합(자체 모델, 자체 오케스트레이션, 자체 UI)에 점점 더 집중하고 있으며, 이는 Azure 생태계 내에서 자체 파트너에 대한 전략적 레버리지를 제공한다.

자주 묻는 질문

MagenticLite란 무엇인가?
MagenticLite는 에이전트에게 브라우저와 파일 시스템 접근을 제공하는 Microsoft의 UI 애플리케이션으로, Fara1.5 계열 소형 모델을 위한 플랫폼으로 설계되었다.
Fara1.5 모델의 크기 변형은 무엇인가?
Fara1.5는 4B, 9B, 27B 세 가지 크기로 제공되며 모두 전형적인 프론티어 모델보다 훨씬 작다.
Microsoft는 에이전트 평가에 어떤 벤치마크를 사용하는가?
300개의 실제 웹 작업을 포함하는 Online-Mind2Web 벤치마크다. Fara1.5-27B는 SOTA 90% 이상을 달성해 Fara-7B의 거의 두 배 성능을 보였다.