Microsoft Research: MagenticLite + Fara1.5 (4B/9B/27B) — agentic AI optimiziran za male modele postiže SOTA
Microsoft Research je 21. svibnja 2026. objavio trojku za agentic AI s malim modelima: MagenticLite (browser i filesystem UI aplikacija), MagenticBrain (14B orchestration model fine-tuned iz Qwen 3 14B) i Fara1.5 (computer-use model u 4B, 9B i 27B varijantama). Fara1.5-27B dostiže preko 90% SOTA na Online-Mind2Web benchmarku (300 web zadataka), gotovo udvostručujući performanse prethodnog Fara-7B. Cilj je pokazati da agentic AI ne zahtijeva goleme modele — samo dobro koodesignirane alate i harness.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
Microsoft Research objavio je 21. svibnja 2026. trojni paket za agentic AI koji konkretno argumentira da računarski sustavi s autonomnim agentima ne trebaju ovisiti o frontier modelima veličine GPT-5 ili Claude Opus. Najavljeni su istovremeno MagenticLite (UI aplikacija za browser i filesystem), MagenticBrain (14B orchestration model fine-tuned iz Qwen 3 14B) i Fara1.5 (computer-use model u tri veličine: 4B, 9B i 27B).
Što čini Fara1.5 modele drugačijima od konkurencije?
Fara1.5 je dizajniran za computer-use zadatke — agenta koji navigira browserom, popunjava forme, klika na linkove, čita stranice i interpretira UI elemente. Microsoft nudi tri veličine — 4B za edge i mobile use cases, 9B za balansiran inference trošak, te 27B za maksimum performansi. Sve tri veličine su pod istim arhitektonskim principom: koodesign s alatima i harness slojem koji eliminira potrebu za ogromnim parametarskim brojevima.
Ključna metrika je Online-Mind2Web benchmark — set od 300 stvarnih web zadataka koji uključuju multi-step browsing, prikupljanje informacija i interakciju s realnim sajtovima. Fara1.5-27B dostiže preko 90% performansi state-of-the-art frontier modela na tom benchmarku, što je gotovo dvostruko bolji rezultat od prethodne generacije Fara-7B.
Koja je uloga MagenticLite i MagenticBrain u sustavu?
MagenticLite je klijent — aplikacija koja agentu daje pristup browseru i filesystemu. To je pojednostavljena verzija šireg Magentic frameworka koji Microsoft Research razvija nekoliko godina, ali fokusirana na pokretanje malih modela bez teške orkestracijske infrastrukture.
MagenticBrain je 14B model koji djeluje kao orchestration sloj — odlučuje koji sub-agent treba pozvati, kako razdijeliti složeni zadatak na podzadatke, i kako koordinirati više agenata kroz fazu izvršavanja. Fine-tuned je iz Qwen 3 14B, što potvrđuje Microsoftov pragmatičan pristup — koristi najboljeg dostupnog open-source bazi i nadograđuje ga zadatkom-specifičnom obukom umjesto treniranja iz nule.
Zašto male modele za agentic AI?
Ekonomski argument je očit — agentic workflowovi mogu generirati 10× više inference zahtjeva od običnog chat use case-a. Pokretanje takvih workflowova na frontier modelima brzo postaje ekonomski neisplativo. Mali modeli s dobrom orkestracijom mogu dati 90% rezultata uz mnogo manji trošak.
Drugi argument je arhitektonski — small models mogu se pokretati on-device, što otključava use case-ove koji zahtijevaju privatnost (zdravstvo, financije) ili low-latency interakciju. Microsoft eksplicitno cilja edge deployment za Fara1.5-4B.
Kako se Fara1.5 uklapa u širi trend?
Microsoft Research time se pridružuje rastućem trendu (Apple Intelligence, Google Gemini Nano, Anthropic Haiku 4.5) koji argumentira da je inferencijska ekonomija jednako važna kao i benchmark performanse. Razlika je u tome što Microsoft dijeli i model i orchestration framework — open-sourcing MagenticBrain bi dao istraživačkoj zajednici prvu pravu referentnu implementaciju koodesigniranog agent-model sustava.
Za enterprise korisnike, ovo je jasan signal — agentic AI je sada moguć bez ovisnosti o vanjskim API-jevima poput OpenAI ili Anthropic. Microsoft je sve više fokusiran na vertikalnu integraciju (vlastiti modeli, vlastiti orchestration, vlastiti UI) što mu daje strateški poluga prema vlastitim partnerima u Azure ekosustavu.
Česta pitanja
- Što je MagenticLite?
- MagenticLite je Microsoftova UI aplikacija koja omogućava agentima rad s browserom i filesystemom, dizajnirana kao platforma za male modele iz Fara1.5 obitelji.
- Kolike su varijante Fara1.5 modela?
- Fara1.5 dolazi u tri veličine: 4B, 9B i 27B parametara — sve značajno manje od tipičnih frontier modela.
- Koji benchmark koristi Microsoft za evaluaciju agenata?
- Online-Mind2Web benchmark s 300 stvarnih web zadataka. Fara1.5-27B dostiže preko 90% SOTA, gotovo dvostruko bolji od Fara-7B.
Povezane vijesti
AWS: Nova Act dobio HIPAA-eligibility — agentska automatizacija ePHI za zdravstvene radne tokove
Anthropic: Claude Code v2.1.147 uvodi Workflow tool za deterministički multi-agent orchestration
LangChain: Od token streama do agent streama — tipizirani kanali zamjenjuju klasično streamanje za multi-agent UI