🔴 🤝 Agenten Veröffentlicht: · 3 Min. Lesezeit ·

Microsoft Research: MagenticLite + Fara1.5 (4B/9B/27B) — agentische KI für kleine Modelle erreicht SOTA

Editorial illustration: MagenticLite + Fara1.5 (4B/9B/27B) — agentische KI für kleine Modelle erreicht SOTA

Microsoft Research veröffentlichte am 21. Mai 2026 ein Trio für agentische KI mit kleinen Modellen: MagenticLite (eine Browser- und Filesystem-UI-Anwendung), MagenticBrain (ein 14B-Orchestrierungsmodell, fine-tuned aus Qwen 3 14B) und Fara1.5 (ein Computer-Use-Modell in 4B-, 9B- und 27B-Varianten). Fara1.5-27B erreicht über 90 % des SOTA auf dem Online-Mind2Web-Benchmark (300 Web-Aufgaben) — fast doppelt so gut wie das frühere Fara-7B. Ziel ist zu zeigen, dass agentische KI keine riesigen Modelle braucht, sondern gut co-designte Tools und einen Harness.

🤖

Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.

Microsoft Research veröffentlichte am 21. Mai 2026 ein Dreierpaket für agentische KI, das konkret argumentiert, dass autonome Agentensysteme nicht auf Frontier-Modelle der Größe von GPT-5 oder Claude Opus angewiesen sein müssen. Gleichzeitig wurden MagenticLite (eine UI-Anwendung für Browser und Dateisystem), MagenticBrain (ein 14B-Orchestrierungsmodell, fine-tuned aus Qwen 3 14B) und Fara1.5 (ein Computer-Use-Modell in drei Größen: 4B, 9B und 27B) angekündigt.

Was unterscheidet die Fara1.5-Modelle von der Konkurrenz?

Fara1.5 ist für Computer-Use-Aufgaben konzipiert — ein Agent, der im Browser navigiert, Formulare ausfüllt, Links anklickt, Seiten liest und UI-Elemente interpretiert. Microsoft bietet drei Größen an — 4B für Edge- und Mobile-Anwendungsfälle, 9B für ausgewogene Inferenzkosten und 27B für maximale Leistung. Alle drei Größen folgen demselben architektonischen Prinzip: Co-Design mit Tools und einer Harness-Schicht, die den Bedarf an enormen Parameteranzahlen eliminiert.

Die Schlüsselmetrik ist der Online-Mind2Web-Benchmark — ein Set von 300 echten Web-Aufgaben mit mehrstufigem Browsing, Informationssammlung und Interaktion mit realen Websites. Fara1.5-27B erreicht über 90 % der State-of-the-Art-Frontier-Modell-Leistung auf diesem Benchmark — fast doppelt so gut wie die Vorgängergeneration Fara-7B.

Welche Rolle spielen MagenticLite und MagenticBrain im System?

MagenticLite ist der Client — eine Anwendung, die dem Agenten Zugriff auf Browser und Dateisystem gewährt. Es ist eine vereinfachte Version des umfassenderen Magentic-Frameworks, das Microsoft Research seit mehreren Jahren entwickelt, aber fokussiert auf das Ausführen kleiner Modelle ohne schwere Orchestrierungsinfrastruktur.

MagenticBrain ist das 14B-Modell, das als Orchestrierungsschicht fungiert — es entscheidet, welchen Sub-Agenten es aufrufen soll, wie eine komplexe Aufgabe in Teilaufgaben aufzuteilen ist und wie mehrere Agenten während der Ausführungsphase koordiniert werden. Es wurde aus Qwen 3 14B fine-tuned, was Microsofts pragmatischen Ansatz bestätigt — die beste verfügbare Open-Source-Basis nutzen und aufgabenspezifisches Training darüber legen, statt von Grund auf zu trainieren.

Warum kleine Modelle für agentische KI?

Das wirtschaftliche Argument ist eindeutig — agentische Workflows können 10× mehr Inferenzanfragen erzeugen als ein Standard-Chat-Anwendungsfall. Das Ausführen solcher Workflows auf Frontier-Modellen wird schnell wirtschaftlich unrentabel. Kleine Modelle mit guter Orchestrierung können 90 % der Ergebnisse zu deutlich geringeren Kosten liefern.

Das zweite Argument ist architektonisch — kleine Modelle können on-device betrieben werden, was Anwendungsfälle erschließt, die Datenschutz (Gesundheitswesen, Finanzen) oder niedrige Latenz erfordern. Microsoft zielt explizit auf Edge-Deployment für Fara1.5-4B ab.

Wie fügt sich Fara1.5 in den breiteren Trend ein?

Das Microsoft Research-Team schließt sich einem wachsenden Trend an (Apple Intelligence, Google Gemini Nano, Anthropic Haiku 4.5), der argumentiert, dass Inferenzökonomie genauso wichtig ist wie Benchmark-Leistung. Der Unterschied besteht darin, dass Microsoft sowohl das Modell als auch das Orchestrierungs-Framework teilt — ein Open-Sourcing von MagenticBrain würde der Forschungsgemeinschaft die erste echte Referenzimplementierung eines co-designten Agenten-Modell-Systems liefern.

Für Unternehmensnutzer ist dies ein klares Signal — agentische KI ist nun ohne Abhängigkeit von externen APIs wie OpenAI oder Anthropic möglich. Microsoft ist zunehmend auf vertikale Integration fokussiert (eigene Modelle, eigene Orchestrierung, eigene UI), was ihm strategischen Hebel gegenüber seinen Partnern im Azure-Ökosystem verschafft.

Häufig gestellte Fragen

Was ist MagenticLite?
MagenticLite ist Microsofts UI-Anwendung, die Agenten den Zugriff auf Browser und Dateisystem ermöglicht — als Plattform für kleine Modelle der Fara1.5-Familie konzipiert.
Welche Varianten hat das Fara1.5-Modell?
Fara1.5 ist in drei Größen erhältlich: 4B, 9B und 27B Parameter — alle deutlich kleiner als typische Frontier-Modelle.
Welchen Benchmark verwendet Microsoft zur Agentenbewertung?
Den Online-Mind2Web-Benchmark mit 300 echten Web-Aufgaben. Fara1.5-27B erreicht über 90 % des SOTA — fast doppelt so gut wie Fara-7B.