arXiv:2605.22502: Kompilierung agentischer Workflows in LLM-Gewichte liefert Near-Frontier-Qualität bei 100× niedrigeren Kosten
Forscher zeigten, dass komplexe agentische Workflows direkt in die Gewichte eines kleineren feinabgestimmten Modells kodiert werden können, statt in externe Orchestrierung wie LangChain oder LangGraph. Der Ansatz erreicht Near-Frontier-Qualität bei 100× niedrigeren Inferenzkosten in drei realen Szenarien: Reisebuchung, Zoom-Support und Versicherung, mit Workflows von 14 bis 55 Knoten.