arXiv:2605.03195: Terminus-4B — 4 Milliarden Parameter für Terminal-Execution auf Augenhöhe mit Claude Opus und GPT-5.3-Codex bei SWE-Bench Pro mit ~30 % weniger Haupt-Agent-Token
Terminus-4B ist ein 4-Milliarden-Parameter-Qwen3-Fine-Tune, spezialisiert auf Terminal-Execution in Agenten-Systemen — auf dem SWE-Bench-Pro-Benchmark erreicht er Claude Sonnet/Opus und GPT-5.3-Codex und reduziert den Token-Verbrauch des Haupt-Agenten durch Isolation von Build/Test-Logs im Subagenten-Kontext um etwa 30 %.