arXiv:2605.03195: Terminus-4B — 4 milijarde parametara za terminal execution izjednačava Claude Opus i GPT-5.3-Codex na SWE-Bench Pro uz ~30 % niže tokene glavnog agenta
Terminus-4B je 4-milijardni Qwen3 fine-tune specijaliziran za terminal execution u agentskim sustavima — na SWE-Bench Pro benchmarku izjednačava i ponekad nadmašuje Claude Sonnet/Opus i GPT-5.3-Codex baseline, a smanjuje potrošnju tokena glavnog agenta do otprilike 30 % izolacijom verbose build/test logova u subagent kontekstu.