Mistral Medium 3.5 + Vibe: 128B dense model otvorenih težina i async cloud coding agenti za $1.5/$7.5 po milijunu tokena
Mistral AI predstavio je Mistral Medium 3.5 — gusti 128-milijardni model s 256k kontekstom, 77.6% na SWE-Bench Verified i otvorenim težinama pod modificiranim MIT licencom. Uz model dolazi Vibe, async cloud platforma za coding agente koja se pokreće iz CLI-ja ili Le Chata, te Le Chat Work mode preview za enterprise workflowove. Model košta $1.5 ulaz / $7.5 izlaz po milijunu tokena.
Mistral AI je 29. travnja 2026. predstavio Mistral Medium 3.5 zajedno s novom platformom Vibe za asinkrone cloud coding agente i preview produkta Le Chat Work mode. Najava se pozicionira kao izravan odgovor na Cursor, GitHub Copilot i Anthropic Claude for Creative Work — full-stack AI razvojni alat za enterprise.
Što je Mistral Medium 3.5?
Riječ je o gustom 128-milijardnom parametarskom modelu s 256k token kontekstom, opisanom kao “first flagship merged model” koji u jednoj arhitekturi kombinira instruction-following, reasoning i coding. Konkretne metrike:
- 77.6% na SWE-Bench Verified (popravak realnih GitHub bug-ova)
- 91.4 na τ³-Telecom (multi-tool calling u telekom domeni)
- Konfigurabilni reasoning effort po pojedinom zahtjevu
- Variable image size handling kroz custom-trained vision encoder
- Pouzdano multi-tool calling i strukturirani output
Deploy: Model je self-hostable na samo 4 GPU-a, što je značajno za enterprise koji žele on-prem. Težine su objavljene pod modificiranim MIT licencom, a API cijena je $1.5 po milijunu ulaznih, $7.5 po milijunu izlaznih tokena.
Vibe: cloud coding agenti
Vibe remote agents su asinkrone cloud sesije koje rade paralelno bez trošenja lokalnih resursa. Pokreću se direktno iz CLI-ja ili unutar Le Chata, izvršavaju duge zadatke u pozadini i imaju sandbox izolaciju za edite i instalacije. Posebno korisno svojstvo: session “teleportation” omogućuje prebacivanje sesije s lokalnog CLI-ja u cloud uz očuvanje povijesti.
Vibe je integriran s GitHub, Linear, Jira, Sentry, Slack i Teams — što ga pozicionira kao kompletan razvojni alat, ne samo coding asistent.
Le Chat Work mode
Treći komad slagalice je Le Chat Work mode (preview), agent-pogonjeni mode za enterprise:
- Cross-tool workflowi preko email, message i kalendara
- Sinteza istraživanja iz weba + interne dokumentacije + connected toolova
- Inbox triage s automatskim draft odgovorima i kreiranjem issue-a
- Persistent sesije za multi-turn problem-solving
- Transparentno action logiranje s approval gate-ovima za osjetljive operacije
Zašto je to važno?
Mistral je s ovom najavom napravio tri istovremene poteze: nova generacija flagship modela (Medium 3.5), nova agentic platforma (Vibe) i nova enterprise klijent aplikacija (Le Chat Work mode). To ga stavlja u direktnu kompeticiju s GitHub Copilot Workspace, Cursor i Anthropic Claude for Creative Work na coding fronti, te s OpenAI Managed Agents na enterprise workflow fronti.
Otvorene težine + agresivna API cijena ($1.5/$7.5) signaliziraju da Mistral cilja na EU sovereignty i samostalnost enterprise kupaca koji ne žele lock-in u Microsoft/AWS ekosustave.
Česta pitanja
- Što je novo u Mistral Medium 3.5?
- Gusti 128B model s 256k kontekstom, 'first flagship merged model' koji kombinira instruction-following, reasoning i coding. Postiže 77.6% na SWE-Bench Verified i 91.4 na τ³-Telecom benchmarku. Self-hostable na samo 4 GPU-a.
- Što je Vibe?
- Cloud platforma za async coding agente koji rade paralelno bez korištenja lokalnih resursa. Pokreću se iz CLI-ja ili Le Chata, imaju sandbox izolaciju za edite i instalacije. Integrirano s GitHub, Linear, Jira, Sentry, Slack, Teams. Sesija se može 'teleportirati' s lokalnog CLI-ja u cloud uz očuvanje povijesti.
- Koje su cijene?
- API: $1.5 po milijunu ulaznih tokena, $7.5 po milijunu izlaznih. Težine modela su otvorene pod modificiranim MIT licencom za self-hosting. Le Chat Work mode dostupan u preview-u.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
Povezane vijesti
GitHub Copilot u Visual Studio dobiva debugger agenta i cloud agent sesije iz IDE-a
ArXiv Odysseys: realistic web agents benchmark CMU-a otkriva da SOTA frontier modeli postižu 44.5% uspjeha i 1.15% Trajectory Efficiency na long-horizon zadacima
AWS Bedrock AgentCore: serverless MCP proxy s IAM, OAuth 2.0 JWT i CloudWatch observability za enterprise governance