Mistral Medium 3.5 + Vibe:128B 밀집 오픈 가중치 모델과 비동기 클라우드 코딩 에이전트, 백만 토큰당 $1.5/$7.5
Mistral AI는 256k 컨텍스트 창을 갖추고 SWE-Bench Verified에서 77.6%를 달성한 1,280억 파라미터 밀집 모델 Mistral Medium 3.5를 출시했습니다. 수정된 MIT 라이선스로 가중치를 공개합니다. CLI 또는 Le Chat에서 시작할 수 있는 비동기 클라우드 코딩 에이전트 플랫폼 Vibe와 엔터프라이즈 워크플로우용 Le Chat Work mode 프리뷰도 함께 제공됩니다. 가격은 입력 $1.5/백만 토큰, 출력 $7.5/백만 토큰입니다.
Mistral AI는 2026년 4월 29일 Mistral Medium 3.5와 비동기 클라우드 코딩 에이전트용 새 플랫폼 Vibe, 그리고 Le Chat Work mode 프리뷰를 발표했습니다. 이번 발표는 Cursor, GitHub Copilot, Anthropic Claude for Creative Work에 대한 직접적인 대응으로서 엔터프라이즈를 위한 풀스택 AI 개발 도구로 포지셔닝됩니다.
Mistral Medium 3.5란?
1,280억 파라미터 밀집 모델로 256k 토큰 컨텍스트를 갖추고 있습니다. 명령 수행·추론·코딩을 단일 아키텍처에 통합한 「첫 번째 플래그십 융합 모델」로 설명됩니다. 구체적인 지표:
- 77.6% — SWE-Bench Verified(실제 GitHub 버그 수정)
- 91.4 — τ³-Telecom(통신 도메인 멀티 툴 호출)
- 요청별 구성 가능한 추론 강도
- 커스텀 학습된 비전 인코더로 가변 이미지 크기 처리
- 신뢰할 수 있는 멀티 툴 호출 및 구조화된 출력
배포: 모델은 GPU 4개만으로 자체 호스팅 가능하여, 온프레미스를 원하는 엔터프라이즈에 중요합니다. 가중치는 수정된 MIT 라이선스로 공개되며, API 가격은 입력 $1.5/백만 토큰, 출력 $7.5/백만 토큰입니다.
Vibe:클라우드 코딩 에이전트
Vibe 원격 에이전트는 로컬 리소스를 소비하지 않고 병렬로 작동하는 비동기 클라우드 세션입니다. CLI 또는 Le Chat에서 직접 시작하고, 장시간 작업을 백그라운드에서 실행하며, 편집 및 설치를 위한 샌드박스 격리를 갖추고 있습니다. 특히 실용적인 기능은 세션 「텔레포테이션」 — 로컬 CLI 세션을 기록을 유지한 채 클라우드로 이전할 수 있습니다.
Vibe는 GitHub, Linear, Jira, Sentry, Slack, Teams와 통합되어 단순한 코딩 어시스턴트가 아닌 완전한 개발 도구로 포지셔닝됩니다.
Le Chat Work mode
퍼즐의 세 번째 조각은 Le Chat Work mode(프리뷰), 에이전트 구동 엔터프라이즈 모드입니다:
- 이메일·메시지·캘린더에 걸친 크로스 툴 워크플로우
- 웹·내부 문서·연결된 툴에서 나온 연구 통합
- 자동 초안 답변 및 이슈 생성을 갖춘 받은 편지함 분류
- 멀티 턴 문제 해결을 위한 지속 세션
- 민감한 작업에 승인 게이트를 갖춘 투명한 작업 로그
왜 중요한가?
Mistral은 이번 발표로 세 가지 동시 이동을 실행했습니다:새 세대 플래그십 모델(Medium 3.5), 새 에이전틱 플랫폼(Vibe), 새 엔터프라이즈 클라이언트 앱(Le Chat Work mode). 이로써 코딩 분야에서는 GitHub Copilot Workspace, Cursor, Anthropic Claude for Creative Work와, 엔터프라이즈 워크플로우 분야에서는 OpenAI Managed Agents와 직접 경쟁하는 위치에 놓입니다.
공개 가중치와 공격적인 API 가격($1.5/$7.5)은 Mistral이 EU 디지털 주권과 Microsoft/AWS 생태계 종속을 피하려는 엔터프라이즈 고객의 자율성을 타깃으로 하고 있음을 시사합니다.
자주 묻는 질문
- Mistral Medium 3.5의 새로운 점은 무엇입니까?
- 256k 컨텍스트를 갖춘 1,280억 파라미터 밀집 모델로, 명령 수행·추론·코딩을 단일 아키텍처에 통합한 「첫 번째 플래그십 융합 모델」이라고 설명됩니다. SWE-Bench Verified에서 77.6%, τ³-Telecom 벤치마크에서 91.4를 달성했습니다. 요청별로 추론 강도를 설정할 수 있으며, 커스텀 학습된 비전 인코더로 가변 이미지 크기를 처리합니다. GPU 4개만으로 자체 호스팅 가능합니다.
- Vibe는 무엇입니까?
- 로컬 리소스를 소비하지 않고 병렬로 작동하는 비동기 클라우드 코딩 에이전트 플랫폼입니다. CLI 또는 Le Chat에서 시작하며, 편집 및 설치를 위한 샌드박스 격리를 갖추고 있습니다. 특히 유용한 기능은 세션 「텔레포테이션」으로, 로컬 CLI 세션을 기록을 유지한 채 클라우드로 이전할 수 있습니다. GitHub, Linear, Jira, Sentry, Slack, Teams와 통합됩니다.
- 가격은 어떻게 됩니까?
- API:입력 $1.5/백만 토큰, 출력 $7.5/백만 토큰. 모델 가중치는 자체 호스팅을 위해 수정된 MIT 라이선스로 공개됩니다. Le Chat Work mode는 프리뷰 단계에서 이용 가능합니다.
이 기사는 AI가 1차 출처를 기반으로 생성했습니다.