Google:Gemini 3.5 Flash와 Pro — 지금까지 가장 빠른 프론티어 모델
Google은 Google I/O 2026에서 Gemini 3.5 Flash와 Pro를 발표했습니다 — 경쟁사보다 4배 빠른 프론티어 모델로, 에이전트 작업에 특별히 중점을 두고 개발자를 위한 새로운 Antigravity 2.0 플랫폼과 24시간 이용 가능한 개인 AI 에이전트 Gemini Spark를 강조합니다.
18 개 뉴스 — 🔴 2 중요 , 🟡 10 주목 , 🟢 6 흥미
Google은 Google I/O 2026에서 Gemini 3.5 Flash와 Pro를 발표했습니다 — 경쟁사보다 4배 빠른 프론티어 모델로, 에이전트 작업에 특별히 중점을 두고 개발자를 위한 새로운 Antigravity 2.0 플랫폼과 24시간 이용 가능한 개인 AI 에이전트 Gemini Spark를 강조합니다.
Google은 I/O 2026에서 Gemini Omni Flash를 발표했습니다 — 이미지, 오디오, 동영상, 텍스트의 조합에서 동영상을 생성하고 편집하는 새로운 멀티모달 모델입니다. YouTube Shorts에서 오늘부터 바로 이용 가능하며, 생성된 모든 클립에 SynthID 디지털 워터마크가 의무적으로 삽입됩니다.
Google이 『Nature』지에 ERA(Empirical Research Assistance:실증 연구 지원)를 발표했습니다 — Gemini 기반 시스템으로 트리 탐색을 통해 수천 가지 계산 접근법을 평가하고 전문적인 과학 소프트웨어 작성을 자동화합니다. Computational Discovery 플랫폼은 Google Labs를 통해 연구자들에게 이미 공개되어 있습니다.
연구자들이 대형 언어 모델의 KV 캐시 양자화의 근본적인 문제를 해결하는 OScaR을 발표했습니다. 값당 2비트의 INT2 정밀도를 사용하면서도 거의 정확도 손실 없이 3배 빠른 디코딩, 5.3배 적은 메모리, BF16 FlashDecoding-v2 대비 4.1배 높은 처리량을 달성했습니다.
Google DeepMind가 싱가포르 정부와 의료·교육·지속 가능성 분야를 아우르는 국가 AI 파트너십을 체결했습니다. 2040년까지 AI가 연구개발 가속화를 통해 싱가포르 경제에 추가로 25억 달러를 가져다줄 것으로 전망됩니다.
OpenAI가 『Education for Countries』 이니셔티브의 2단계에 돌입했습니다. 정부 파트너십을 확대하고, 교사를 위한 OpenAI Luminaries 프로그램을 도입하며, OpenAI Academy를 통해 자격증을 제공합니다. 목표는 실제 효과를 측정하면서 AI 도구를 국가 교육 시스템에 체계적으로 통합하는 것입니다.
OECD.AI와 EU AI Office는 유럽이 농업, 의료, 산업, 모빌리티의 4개 전략 분야에 AI를 배치하는 현황을 기록했습니다. Robs4Crops, European Cancer Imaging Initiative, AI4Cities 등의 프로젝트가 진행 중이지만 데이터 단편화와 디지털 기술 부족이 광범위한 보급을 저해합니다.
Claude Code v2.1.145는 스크립팅을 위한 JSON 라이브 세션 출력, 에이전트 추적을 위한 확장된 OTEL 트레이스 속성, 그리고 Bash 명령 승인 시 보안 취약점 수정을 제공합니다. npm install -g @anthropic-ai/claude-code를 통해 업데이트할 수 있습니다.
Anthropic과 KPMG가 전략적 글로벌 얼라이언스를 체결하여 Claude가 세계 4대 회계법인 중 하나의 전체 직원들에게 접근권을 갖게 됩니다. Claude는 KPMG의 Digital Gateway에 통합되며, KPMG는 프라이빗 에쿼티 분야에서 Anthropic의 우선 파트너가 됩니다.
AWS는 Amazon Nova Sonic과 AgentCore Gateway를 사용하는 확장 가능한 음성 에이전트를 위한 상세 가이드를 발표했습니다. 직접 도구, 하위 에이전트, 세션 분할이라는 세 가지 아키텍처 패턴은 지연 시간과 운영 복잡성 사이의 다양한 트레이드오프를 제공합니다.
Google의 Gemini 3.5 Flash 모델이 모든 GitHub Copilot 플랜에 정식 출시(GA)됩니다. Flash 티어의 속도와 낮은 비용으로 Pro 수준에 가까운 코드 품질을 제공하며, 에이전트형 워크플로와 다양한 IDE 환경에 대한 지원을 강조합니다.
EnvFactory는 도구 사용 에이전트 훈련을 위한 실행 가능 환경을 자동 합성하는 새로운 프레임워크입니다. Qwen3 모델에서 85개의 검증된 환경만으로 BFCLv3에서 +15%, MCP-Atlas에서 +8.6% 향상을 달성하며 동류 방법 대비 5배 효율적입니다.
LongMINT는 장기 동적 시나리오에서 AI 에이전트의 메모리 관리를 측정하는 최초의 벤치마크입니다. 1만 5,600개의 질문-답변 쌍을 포함하며 컨텍스트는 최대 180만 토큰에 달합니다. 테스트된 시스템의 평균 정확도는 27.9%에 불과하며 많은 경우 무작위 추측보다 낮습니다.
새로운 arXiv 논문이 프로덕션 LLM 에이전트의 핵심 설계 원칙으로 확률적-결정론적 경계를 도입하고, 조정·상태·제어라는 세 가지 아키텍처적 관심사에 따라 선택하는 6가지 조합 가능한 런타임 패턴을 정의합니다——계층적 위임부터 휴먼 인 더 루프까지.
새로운 연구는 프롬프트 기반 제한이 무단 도구 호출률을 11~18%만 줄일 수 있음을 증명합니다. 반면 ABAC를 가진 아키텍처 레이어 MCP 프록시는 50ms 미만의 지연으로 완전한 보호를 달성합니다. 이 연구는 EMNLP 2026 Industry Track 발표를 앞두고 있습니다.
CNCF Falco 팀이 Prempti를 공개했습니다. Falco의 런타임 보안 모델을 AI 코딩 에이전트로 확장하는 실험적 프로젝트입니다. 이 시스템은 도구 호출을 실행 전에 가로채 정책 규칙을 적용함으로써, 팀이 Claude Code 같은 에이전트의 행동을 제어할 수 있게 합니다.
IBM은 엔터프라이즈 클라이언트를 위한 가장 첨단 AI 기반 보안 포트폴리오를 발표했으며, Anthropic과 협력하는 Project Glasswing의 작업으로 강화되어 AI 공격을 자율적으로 탐지하고 대응합니다. 새로운 IBM Autonomous Security 포트폴리오는 완전한 위협 생명주기를 포괄합니다.