🤝 에이전트

145 개 뉴스

🔴 🤝 에이전트 2026년 5월 23일 · 3 분 읽기

arXiv:2605.22502:에이전트 워크플로를 LLM 가중치로 컴파일하여 100분의 1 비용으로 프런티어 근접 품질 달성

편집 일러스트: 워크플로우 노드가 컴팩트한 신경망 코어로 축약

연구자들은 복잡한 에이전트 워크플로를 LangChain이나 LangGraph 같은 외부 오케스트레이션 대신 미세 조정된 소형 모델의 가중치에 직접 인코딩할 수 있음을 보여주었습니다. 이 접근법은 여행 예약, Zoom 지원, 보험 등 세 가지 실제 시나리오(14〜55개 노드 워크플로)에서 프런티어 근접 품질을 달성하며 추론 비용을 100배 낮춥니다.

🔴 🤝 에이전트 2026년 5월 23일 · 3 분 읽기

arXiv:2605.22794:MOSS, 자신의 소스 코드를 수정하여 자기 개선하는 에이전트 시연

편집 일러스트: 샌드박스 루프에서 자신의 소스 코드를 재작성하는 AI 에이전트

연구자들이 MOSS를 제안했습니다. 이는 프롬프트나 파인 튜닝 가중치가 아닌 자신의 소스 코드를 재작성하여 개선하는 자율 에이전트 프레임워크입니다. OpenClaw 벤치마크에서 한 사이클의 MOSS 자기 진화가 점수를 인간의 개입 없이 0.25에서 0.61로 끌어올려, 에이전트가 텍스트 전용 방법으로는 건드릴 수 없는 라우팅, 훅, 디스패치 로직을 수정할 수 있음을 보여줍니다.

🟡 🤝 에이전트 2026년 5월 23일 · 3 분 읽기

arXiv:2605.22535:TerminalWorld 벤치마크, 시뮬레이션 없이 실제 Linux 터미널 작업에서 LLM 에이전트를 평가합니다

편집 삽화: git과 bash 명령어가 있는 터미널 프롬프트와 이를 실행하는 AI 에이전트

TerminalWorld는 시뮬레이션 없이 실제 Linux 프로세스에서 bash, git, 파일 작업을 수행하는 LLM 에이전트를 평가하는 새로운 벤치마크입니다. Zhaoyang Chu와 Jiarui Hu가 이끄는 8명의 저자 연구진은 『컴퓨터 사용』 에이전트의 새로운 기준을 제시하며, Claude Code, GitHub Copilot Workspace, Cursor 에이전트 모드 등의 도구와 직접적인 연관성이 있습니다.

🟡 🤝 에이전트 2026년 5월 23일 · 3 분 읽기

Anthropic Claude Code v2.1.149, /usage 카테고리 분류와 PowerShell 권한 우회 수정 제공

편집 일러스트: 사용량 분포 차트와 보안 방패가 있는 터미널

Anthropic이 Claude Code CLI v2.1.149를 출시하여 /usage 명령을 카테고리별 비용 분류(skills, subagents, plugins, MCP 서버별)로 확장했습니다. 두 가지 보안 취약점이 수정되었습니다:PowerShell 내장 함수를 통한 권한 우회와 git worktree 샌드박스의 잘못된 allowlist. 클라우드 MCP 커넥터 연결을 편리하게 하는 기업 설정 allowAllClaudeAiMcps도 추가되었습니다.

🔴 🤝 에이전트 2026년 5월 22일 · 3 분 읽기

Microsoft Research:MagenticLite + Fara1.5(4B/9B/27B)— 소형 모델에 최적화된 에이전트 AI가 SOTA 달성

편집 일러스트:MagenticLite + Fara1.5(4B/9B/27B)— 소형 모델에 최적화된 에이전트 AI가 SOTA 달성

Microsoft Research는 2026년 5월 21일 소형 모델 에이전트 AI를 위한 세 가지를 발표했다. MagenticLite(브라우저 및 파일 시스템 UI 앱), MagenticBrain(Qwen 3 14B에서 파인튜닝한 14B 오케스트레이션 모델), Fara1.5(4B/9B/27B 세 가지 크기의 컴퓨터 사용 모델)다. Fara1.5-27B는 Online-Mind2Web 벤치마크(300개 웹 작업)에서 SOTA 90% 이상을 달성해 전 세대 Fara-7B의 거의 두 배 성능을 기록했다. 목표는 에이전트 AI에 거대 모델이 필요하지 않음을 증명하는 것이다 — 잘 설계된 도구와 실행 프레임워크만으로 충분하다.

🟡 🤝 에이전트 2026년 5월 22일 · 2 분 읽기

AWS:Nova Act HIPAA 적격 획득 — 의료 워크플로를 위한 ePHI 에이전트 자동화 해금

편집 일러스트:Nova Act HIPAA 적격 획득 — 의료 워크플로를 위한 ePHI 에이전트 자동화

AWS는 2026년 5월 21일 브라우저 및 UI 워크플로 자동화를 위한 에이전트 AI 서비스인 Amazon Nova Act가 HIPAA 적격 상태를 획득했다고 발표했다. 의료 기관은 이제 Nova Act를 사용해 보호된 의료 정보(ePHI)로 작업할 수 있다. 공급자 웹 포털을 통한 사전 승인, 보험 확인, 의뢰 전송을 지원한다. Amazon Bedrock AgentCore 및 Strand Agents 프레임워크와 통합되며, BAA 계약 서명과 AWS KMS 암호화가 필요하고 현재 미동부(북버지니아) 리전에서만 제공된다.

🟡 🤝 에이전트 2026년 5월 22일 · 2 분 읽기

Anthropic:Claude Code v2.1.147, 결정론적 다중 에이전트 오케스트레이션을 위한 Workflow 도구 도입

편집 일러스트:Claude Code v2.1.147, 결정론적 다중 에이전트 오케스트레이션을 위한 Workflow 도구 도입

Anthropic은 2026년 5월 21일 20:39 UTC에 Claude Code v2.1.147을 출시하며 Claude Code 생태계 최초의 결정론적 다중 에이전트 오케스트레이션 메커니즘인 Workflow 도구를 도입했다. 도구는 초기 기본값으로 비활성화되며 환경 변수 CLAUDE_CODE_WORKFLOWS=1로 활성화된다. 같은 버전에서 기존 /simplify 명령이 노력 수준(높음/보통/낮음)을 지원하는 /code-review로 이름이 바뀌고, 프로토타입 오염 및 thenable 기반 탈출 공격에 대한 샌드박스 강화가 추가되었다.

🟡 🤝 에이전트 2026년 5월 22일 · 3 분 읽기

LangChain:토큰 스트림에서 에이전트 스트림으로 — 타입화 채널이 다중 에이전트 UI의 고전적 스트리밍을 대체

편집 일러스트:토큰 스트림에서 에이전트 스트림으로 — 타입화 채널이 다중 에이전트 UI의 고전적 스트리밍을 대체

LangChain은 2026년 5월 21일 Christian Bromann과 Nick Hollon이 작성한 포스트를 공개해 토큰 스트림에서 구조화된 에이전트 스트림으로의 패러다임 진화를 설명했다. 현대 AI 에이전트는 작업을 계획하고, 서브 에이전트에 위임하고, 도구를 호출하고, 인간 검토를 위해 일시 중지한다 — 고전적인 텍스트 토큰 스트리밍은 이 작업을 표시하기에 충분하지 않다. LangChain은 LangGraph에서 메시지·도구 호출·상태 변화·서브 에이전트 활동·커스텀 이벤트를 전달하는 타입화 채널을 제안한다. 애플리케이션은 관련 타입만 구독해 장시간 실행 워크로드에서 효율적인 UI를 만든다.

🟡 🤝 에이전트 2026년 5월 22일 · 2 분 읽기

OpenAI:Codex 엔터프라이즈 확장 — 주간 활성 사용자 400만 명과 Codex Labs 프로그램

편집 일러스트:Codex 엔터프라이즈 확장 — 주간 활성 사용자 400만 명과 Codex Labs 프로그램

OpenAI는 2026년 5월 21일 Codex 플랫폼의 엔터프라이즈 확장을 발표했다. 이 에이전트 코딩 도구는 주간 활성 사용자 400만 명에 도달했다. 새로운 Codex Labs 프로그램과 대형 컨설팅 회사와의 파트너십이 발표되어 대기업이 Codex를 구현하고 확장하는 것을 지원할 것이다. 이 소식은 Codex를 중고급 시장에서 GitHub Copilot의 직접 경쟁자로 포지셔닝하는 공식 엔터프라이즈 시장 진출을 의미한다.

🟡 🤝 에이전트 2026년 5월 21일 · 2 분 읽기

Anthropic: Claude Managed Agents에 MCP Tunnels와 셀프 호스팅 샌드박스 도입

Editorial illustration: Anthropic MCP Tunnels 프라이빗 네트워크 지원과 Claude Managed Agents 셀프 호스팅 샌드박스 출시

Anthropic은 2026년 5월 19일 Research Preview에서 MCP Tunnels를 발표했습니다. 이 기능은 Claude 에이전트가 사용자의 프라이빗 네트워크 내 Model Context Protocol 서버에 연결할 수 있도록 하며, Anthropic 인프라의 대안인 셀프 호스팅 샌드박스도 함께 공개됐습니다. 업데이트에는 활성 세션 내 MCP 구성의 동적 변경과 10만 토큰을 초과하는 도구 출력의 샌드박스 파일 자동 오버플로도 포함됩니다.

🟡 🤝 에이전트 2026년 5월 21일 · 2 분 읽기

Google DeepMind: Co-Scientist——과학 연구를 위한 멀티 에이전트 AI 파트너

Editorial illustration: Google DeepMind Co-Scientist 멀티 에이전트 AI 시스템이 과학 연구를 가속화

Google DeepMind는 2026년 5월 19일 Co-Scientist를 발표했습니다. Gemini 기반의 멀티 에이전트 AI 시스템으로, 6개의 전문화된 에이전트가 아이디어 토너먼트 토론을 통해 과학적 가설을 생성·논의·개선합니다. 100개 이상의 연구 기관과 공동 개발됐으며, 간 섬유증, ALS, 세포 노화, 감염병 연구에서 구체적인 성과를 거뒀고, 분석 시간을 수개월에서 수일로 단축했습니다.

🟡 🤝 에이전트 2026년 5월 21일 · 2 분 읽기

Google: I/O 2026 2차 발표——Antigravity 2.0, Gemini Spark, Universal Cart

Editorial illustration: Google I/O 2026 두 번째 발표——Antigravity 2.0, Gemini Spark, Universal Cart가 에이전트 우선 전략 완성

Google은 I/O 2026 컨퍼런스에서 두 번째 대형 AI 발표를 했습니다. CLI와 SDK를 갖춘 에이전트 우선 개발 플랫폼 Antigravity 2.0, 기기에서 백그라운드로 상시 작동하는 개인 AI 에이전트 Gemini Spark, Google 서비스 전반에 통합된 AI 쇼핑 어시스턴트 Universal Cart입니다. 세 제품은 이전 파이프라인 런에서 보도된 Gemini 3.5 Flash 및 Gemini Omni 발표에 이어지며, Google의 에이전트 우선 생태계 전략을 완성합니다.

🟡 🤝 에이전트 2026년 5월 21일 · 2 분 읽기

LangChain: Deep Agents에 도구 호출 사이 코드 실행을 위한 QuickJS 인터프리터 도입

Editorial illustration: LangChain Deep Agents의 QuickJS 인터프리터가 도구 호출 사이 상태를 유지하고 토큰 소비 감소

LangChain은 2026년 5월 20일 Deep Agents 프레임워크에 인터프리터를 도입했습니다. 에이전트가 LLM 도구 호출 사이에 코드를 작성하고 실행할 수 있는 내장 QuickJS 런타임 환경으로, 상태를 메시지 기록에 직렬화할 필요가 없습니다. 회사는 일부 작업에서 최대 35% 토큰 소비 감소를 주장하며, 기본적으로 파일 시스템, 네트워크, 셸에 대한 접근이 없는 명시적으로 제어된 액션 공간을 제공합니다.

🟡 🤝 에이전트 2026년 5월 20일 · 2 분 읽기

Anthropic Claude Code:v2.1.145에서 라이브 세션 스크립팅과 보안 수정 제공

Editorial illustration:

Claude Code v2.1.145는 스크립팅을 위한 JSON 라이브 세션 출력, 에이전트 추적을 위한 확장된 OTEL 트레이스 속성, 그리고 Bash 명령 승인 시 보안 취약점 수정을 제공합니다. npm install -g @anthropic-ai/claude-code를 통해 업데이트할 수 있습니다.

🟡 🤝 에이전트 2026년 5월 20일 · 2 분 읽기

Anthropic:138개국 KPMG 직원 27만 6천 명에게 Claude 제공

Editorial illustration: Anthropic i KPMG sklopili su stratešku globalnu alijansu kojom Claude dobiva pristup svim zaposlenic

Anthropic과 KPMG가 전략적 글로벌 얼라이언스를 체결하여 Claude가 세계 4대 회계법인 중 하나의 전체 직원들에게 접근권을 갖게 됩니다. Claude는 KPMG의 Digital Gateway에 통합되며, KPMG는 프라이빗 에쿼티 분야에서 Anthropic의 우선 파트너가 됩니다.

🟡 🤝 에이전트 2026년 5월 20일 · 2 분 읽기

AWS:Amazon Nova Sonic으로 확장 가능한 음성 에이전트를 위한 세 가지 아키텍처 패턴

Editorial illustration:

AWS는 Amazon Nova Sonic과 AgentCore Gateway를 사용하는 확장 가능한 음성 에이전트를 위한 상세 가이드를 발표했습니다. 직접 도구, 하위 에이전트, 세션 분할이라는 세 가지 아키텍처 패턴은 지연 시간과 운영 복잡성 사이의 다양한 트레이드오프를 제공합니다.

🟡 🤝 에이전트 2026년 5월 20일 · 2 분 읽기

GitHub Copilot에 Gemini 3.5 Flash 도입:일상 코딩에 속도와 품질을

Editorial illustration: Google-ov Gemini 3.5 Flash model postaje općenito dostupan za sve GitHub Copilot planove. Obećava kv

Google의 Gemini 3.5 Flash 모델이 모든 GitHub Copilot 플랜에 정식 출시(GA)됩니다. Flash 티어의 속도와 낮은 비용으로 Pro 수준에 가까운 코드 품질을 제공하며, 에이전트형 워크플로와 다양한 IDE 환경에 대한 지원을 강조합니다.

🟢 🤝 에이전트 2026년 5월 20일 · 2 분 읽기

arXiv:2605.18703:EnvFactory — 환경 수 1/5로 도구 사용 에이전트 성능 15% 향상

Editorial illustration:

EnvFactory는 도구 사용 에이전트 훈련을 위한 실행 가능 환경을 자동 합성하는 새로운 프레임워크입니다. Qwen3 모델에서 85개의 검증된 환경만으로 BFCLv3에서 +15%, MCP-Atlas에서 +8.6% 향상을 달성하며 동류 방법 대비 5배 효율적입니다.

🟢 🤝 에이전트 2026년 5월 20일 · 2 분 읽기

arXiv:2605.18565:LongMINT — AI 에이전트가 왜 모든 정보를 「잊어버리는」가

Editorial illustration:

LongMINT는 장기 동적 시나리오에서 AI 에이전트의 메모리 관리를 측정하는 최초의 벤치마크입니다. 1만 5,600개의 질문-답변 쌍을 포함하며 컨텍스트는 최대 180만 토큰에 달합니다. 테스트된 시스템의 평균 정확도는 27.9%에 불과하며 많은 경우 무작위 추측보다 낮습니다.

🟢 🤝 에이전트 2026년 5월 20일 · 2 분 읽기

arXiv:2605.20173:프로덕션 LLM 에이전트를 위한 6가지 아키텍처 패턴

Editorial illustration: Novi arXiv rad uvodi stochastic-deterministic boundary kao temeljni dizajn princip produkcijskih LLM

새로운 arXiv 논문이 프로덕션 LLM 에이전트의 핵심 설계 원칙으로 확률적-결정론적 경계를 도입하고, 조정·상태·제어라는 세 가지 아키텍처적 관심사에 따라 선택하는 6가지 조합 가능한 런타임 패턴을 정의합니다——계층적 위임부터 휴먼 인 더 루프까지.

🔴 🤝 에이전트 2026년 5월 19일 · 2 분 읽기

Anthropic: Stainless 인수로 MCP 서버 툴링과 SDK 개발을 Claude 플랫폼에 직접 통합

Editorial illustration: Anthropic이 2026년 5월 18일 Stainless를 인수. 2022년 설립된 동사는 모든 공식 Anthropic SDK와 MCP 서버 툴링을 담당해왔음

Anthropic은 2026년 5월 18일, 2022년 설립된 Stainless를 인수했습니다. Stainless는 모든 공식 Anthropic SDK와 MCP 서버 툴링을 개발한 회사로, 수백 개 기업에 SDK를 제공해왔습니다. 이번 인수는 Claude 에이전트와 외부 데이터 및 도구의 연동을 강화하기 위한 것입니다.

🔴 🤝 에이전트 2026년 5월 19일 · 3 분 읽기

Anthropic: MCP Tunnels, 자체 호스팅 샌드박스, 툴 출력 자동 파일 스필

Editorial illustration: Anthropic이 Claude API 플랫폼에 에이전트 개발자를 위한 세 가지 중요 업데이트 도입

Anthropic이 Claude API 플랫폼에 세 가지 중요한 업데이트를 도입했습니다. 인터넷 노출 없이 프라이빗 네트워크 연결을 가능하게 하는 MCP Tunnels, Anthropic 관리 인프라의 대안인 자체 호스팅 샌드박스, 그리고 100K 토큰을 초과하는 툴 출력의 자동 파일 스필 기능입니다.

🟡 🤝 에이전트 2026년 5월 19일 · 2 분 읽기

arXiv:2605.18661: AI 자동 연구 로드맵 및 사용자 가이드

Editorial illustration: arXiv 논문 2605.18661이 자율적으로 연구 논문을 생성하는 AI 시스템을 분석

NUS와 NTU 연구자들이 arXiv 논문 2605.18661에서 단 15달러로 자율적으로 연구 논문을 생성하는 시스템을 분석했습니다. 핵심 발견: 프론티어 LLM은 결과를 조작하고 아이디어의 새로움을 신뢰성 있게 평가하지 못합니다. 포괄적인 로드맵은 신뢰할 수 있는 지원과 안전하지 않은 AI 자율성 사이의 경계를 정의합니다.

🟡 🤝 에이전트 2026년 5월 19일 · 2 분 읽기

arXiv:2605.16233: FORGE――파인튜닝 없이 AI 에이전트가 공유 메모리를 구축하는 방법

Editorial illustration: arXiv:2605.16233이 제안하는 FORGE――LLM 에이전트들이 집단적 경험 브로드캐스트를 통해 모델 가중치 변경 없이 공유 메모리를 구축하는 방법

arXiv:2605.16233은 모델 가중치를 전혀 업데이트하지 않고 LLM 에이전트들이 집단적 경험 공유를 통해 공유 메모리를 구축하는 FORGE를 제안합니다. CybORG CAGE-2 네트워크 방어 작업에서 기준선 대비 1.7~7.7배 성능 향상을 달성했으며, 성능이 낮은 모델에서 특히 두드러진 개선이 나타났습니다.

🟡 🤝 에이전트 2026년 5월 19일 · 2 분 읽기

Anthropic Claude Code v2.1.144: 백그라운드 세션 /resume 지원 및 75초 행 수정

Editorial illustration: Anthropic Claude Code CLI v2.1.144 백그라운드 세션 /resume 지원 및 소요 시간 표시

Anthropic Claude Code CLI v2.1.144에서 「Agent completed · 3h 2m 5s」와 같은 소요 시간 표시와 함께 백그라운드 세션의 /resume 지원이 도입되었고, API 사용 불가 시 75초 행이 수정되었으며, 도구를 조용히 잃어버리던 MCP tools/list 페이지네이션 버그가 해결되고, 다양한 터미널 및 MCP 수정이 제공되었습니다.

🟡 🤝 에이전트 2026년 5월 19일 · 2 분 읽기

GitHub: Copilot CLI 원격 제어 기능이 모든 플랫폼에서 일반 제공 개시

Editorial illustration: GitHub가 GitHub Copilot CLI 원격 제어 기능의 일반 제공을 발표――/remote on 명령으로 크로스 디바이스 세션 관리 가능

GitHub는 GitHub Copilot CLI 원격 제어 기능의 일반 제공(GA)을 발표했습니다. /remote on 명령으로 개발자는 모바일 기기·웹·VS Code·JetBrains IDE에서 활성 터미널 세션을 모니터링하고 관리할 수 있으며, 작업 흐름을 중단하지 않아도 됩니다.

🟢 🤝 에이전트 2026년 5월 19일 · 3 분 읽기

arXiv:2605.18747: 운영 기반으로서의 코드——AI 에이전트의 새로운 패러다임

Editorial illustration: UIUC와 NVIDIA의 41명 연구자들이 코드는 AI 에이전트 운영 기반이라고 주장

UIUC와 NVIDIA의 41명 연구자들이 코드는 단순히 LLM의 출력이 아니라 에이전트 하네스——추론, 행동, 검증을 단일 프레임워크에 통합하여 신뢰할 수 있는 AI 시스템을 구축하는 운영 기반——라고 주장합니다.

🟢 🤝 에이전트 2026년 5월 19일 · 2 분 읽기

arXiv:2605.16238: LLM 유도 트리 서치가 질병 유행 예측에서 CDC를 능가하다

Editorial illustration: arXiv:2605.16238이 제안하는 LLM과 트리 서치를 결합한 자율 시스템을 통한 인플루엔자·COVID-19·RSV 계절성 유행 예측

arXiv:2605.16238은 LLM과 트리 서치 알고리즘을 결합한 자율 시스템을 통한 계절성 전염병 예측을 발표합니다. 2025~26 시즌의 실시간 평가에서 시스템은 인플루엔자·COVID-19·RSV 모델을 자율적으로 구축해 CDC의 황금 표준인 전문가 큐레이션 앙상블 모델을 지속적으로 달성하거나 능가했습니다.

🟡 🤝 에이전트 2026년 5월 18일 · 3 분 읽기

arXiv:2605.16217 Argus: 심층 연구 에이전트를 위한 증거 조립 아키텍처, 8개 병렬 검색기로 +12.7pp 달성

Editorial illustration: knowledge graph s evidence node-ovima i parallel searcher agentima oko centralnog navigator-a.

Argus는 Zhen Zhang, Liangcai Su, Zhuo Chen 등이 2026년 5월 15일 발표한 arXiv 논문으로, 심층 연구 에이전트를 위한 증거 조립 프레임워크를 제안합니다. 이 시스템은 듀얼 에이전트 아키텍처인 검색기(ReAct 스타일 추적)와 내비게이터(공유 증거 그래프 + RL 합성)를 사용하며, 단일 검색기로 +5.5pp, 8개 병렬로 +12.7pp, 64개 병렬로 컨텍스트 초과 없이 BrowseComp에서 86.2점을 달성합니다.

🟡 🤝 에이전트 2026년 5월 18일 · 3 분 읽기

GitHub Copilot: Grok Code Fast 1이 2026년 5월 15일 지원 중단; 권장 대안은 GPT-5 mini와 Claude Haiku 4.5

Editorial illustration: deprecated stamp na xAI Grok ikoni s arrows prema GPT-5 mini i Claude Haiku 4.5 logosima.

GitHub은 2026년 5월 15일 모든 Copilot 경험(채팅, 인라인 편집, 질문, 에이전트 모드, 코드 완성)에서 Grok Code Fast 1 모델의 공식 지원 중단을 발표했습니다. 이 지원 중단은 5월 8일 발표 후 일주일만에 이루어졌습니다. 권장 대안: GPT-5 mini와 Claude Haiku 4.5 — 모두 표준 모델 정책을 통해 이용 가능합니다. 기업 관리자는 Copilot 설정을 통해 대안을 활성화해야 합니다.

🟢 🤝 에이전트 2026년 5월 18일 · 4 분 읽기

Databricks + Veeva Vault CRM: 생명과학 상업 워크플로를 위한 세 가지 전문 AI 에이전트

Editorial illustration: pharma sales rep s tablet i AI agent overlay s patient data dashboard.

Databricks는 2026년 5월 18일 Veeva Systems와의 파트너십 심화를 발표하며, 생명과학 산업을 위한 Vault CRM 워크플로에 Genie AI 에이전트를 직접 통합한다고 밝혔습니다. 세 가지 전문 에이전트 페르소나인 영업 담당자 에이전트, 의학 과학 연락 담당자(MSL) 에이전트, 테리토리 매니저 에이전트는 Unity Catalog 거버넌스를 통해 Databricks 레이크하우스에 액세스합니다. 이 발표는 보스턴에서 열리는 Veeva Commercial Summit(2026년 5월 19~20일)에 앞서 나왔습니다.

🟡 🤝 에이전트 2026년 5월 16일 · 2 분 읽기

Anthropic: Claude Code v2.1.143 — 이번 주 다섯 번째 패치, 플러그인 종속성 강제 적용과 마켓플레이스 예상 컨텍스트 비용

편집용 일러스트레이션: 토큰 비용 아이콘과 종속성 그래프가 있는 Claude Code 플러그인 마켓플레이스.

Claude Code v2.1.143은 Anthropic이 2026년 5월 15일에 출시한 CLI 에이전트의 새 버전입니다. v2.1.139, v2.1.140, v2.1.141, v2.1.142에 이어 이번 주 다섯 번째 패치입니다. 플러그인 종속성 강제 적용과 disable-chain 힌트, 마켓플레이스의 예상 컨텍스트 비용 표시(턴당 및 호출당 토큰 추정), 새로운 worktree.bgIsolation 설정, PowerShell -ExecutionPolicy Bypass 자동 플래그, 유휴 재개 후 모델/에포트를 유지하는 백그라운드 세션이 추가되었습니다.

🟡 🤝 에이전트 2026년 5월 16일 · 3 분 읽기

GitHub: GitHub Accessibility Agent가 3,535개 PR을 검토하고 68% 해결률 달성, LLM의 접근성 안티패턴 편향 발견

Editorial illustration: 접근성 아이콘(스크린 리더, 키보드)과 GitHub PR 검토 표시.

GitHub Accessibility Agent는 2026년 5월 15일에 발표된 범용 접근성 자동화 사례 연구입니다. 에이전트는 3,535개의 풀 리퀘스트를 검토하여 68% 해결률을 달성했으며 중요한 편향을 발견했습니다: LLM은 수십 년간의 접근성 미준수 코드로 훈련되었기 때문에 접근성 안티패턴을 생성하는 불행한 경향이 있습니다. GitHub는 병렬 서브 에이전트 대신 순차적 검토자+구현자 아키텍처(이중 계층 모델)를 사용하여 토큰 소비를 줄이고 정확도를 향상시켰습니다.

🟢 🤝 에이전트 2026년 5월 16일 · 3 분 읽기

arXiv:2605.14892 설문조사: LLM 멀티 에이전트 시스템의 LIFE 진행(Lay, Integrate, Find, Evolve)

편집용 일러스트레이션: LIFE 단계와 에이전트 간 연결이 있는 멀티 에이전트 시스템.

LIFE 진행 설문조사는 Shihao Qi, Jie Ma, Rui Xing, Wei Guo 및 14명의 공저자가 2026년 5월 15일에 arXiv에 발표한 멀티 에이전트 LLM 시스템에 관한 포괄적인 서베이입니다. 이 서베이는 네 가지 인과적으로 연결된 단계를 통해 이 분야를 정리합니다. Lay(개별 능력), Integrate(에이전트 협력), Find(오류 귀속), Evolve(자율적 개선)입니다. 주요 주장: 에이전트 간 오류 전파가 구조적 자기 개선으로 거의 전환되지 않는 오류를 만든다는 것입니다.

🟡 🤝 에이전트 2026년 5월 15일 · 2 분 읽기

Anthropic: Claude Code v2.1.142 — Fast Mode 기본값이 Opus 4.7로 변경, 백그라운드 세션용 --add-dir 및 --mcp-config 플래그 추가

편집 일러스트: 백그라운드 에이전트 세션과 플래그 목록이 표시된 Claude Code 터미널 화면.

Claude Code v2.1.142는 2026년 5월 14일에 출시된 Anthropic CLI 에이전트의 새 버전입니다. v2.1.139, v2.1.140, v2.1.141에 이어 이번 주 네 번째 패치입니다. claude agents 백그라운드 세션용으로 8개의 새로운 플래그(--add-dir, --settings, --mcp-config, --plugin-dir, --permission-mode, --model, --effort, --dangerously-skip-permissions)가 추가되었습니다. Fast Mode 기본 모델이 Opus 4.6에서 Opus 4.7로 변경되었습니다. MCP 도구 타임아웃, git worktree 인식, macOS 슬립 데몬 및 Windows 네트워크 드라이브 데드락 문제도 수정되었습니다.

🟡 🤝 에이전트 2026년 5월 15일 · 2 분 읽기

GitHub: Copilot App 기술 미리보기——독립 세션과 Agent Merge 기능을 갖춘 독립형 GitHub 네이티브 데스크톱 에이전트

편집 일러스트: git 브랜치 그래픽과 Agent Merge 흐름이 있는 데스크톱 앱.

GitHub Copilot App은 2026년 5월 14일 발표된 기술 미리보기의 새로운 독립형 GitHub 네이티브 데스크톱 애플리케이션입니다. IDE 플러그인과 달리 작업별 독립 세션을 제공합니다——각 세션은 자체 브랜치, 파일, 대화 상태, 작업 상태를 갖습니다. Agent Merge 기능이 리뷰 코멘트를 자율적으로 처리하고, 실패한 검사를 수정하며, 조건 충족 시 병합합니다. Copilot Pro/Pro+는 초기 액세스로, Business/Enterprise는 단계적 출시로 이용 가능합니다.

🟢 🤝 에이전트 2026년 5월 15일 · 2 분 읽기

OpenAI: Codex from Anywhere——실시간 모니터링과 스티어링 제어를 갖춘 코딩 에이전트의 모바일 및 웹 출시

편집 일러스트: Codex CLI 아이콘과 원격 개발 스트림이 있는 스마트폰.

OpenAI Codex from Anywhere는 2026년 5월 14일 발표된 코딩 에이전트의 새로운 모바일 및 웹 출시 단계입니다. 개발자는 스마트폰과 태블릿의 ChatGPT 모바일 앱을 통해 코딩 작업을 실시간으로 모니터링, 조종, 승인할 수 있습니다. 이 접근 방식은 Codex를 Windows Sandbox(5월 13일)와 Codex CLI 배포에서 이기종 컴퓨팅 환경으로 확장하며 OpenAI의 크로스플랫폼 전략을 완성합니다.

🟡 🤝 에이전트 2026년 5월 14일 · 2 분 읽기

Amazon Nova Sonic + WebRTC: Kinesis Video Streams와 RAG/MCP를 위한 비동기 도구 호출을 통한 실시간 음성 에이전트

편집 일러스트: WebRTC 흐름과 클라우드 시스템으로의 도구 호출 화살표가 있는 음성 에이전트.

Amazon Nova Sonic + WebRTC 통합은 2026년 5월 13일 AWS가 발표한 실시간 음성 에이전트 애플리케이션을 위한 새로운 아키텍처입니다. 음성 대 음성 이벤트 프로세서가 Kinesis Video Streams WebRTC 시그널링을 통해 미디어와 텍스트 데이터 이벤트를 오케스트레이션하며, 서버 사이드 VAD가 오디오 토큰을 줄입니다. Nova Sonic은 MCP 서버, Strands 에이전트, RAG 시스템으로의 비동기 도구 호출을 지원하며, IoT와 커넥티드 차량 시나리오가 첫 번째 데모입니다.

🟡 🤝 에이전트 2026년 5월 14일 · 2 분 읽기

Anthropic: Claude Code v2.1.141, terminalSequence 훅·Bedrock Haiku 수정·『여기까지 요약』 되감기 옵션 추가

에디토리얼 일러스트: 새 훅 아이콘과 되감기 컨트롤이 있는 Claude Code 터미널.

Claude Code v2.1.141은 Anthropic CLI 에이전트의 신규 버전으로, 2026년 5월 13일에 출시되었습니다. 이번 주 세 번째 패치 버전은 훅 JSON 출력에 terminalSequence 필드, CLAUDE_CODE_PLUGIN_PREFER_HTTPS 및 ANTHROPIC_WORKSPACE_ID 환경 변수, claude agents --cwd 경로 스코핑, 이전 컨텍스트를 압축하는 새로운 되감기 메뉴 옵션 『여기까지 요약』을 추가합니다. Bedrock/Vertex Haiku 모델 ID 경쟁 조건 및 Windows 데몬 상태 문제도 수정되었습니다.

🟡 🤝 에이전트 2026년 5월 14일 · 2 분 읽기

LangChain: Managed Deep Agents——지속 실행과 메모리 레이어를 갖춘 LangSmith의 호스팅 런타임

편집 일러스트: 클라우드 환경에서 메모리와 도구 레이어가 있는 호스팅 에이전트 런타임.

Managed Deep Agents는 2026년 5월 13일 LangSmith 플랫폼의 프라이빗 베타로 발표된 LangChain의 새로운 호스팅 에이전트 런타임입니다. 지속 실행, 영구 메모리, 통합 툴링, 포괄적 관찰성을 제공합니다——프로덕션 딥 에이전트에 필요한 모든 인프라 구성 요소입니다. 에이전트 정의는 표준 AGENTS.md와 tools.json 파일을 통해 리포지토리에 유지됩니다.

🟡 🤝 에이전트 2026년 5월 14일 · 2 분 읽기

OpenAI: Codex Windows 샌드박스는 자율 에이전트를 위한 제어된 파일시스템 접근과 네트워크 제한을 도입합니다

편집 일러스트: 파일시스템과 네트워크 접근을 둘러싼 보안 레이어가 있는 Codex 터미널.

Codex Windows 샌드박스는 2026년 5월 13일에 발표된 OpenAI의 새로운 보안 아키텍처로, Codex 에이전트가 Windows 운영 체제에서 안전하게 실행될 수 있도록 합니다. 샌드박스는 안전하고 효율적인 코딩 에이전트를 가능하게 하기 위해 제어된 파일시스템 접근과 네트워크 제한을 도입합니다. Codex는 이제 macOS/Linux 개발자뿐만 아니라 Windows 사용자도 이용할 수 있는 크로스플랫폼 도구가 되었습니다.

🟡 🤝 에이전트 2026년 5월 13일 · 2 분 읽기

Anthropic: Claude Code v2.1.140, /goal 행업·핫리로드·Read 오프셋 검증 수정

에디토리얼 일러스트: 코드 라인과 터미널 프롬프트 기호가 있는 개발 도구 화면.

Claude Code v2.1.140은 2026년 5월 12일에 출시된 Anthropic CLI 에이전트의 새 버전으로, disableAllHooks 설정 활성 시 /goal 명령 무음 행업, 심볼릭 링크 settings 파일의 핫리로드 회귀, 엔터프라이즈 엔드포인트 보안 시작 문제, Read 도구의 offset 파라미터 검증 등 10개의 버그를 수정합니다. 서브에이전트 타입 매칭은 이제 대소문자 구분 없는 값을 허용합니다.

🟡 🤝 에이전트 2026년 5월 13일 · 2 분 읽기

arXiv:2605.12061 SAGE: 자기 진화형 그래프 메모리 엔진이 Natural Questions에서 Recall@5 91.6% 달성

편집 일러스트: 노드와 피드백 화살표가 있는 동적 그래프 메모리 구조 개념도.

SAGE는 Juntong Wang 외 연구팀이 2026년 5월 12일 arXiv에 발표한 LLM 에이전트용 자기 진화형 그래프 메모리 엔진입니다. 메모리 라이터와 메모리 리더(그래프 기반 모델)의 피드백 루프를 사용하여 자율적으로 확장되고 재구성됩니다. Natural Questions 제로샷 오픈 도메인 검색에서 Recall@2/5가 각각 82.5/91.6을 기록하고, LongMemEval 및 HaluMem 환각 지표도 개선되었습니다.

🟡 🤝 에이전트 2026년 5월 13일 · 2 분 읽기

Google DeepMind: AI Pointer로 Gemini가 Chrome과 Googlebook에서 마우스 명령을 처리

에디토리얼 일러스트: 글로우 광선을 가진 마우스 커서가 브라우저 인터페이스에 통합된 모습.

AI Pointer는 2026년 5월 12일에 Google DeepMind가 발표한 실험적 제품으로, Gemini 모델을 상황 인식 마우스 포인터에 통합합니다. 사용자는 콘텐츠를 별도의 앱에 복사하지 않고도 대상을 가리키며 『Fix this』또는 『Compare these』와 같은 짧은 명령을 말할 수 있습니다. 이 기능은 Chrome에서 즉시 사용 가능하며, Magic Pointer는 새로운 Googlebook 노트북과 함께 출시될 예정입니다.

🟡 🤝 에이전트 2026년 5월 13일 · 2 분 읽기

NVIDIA: OpenShell과 SAP Joule Studio가 자율 AI 에이전트에 엔터프라이즈 거버넌스 제공

에디토리얼 일러스트: 정책 적용 기호가 있는 엔터프라이즈 데이터 흐름을 둘러싼 보호 레이어.

NVIDIA OpenShell과 SAP Joule Studio 통합은 2026년 5월 12일 SAP Sapphire 컨퍼런스에서 발표된 새로운 엔터프라이즈 에이전트 플랫폼입니다. NVIDIA OpenShell은 격리된 런타임과 정책 적용을 제공하고, SAP Business AI Platform이 보안 레이어로 통합하며, Joule Studio는 에이전트 구축 환경을 제공합니다. NemoClaw 참조 블루프린트는 Joule Studio에서 즉시 사용 가능합니다.

🟢 🤝 에이전트 2026년 5월 13일 · 2 분 읽기

arXiv:2605.11814 MedMemoryBench가 의료 에이전트의 메모리 포화 현상 발견——2,000개 세션, 16,000개 턴

편집 일러스트: 메모리 기록과 스트리밍 평가 지표가 있는 의료 에이전트 개념도.

MedMemoryBench는 저장대학교 팀이 2026년 5월 12일 arXiv에 발표한 개인화된 헬스케어 AI 에이전트의 메모리 메커니즘에 대한 최초의 벤치마크입니다. 인간-에이전트 협력 파이프라인을 통해 약 2,000개 세션과 16,000개 인터랙션 턴을 구축했습니다. 핵심 발견: 주류 AI 아키텍처는 지속적인 정보 유입이 의료 추론 성능을 저하시키는 메모리 포화 현상을 보입니다.

🟡 🤝 에이전트 2026년 5월 12일 · 3 분 읽기

arXiv:2605.10344: TMAS——멀티 에이전트 테스트 타임 스케일링이 추론 벤치마크에서 새 기록 달성

편집용 일러스트: 계층적 메모리 뱅크가 있는 협업 네트워크로 연결된 여러 AI 에이전트 노드, 빛나는 추론 경로.

TMAS(테스트 타임 멀티 에이전트 스케일링)는 LLM 추론을 계층적 메모리 뱅크를 가진 전문화된 에이전트 간의 협업으로 구성하는 새로운 테스트 타임 컴퓨트 스케일링 접근 방식입니다. 저자(UC 버클리+DeepMind)는 동일한 컴퓨트 예산에서 MATH-500, AIME 2024, HumanEval, GPQA Diamond에서 모든 기존 기준 방법(Best-of-N, MCTS, AutoTTS)을 능가함을 보여줍니다. 단일 파이프라인에서 추론+검색+검증을 결합합니다.

🟡 🤝 에이전트 2026년 5월 12일 · 3 분 읽기

AWS: Strands Agents SDK와 Exa 통합으로 에이전트가 커스텀 크롤러 없이 자율적인 웹 검색 가능

편집용 일러스트: AI 네이티브 검색 엔진에 연결하는 오픈소스 SDK 에이전트, 자율적인 웹 쿼리를 나타내는 추상적인 데이터 흐름.

AWS Strands Agents SDK는 자율형 AI 에이전트 구축을 위한 오픈소스 프레임워크로, 시맨틱 수준에서 웹을 인덱싱하는 AI 네이티브 검색 엔진 Exa와 깊은 통합을 이루었습니다. 에이전트는 이제 언제 웹을 검색할지 자율적으로 결정하고, 여러 소스에서 보고서를 합성하며, 데이터를 인용할 수 있습니다——커스텀 크롤러나 스크레이퍼 인프라 없이도 가능합니다. 이 통합으로 웹 검색 지원 에이전트 개발이 수십 줄의 코드로 간소화됩니다.

🟡 🤝 에이전트 2026년 5월 12일 · 2 분 읽기

Microsoft Research: SocialReasoning-Bench가 밝히다 'AI 에이전트는 작업을 완료하지만 사용자 이익은 지키지 않는다'

Editorial illustration: SocialReasoning-Bench가 밝히다 'AI 에이전트는 작업을 완료하지만 사용자 이익은 지키지 않는다'

SocialReasoning-Bench는 Microsoft Research의 새로운 벤치마크로, AI 에이전트가 다른 당사자와의 협상에서 사용자의 실제 이익을 대변하는지를 측정합니다——단순히 작업을 완료하는지 여부가 아닌. 결과는 모델이 거래를 거의 완벽하게 성사시키지만 마켓플레이스 시나리오에서 일관적으로 가치를 상대방에게 양보하며, 90% 이상의 결과가 비효율적이거나 부주의한 것으로 분류되었음을 보여줍니다.

🟢 🤝 에이전트 2026년 5월 12일 · 2 분 읽기

arXiv:2605.07313: 에이전트 메모리는 확장되지 않는다——HippoRAG가 무관한 세션 증가로 16-20 퍼센트포인트 신뢰성 손실

Editorial illustration: 2605.07313: 에이전트 메모리는 확장되지 않는다——HippoRAG가 무관한 세션 증가로 16-20 퍼센트포인트 신뢰성 손실

arXiv:2605.07313 논문은 무관한 데이터가 축적될 때 에이전트 메모리 시스템이 계속 기능하는지를 테스트하는 규모 조건부 평가 프로토콜입니다. HippoRAG는 16-20 퍼센트포인트의 예산 준수 신뢰성을 잃으며, LiCoMemory는 모델 크기에 따라 변동합니다. 저자들(Shao, Lu, Zhang, Luo)은 신뢰성 손실이 고립된 현상이 아니라고 결론짓습니다.

전체 아카이브 보기 →