2026년 5월 23일 토요일

15 개 뉴스 — 🔴 3 중요 , 🟡 7 주목 , 🟢 5 흥미

← 전날

📦 오픈소스 (1)

🤝 에이전트 (4)

🔴 🤝 에이전트 2026년 5월 23일 · 3 분 읽기

arXiv:2605.22502:에이전트 워크플로를 LLM 가중치로 컴파일하여 100분의 1 비용으로 프런티어 근접 품질 달성

편집 일러스트: 워크플로우 노드가 컴팩트한 신경망 코어로 축약

연구자들은 복잡한 에이전트 워크플로를 LangChain이나 LangGraph 같은 외부 오케스트레이션 대신 미세 조정된 소형 모델의 가중치에 직접 인코딩할 수 있음을 보여주었습니다. 이 접근법은 여행 예약, Zoom 지원, 보험 등 세 가지 실제 시나리오(14〜55개 노드 워크플로)에서 프런티어 근접 품질을 달성하며 추론 비용을 100배 낮춥니다.

🔴 🤝 에이전트 2026년 5월 23일 · 3 분 읽기

arXiv:2605.22794:MOSS, 자신의 소스 코드를 수정하여 자기 개선하는 에이전트 시연

편집 일러스트: 샌드박스 루프에서 자신의 소스 코드를 재작성하는 AI 에이전트

연구자들이 MOSS를 제안했습니다. 이는 프롬프트나 파인 튜닝 가중치가 아닌 자신의 소스 코드를 재작성하여 개선하는 자율 에이전트 프레임워크입니다. OpenClaw 벤치마크에서 한 사이클의 MOSS 자기 진화가 점수를 인간의 개입 없이 0.25에서 0.61로 끌어올려, 에이전트가 텍스트 전용 방법으로는 건드릴 수 없는 라우팅, 훅, 디스패치 로직을 수정할 수 있음을 보여줍니다.

🟡 🤝 에이전트 2026년 5월 23일 · 3 분 읽기

arXiv:2605.22535:TerminalWorld 벤치마크, 시뮬레이션 없이 실제 Linux 터미널 작업에서 LLM 에이전트를 평가합니다

편집 삽화: git과 bash 명령어가 있는 터미널 프롬프트와 이를 실행하는 AI 에이전트

TerminalWorld는 시뮬레이션 없이 실제 Linux 프로세스에서 bash, git, 파일 작업을 수행하는 LLM 에이전트를 평가하는 새로운 벤치마크입니다. Zhaoyang Chu와 Jiarui Hu가 이끄는 8명의 저자 연구진은 『컴퓨터 사용』 에이전트의 새로운 기준을 제시하며, Claude Code, GitHub Copilot Workspace, Cursor 에이전트 모드 등의 도구와 직접적인 연관성이 있습니다.

🟡 🤝 에이전트 2026년 5월 23일 · 3 분 읽기

Anthropic Claude Code v2.1.149, /usage 카테고리 분류와 PowerShell 권한 우회 수정 제공

편집 일러스트: 사용량 분포 차트와 보안 방패가 있는 터미널

Anthropic이 Claude Code CLI v2.1.149를 출시하여 /usage 명령을 카테고리별 비용 분류(skills, subagents, plugins, MCP 서버별)로 확장했습니다. 두 가지 보안 취약점이 수정되었습니다:PowerShell 내장 함수를 통한 권한 우회와 git worktree 샌드박스의 잘못된 allowlist. 클라우드 MCP 커넥터 연결을 편리하게 하는 기업 설정 allowAllClaudeAiMcps도 추가되었습니다.

🔧 하드웨어 (1)

🏥 실무 (5)

🟡 🏥 실무 2026년 5월 23일 · 3 분 읽기

arXiv:2605.22681:CUSP 벤치마크, 프런티어 모델이 과학적 돌파구를 신뢰할 수 있게 예측하지 못함을 입증

편집 일러스트: 과학적 곡선의 돌파점과 예측에 실패한 AI 시스템

CUSP 벤치마크는 4,700개 사건의 데이터베이스로 AI 모델이 과학적 돌파구를 예측하는 능력을 테스트합니다. 프런티어 모델(GPT-5, Claude Opus 4.7, Gemini 3 Pro)은 그럴듯한 연구 방향을 식별하지만 과도한 확신으로 결과와 시기를 체계적으로 추측합니다. 추가적인 마감 전 맥락은 도움이 되지 않습니다——한계는 정보적인 것이 아니라 구조적입니다.

🟡 🏥 실무 2026년 5월 23일 · 3 분 읽기

GitHub:2026년 Gartner 매직 쿼드런트——GitHub Copilot이 기업용 AI 코딩 에이전트에서 3년 연속 리더 선정

편집 일러스트: 사분면 매트릭스에서 Leader 섹터에 위치한 GitHub Copilot

Gartner가 2026년 기업용 AI 코딩 에이전트 매직 쿼드런트 보고서에서 GitHub를 리더로 선정했습니다——해당 카테고리가 존재한 이래 3년 연속입니다. GitHub Copilot은 현재 전 세계 140,000개 조직에서 사용되며, 평가에서는 단순 코드 생성이 아닌 코드부터 리뷰, 보안, 거버넌스까지 전체 SDLC를 아우르는 에이전트 워크플로가 강조되었습니다.

🟢 🏥 실무 2026년 5월 23일 · 3 분 읽기

arXiv:2605.22337:Meta-Soft, 조합 가능한 메타 토큰과 학습 가능한 직교 기저로 KV 캐시 압축 도입

편집 일러스트: 메타 토큰이 어텐션 캐시를 직교 기저로 압축

연구자들이 LLM 추론에서 동적 KV 캐시 압축을 위한 새로운 방법인 Meta-Soft를 제안했습니다. 이 방법은 학습 가능한 직교 기저 행렬과 선택기 네트워크를 사용해 긴 프롬프트에서 핵심 정보의 압축 표현인 소프트 메타 토큰을 합성합니다. 주의력 흐름 메커니즘이 삭제된 토큰의 의미 정보를 보존된 토큰으로 재분배하며, 대부분의 장문맥 벤치마크에서 기존 KV 캐시 퇴거 방법을 능가합니다.

🟢 🏥 실무 2026년 5월 23일 · 4 분 읽기

arXiv:2605.22664:WorkstreamBench, 금융 분야 엔드투엔드 스프레드시트 작업에서 LLM 에이전트를 테스트하고 프론티어 모델은 부진한 결과를 보입니다

편집 삽화: 수식이 있는 Excel 스프레드시트와 이를 분석하는 AI 에이전트

WorkstreamBench는 Thomson Yen이 이끄는 10명의 저자가 만든 새 벤치마크로, 금융 도메인에서 청구서, 보고서, 비용 분석 등 실제 Excel 및 스프레드시트 작업을 LLM 에이전트에 대해 테스트합니다. GPT-4o, Claude, Gemini를 비교했으나 어떤 모델도 전체 작업 세트를 신뢰할 수 있게 완료하지 못했으며, 이는 엔터프라이즈 금융을 위한 현재 에이전트 인프라에 구조적 결함이 있음을 나타냅니다.

🟢 🏥 실무 2026년 5월 23일 · 2 분 읽기

Anthropic Claude Code v2.1.150 — 사용자 변경 사항 없는 내부 인프라 패치

편집 삽화: 버전 번호와 내부 톱니바퀴가 표시된 Claude Code 터미널

Anthropic은 UTC 토요일 04:03에 Claude Code CLI 버전 v2.1.150을 출시했으며, v2.1.149로부터 불과 하루 만입니다. 이번 릴리스에는 사용자 향 변경 사항 없이 내부 인프라 개선만 포함되어 있습니다. Darwin, Linux, Windows의 ARM64 및 x64 아키텍처와 Linux musl 빌드에서 사용 가능합니다.

🛡️ 보안 (3)

🔴 🛡️ 보안 2026년 5월 23일 · 3 분 읽기

Anthropic:Project Glasswing이 첫 달에 10,000개 이상의 고위험 취약점 발견

편집 일러스트: 코드 그리드 위의 디지털 나침반과 취약 세그먼트

Anthropic Project Glasswing은 약 50개의 보안 파트너를 결집하여 Claude Mythos Preview를 사용해 중요 소프트웨어를 스캔합니다. 첫 달에 10,000개 이상의 고위험 및 심각한 취약점이 발견되었으며, 오픈 소스 스캐너는 1,000개 프로젝트에서 90.6% 진양성률로 6,202개의 결함을 발견했습니다.

🟡 🛡️ 보안 2026년 5월 23일 · 3 분 읽기

arXiv:2605.22786:LCGuard, 멀티에이전트 시스템에서 공유 KV 캐시를 에이전트 간 데이터 유출로부터 보호합니다

편집 삽화: 두 에이전트 영역 사이의 경계와 KV 캐시를 둘러싼 암호화 보호막

LCGuard는 효율성을 위해 KV 캐시를 공유하는 멀티에이전트 시스템에서의 데이터 유출을 방지하는 새로운 프레임워크입니다. IBM Research와 MIT 연구진이 Sadie Asif의 주도로 발표한 연구는 『잠재적 통신 가드』 접근 방식의 첫 번째 공식 모델을 제시하며, 여러 에이전트가 공유 메모리를 통해 컨텍스트를 공유하는 프로덕션 에이전트 RAG 시스템에 적용 가능합니다.

🟡 🛡️ 보안 2026년 5월 23일 · 3 분 읽기

GitHub:npm 11.15.0, 공급망 강화를 위한 단계적 게시와 세 가지 새로운 설치 시 --allow 플래그 도입

편집 일러스트: 스테이징 구획의 npm 패키지와 보안 필터

GitHub가 npm CLI 버전 11.15.0을 출시하며 단계적 게시를 도입했습니다——패키지가 설치 가능해지기 전에 관리자의 승인이 필요합니다. 기존 --allow-git에 더해 npm install 명령에서 의존성 소스를 세밀하게 제어하는 세 가지 새로운 설치 시 플래그(--allow-file, --allow-remote, --allow-directory)도 도입되었습니다.

✨ 흥미로운 소식 (1)

← 전날