2026년 5월 19일 화요일

17 개 뉴스 — 🔴 3 중요 , 🟡 9 주목 , 🟢 5 흥미

← 전날 다음 날 →

🤖 모델 (3)

🔴 🤖 모델 2026년 5월 19일 · 3 분 읽기

arXiv:2605.15514: RoPE는 긴 컨텍스트에서 위치도 토큰도 구별할 수 없다――근본적 한계의 이론적 증명

Editorial illustration: arXiv 논문 2605.15514가 RoPE 위치 인코딩의 근본적 한계를 이론적으로 증명――긴 컨텍스트에서 위치와 토큰 구별 능력 상실

arXiv 논문 2605.15514는 Llama·Mistral·Qwen·GPT-NeoX를 포함한 거의 모든 현대 대형 언어 모델이 사용하는 Rotary Positional Embeddings(RoPE)가 긴 컨텍스트에서 위치와 토큰을 구별하는 능력을 잃는다는 것을 수학적으로 증명합니다. 저자들은 근본적으로 새로운 아키텍처 메커니즘이 필요하다고 결론짓습니다.

🟡 🤖 모델 2026년 5월 19일 · 2 분 읽기

Anthropic: Claude API 웹 검색 도구가 SEC 신고서에서 풍부한 구조화 데이터를 반환하도록 업데이트

Editorial illustration: Anthropic이 2026년 5월 18일 Claude API 웹 검색 도구를 업데이트해 SEC 신고서에서 풍부하고 구조화된 데이터를 반환하도록 개선

Anthropic은 2026년 5월 18일 Claude API의 웹 검색 도구를 업데이트해 10-K·10-Q·8-K 문서를 포함한 SEC 신고서에서 더 풍부하고 구조화된 데이터를 반환하도록 했습니다. 이번 업그레이드는 인용 참조가 포함된 1차 출처 기반의 수익 분석·실사·연구를 위한 금융 에이전트 구축을 용이하게 합니다.

🟢 🤖 모델 2026년 5월 19일 · 2 분 읽기

arXiv:2605.18732: 환각의 스케일링 법칙——더 큰 모델이 반드시 더 적은 오류를 의미하지는 않습니다

Editorial illustration: LLM 환각 스케일링 법칙 연구

연구자들이 38개 모델과 8900개 이상의 참고 문헌에서 LLM의 사실 회상이 시그모이드 곡선을 따른다는 것을 보여주었습니다: 파라미터 수와 훈련 데이터에서의 주제 출현 빈도의 조합이 분산의 60–94%를 설명합니다. 환각은 무작위가 아닙니다——예측 가능하고 측정 가능합니다.

📦 오픈소스 (2)

⚖️ 규제 (1)

🤝 에이전트 (8)

🔴 🤝 에이전트 2026년 5월 19일 · 2 분 읽기

Anthropic: Stainless 인수로 MCP 서버 툴링과 SDK 개발을 Claude 플랫폼에 직접 통합

Editorial illustration: Anthropic이 2026년 5월 18일 Stainless를 인수. 2022년 설립된 동사는 모든 공식 Anthropic SDK와 MCP 서버 툴링을 담당해왔음

Anthropic은 2026년 5월 18일, 2022년 설립된 Stainless를 인수했습니다. Stainless는 모든 공식 Anthropic SDK와 MCP 서버 툴링을 개발한 회사로, 수백 개 기업에 SDK를 제공해왔습니다. 이번 인수는 Claude 에이전트와 외부 데이터 및 도구의 연동을 강화하기 위한 것입니다.

🔴 🤝 에이전트 2026년 5월 19일 · 3 분 읽기

Anthropic: MCP Tunnels, 자체 호스팅 샌드박스, 툴 출력 자동 파일 스필

Editorial illustration: Anthropic이 Claude API 플랫폼에 에이전트 개발자를 위한 세 가지 중요 업데이트 도입

Anthropic이 Claude API 플랫폼에 세 가지 중요한 업데이트를 도입했습니다. 인터넷 노출 없이 프라이빗 네트워크 연결을 가능하게 하는 MCP Tunnels, Anthropic 관리 인프라의 대안인 자체 호스팅 샌드박스, 그리고 100K 토큰을 초과하는 툴 출력의 자동 파일 스필 기능입니다.

🟡 🤝 에이전트 2026년 5월 19일 · 2 분 읽기

arXiv:2605.18661: AI 자동 연구 로드맵 및 사용자 가이드

Editorial illustration: arXiv 논문 2605.18661이 자율적으로 연구 논문을 생성하는 AI 시스템을 분석

NUS와 NTU 연구자들이 arXiv 논문 2605.18661에서 단 15달러로 자율적으로 연구 논문을 생성하는 시스템을 분석했습니다. 핵심 발견: 프론티어 LLM은 결과를 조작하고 아이디어의 새로움을 신뢰성 있게 평가하지 못합니다. 포괄적인 로드맵은 신뢰할 수 있는 지원과 안전하지 않은 AI 자율성 사이의 경계를 정의합니다.

🟡 🤝 에이전트 2026년 5월 19일 · 2 분 읽기

arXiv:2605.16233: FORGE――파인튜닝 없이 AI 에이전트가 공유 메모리를 구축하는 방법

Editorial illustration: arXiv:2605.16233이 제안하는 FORGE――LLM 에이전트들이 집단적 경험 브로드캐스트를 통해 모델 가중치 변경 없이 공유 메모리를 구축하는 방법

arXiv:2605.16233은 모델 가중치를 전혀 업데이트하지 않고 LLM 에이전트들이 집단적 경험 공유를 통해 공유 메모리를 구축하는 FORGE를 제안합니다. CybORG CAGE-2 네트워크 방어 작업에서 기준선 대비 1.7~7.7배 성능 향상을 달성했으며, 성능이 낮은 모델에서 특히 두드러진 개선이 나타났습니다.

🟡 🤝 에이전트 2026년 5월 19일 · 2 분 읽기

Anthropic Claude Code v2.1.144: 백그라운드 세션 /resume 지원 및 75초 행 수정

Editorial illustration: Anthropic Claude Code CLI v2.1.144 백그라운드 세션 /resume 지원 및 소요 시간 표시

Anthropic Claude Code CLI v2.1.144에서 「Agent completed · 3h 2m 5s」와 같은 소요 시간 표시와 함께 백그라운드 세션의 /resume 지원이 도입되었고, API 사용 불가 시 75초 행이 수정되었으며, 도구를 조용히 잃어버리던 MCP tools/list 페이지네이션 버그가 해결되고, 다양한 터미널 및 MCP 수정이 제공되었습니다.

🟡 🤝 에이전트 2026년 5월 19일 · 2 분 읽기

GitHub: Copilot CLI 원격 제어 기능이 모든 플랫폼에서 일반 제공 개시

Editorial illustration: GitHub가 GitHub Copilot CLI 원격 제어 기능의 일반 제공을 발표――/remote on 명령으로 크로스 디바이스 세션 관리 가능

GitHub는 GitHub Copilot CLI 원격 제어 기능의 일반 제공(GA)을 발표했습니다. /remote on 명령으로 개발자는 모바일 기기·웹·VS Code·JetBrains IDE에서 활성 터미널 세션을 모니터링하고 관리할 수 있으며, 작업 흐름을 중단하지 않아도 됩니다.

🟢 🤝 에이전트 2026년 5월 19일 · 3 분 읽기

arXiv:2605.18747: 운영 기반으로서의 코드——AI 에이전트의 새로운 패러다임

Editorial illustration: UIUC와 NVIDIA의 41명 연구자들이 코드는 AI 에이전트 운영 기반이라고 주장

UIUC와 NVIDIA의 41명 연구자들이 코드는 단순히 LLM의 출력이 아니라 에이전트 하네스——추론, 행동, 검증을 단일 프레임워크에 통합하여 신뢰할 수 있는 AI 시스템을 구축하는 운영 기반——라고 주장합니다.

🟢 🤝 에이전트 2026년 5월 19일 · 2 분 읽기

arXiv:2605.16238: LLM 유도 트리 서치가 질병 유행 예측에서 CDC를 능가하다

Editorial illustration: arXiv:2605.16238이 제안하는 LLM과 트리 서치를 결합한 자율 시스템을 통한 인플루엔자·COVID-19·RSV 계절성 유행 예측

arXiv:2605.16238은 LLM과 트리 서치 알고리즘을 결합한 자율 시스템을 통한 계절성 전염병 예측을 발표합니다. 2025~26 시즌의 실시간 평가에서 시스템은 인플루엔자·COVID-19·RSV 모델을 자율적으로 구축해 CDC의 황금 표준인 전문가 큐레이션 앙상블 모델을 지속적으로 달성하거나 능가했습니다.

🏥 실무 (1)

🛡️ 보안 (2)

← 전날 다음 날 →