2026년 5월 19일 화요일

17 개 뉴스 — 🔴 3 중요 , 🟡 9 주목 , 🟢 5 흥미

🤖 모델 (3)

🔴 🤖 모델 2026년 5월 19일 · 3 분 읽기

arXiv:2605.15514: RoPE는 긴 컨텍스트에서 위치도 토큰도 구별할 수 없다――근본적 한계의 이론적 증명

Editorial illustration: arXiv 논문 2605.15514가 RoPE 위치 인코딩의 근본적 한계를 이론적으로 증명――긴 컨텍스트에서 위치와 토큰 구별 능력 상실

arXiv 논문 2605.15514는 Llama·Mistral·Qwen·GPT-NeoX를 포함한 거의 모든 현대 대형 언어 모델이 사용하는 Rotary Positional Embeddings(RoPE)가 긴 컨텍스트에서 위치와 토큰을 구별하는 능력을 잃는다는 것을 수학적으로 증명합니다. 저자들은 근본적으로 새로운 아키텍처 메커니즘이 필요하다고 결론짓습니다.

🟡 🤖 모델 2026년 5월 19일 · 2 분 읽기

Anthropic: Claude API 웹 검색 도구가 SEC 신고서에서 풍부한 구조화 데이터를 반환하도록 업데이트

Editorial illustration: Anthropic이 2026년 5월 18일 Claude API 웹 검색 도구를 업데이트해 SEC 신고서에서 풍부하고 구조화된 데이터를 반환하도록 개선

Anthropic은 2026년 5월 18일 Claude API의 웹 검색 도구를 업데이트해 10-K·10-Q·8-K 문서를 포함한 SEC 신고서에서 더 풍부하고 구조화된 데이터를 반환하도록 했습니다. 이번 업그레이드는 인용 참조가 포함된 1차 출처 기반의 수익 분석·실사·연구를 위한 금융 에이전트 구축을 용이하게 합니다.

🟢 🤖 모델 2026년 5월 19일 · 2 분 읽기

arXiv:2605.18732: 환각의 스케일링 법칙——더 큰 모델이 반드시 더 적은 오류를 의미하지는 않습니다

Editorial illustration: LLM 환각 스케일링 법칙 연구

연구자들이 38개 모델과 8900개 이상의 참고 문헌에서 LLM의 사실 회상이 시그모이드 곡선을 따른다는 것을 보여주었습니다: 파라미터 수와 훈련 데이터에서의 주제 출현 빈도의 조합이 분산의 60–94%를 설명합니다. 환각은 무작위가 아닙니다——예측 가능하고 측정 가능합니다.

📦 오픈소스 (2)

🟡 📦 오픈소스 2026년 5월 19일 · 1 분 읽기

PyTorch: ExecuTorch MLX Delegate가 Apple Silicon GPU에서 모델 추론을 3~6배 가속

Editorial illustration: PyTorch 팀이 ExecuTorch MLX Delegate를 공개――Apple MLX 프레임워크를 활용해 Apple Silicon GPU에서 추론을 3~6배 가속

PyTorch 팀이 실험적인 ExecuTorch MLX Delegate를 공개했습니다. Apple MLX 프레임워크와 Metal GPU 커널을 활용해 Apple Silicon 칩에서 3~6배의 처리량 향상을 제공하는 백엔드입니다. Llama 3.2·Qwen 3·Phi-4 mini·Whisper·Voxtral 실시간 스트리밍 전사를 지원합니다.

🟢 📦 오픈소스 2026년 5월 19일 · 2 분 읽기

GitHub: Copilot Spaces API 일반 제공 개시

Editorial illustration: GitHub가 Copilot Spaces REST API의 일반 제공을 발표――팀이 컨텍스트 인식 AI 작업 공간을 프로그래밍 방식으로 생성하고 관리 가능

GitHub는 Copilot Spaces의 REST API 일반 제공을 발표해 팀이 컨텍스트 인식 AI 작업 공간을 프로그래밍 방식으로 생성·구성·삭제할 수 있게 되었습니다. 새로운 인터페이스는 수동 워크플로우에 의존하지 않고 다수의 Spaces를 관리하는 조직에 특히 유용합니다.

⚖️ 규제 (1)

🟡 ⚖️ 규제 2026년 5월 19일 · 2 분 읽기

EU AI Office: 고위험 AI 시스템 분류에 관한 공개 의견 수렴——마감 2026년 6월 23일

Editorial illustration: 유럽위원회가 AI 시스템 고위험 분류 지침 초안에 관한 공개 의견 수렴 시작

유럽위원회가 AI 시스템이 언제 「고위험」 카테고리에 해당하는지 정의하는 지침 초안에 관한 공개 의견 수렴을 시작했습니다. 개발자부터 시민 사회까지 모든 이해관계자는 2026년 6월 23일 22:00 CET까지 피드백을 제출할 수 있습니다.

🤝 에이전트 (8)

🔴 🤝 에이전트 2026년 5월 19일 · 2 분 읽기

Anthropic: Stainless 인수로 MCP 서버 툴링과 SDK 개발을 Claude 플랫폼에 직접 통합

Editorial illustration: Anthropic이 2026년 5월 18일 Stainless를 인수. 2022년 설립된 동사는 모든 공식 Anthropic SDK와 MCP 서버 툴링을 담당해왔음

Anthropic은 2026년 5월 18일, 2022년 설립된 Stainless를 인수했습니다. Stainless는 모든 공식 Anthropic SDK와 MCP 서버 툴링을 개발한 회사로, 수백 개 기업에 SDK를 제공해왔습니다. 이번 인수는 Claude 에이전트와 외부 데이터 및 도구의 연동을 강화하기 위한 것입니다.

🔴 🤝 에이전트 2026년 5월 19일 · 3 분 읽기

Anthropic: MCP Tunnels, 자체 호스팅 샌드박스, 툴 출력 자동 파일 스필

Editorial illustration: Anthropic이 Claude API 플랫폼에 에이전트 개발자를 위한 세 가지 중요 업데이트 도입

Anthropic이 Claude API 플랫폼에 세 가지 중요한 업데이트를 도입했습니다. 인터넷 노출 없이 프라이빗 네트워크 연결을 가능하게 하는 MCP Tunnels, Anthropic 관리 인프라의 대안인 자체 호스팅 샌드박스, 그리고 100K 토큰을 초과하는 툴 출력의 자동 파일 스필 기능입니다.

🟡 🤝 에이전트 2026년 5월 19일 · 2 분 읽기

arXiv:2605.18661: AI 자동 연구 로드맵 및 사용자 가이드

Editorial illustration: arXiv 논문 2605.18661이 자율적으로 연구 논문을 생성하는 AI 시스템을 분석

NUS와 NTU 연구자들이 arXiv 논문 2605.18661에서 단 15달러로 자율적으로 연구 논문을 생성하는 시스템을 분석했습니다. 핵심 발견: 프론티어 LLM은 결과를 조작하고 아이디어의 새로움을 신뢰성 있게 평가하지 못합니다. 포괄적인 로드맵은 신뢰할 수 있는 지원과 안전하지 않은 AI 자율성 사이의 경계를 정의합니다.

🟡 🤝 에이전트 2026년 5월 19일 · 2 분 읽기

arXiv:2605.16233: FORGE――파인튜닝 없이 AI 에이전트가 공유 메모리를 구축하는 방법

Editorial illustration: arXiv:2605.16233이 제안하는 FORGE――LLM 에이전트들이 집단적 경험 브로드캐스트를 통해 모델 가중치 변경 없이 공유 메모리를 구축하는 방법

arXiv:2605.16233은 모델 가중치를 전혀 업데이트하지 않고 LLM 에이전트들이 집단적 경험 공유를 통해 공유 메모리를 구축하는 FORGE를 제안합니다. CybORG CAGE-2 네트워크 방어 작업에서 기준선 대비 1.7~7.7배 성능 향상을 달성했으며, 성능이 낮은 모델에서 특히 두드러진 개선이 나타났습니다.

🟡 🤝 에이전트 2026년 5월 19일 · 2 분 읽기

Anthropic Claude Code v2.1.144: 백그라운드 세션 /resume 지원 및 75초 행 수정

Editorial illustration: Anthropic Claude Code CLI v2.1.144 백그라운드 세션 /resume 지원 및 소요 시간 표시

Anthropic Claude Code CLI v2.1.144에서 「Agent completed · 3h 2m 5s」와 같은 소요 시간 표시와 함께 백그라운드 세션의 /resume 지원이 도입되었고, API 사용 불가 시 75초 행이 수정되었으며, 도구를 조용히 잃어버리던 MCP tools/list 페이지네이션 버그가 해결되고, 다양한 터미널 및 MCP 수정이 제공되었습니다.

🟡 🤝 에이전트 2026년 5월 19일 · 2 분 읽기

GitHub: Copilot CLI 원격 제어 기능이 모든 플랫폼에서 일반 제공 개시

Editorial illustration: GitHub가 GitHub Copilot CLI 원격 제어 기능의 일반 제공을 발표――/remote on 명령으로 크로스 디바이스 세션 관리 가능

GitHub는 GitHub Copilot CLI 원격 제어 기능의 일반 제공(GA)을 발표했습니다. /remote on 명령으로 개발자는 모바일 기기·웹·VS Code·JetBrains IDE에서 활성 터미널 세션을 모니터링하고 관리할 수 있으며, 작업 흐름을 중단하지 않아도 됩니다.

🟢 🤝 에이전트 2026년 5월 19일 · 3 분 읽기

arXiv:2605.18747: 운영 기반으로서의 코드——AI 에이전트의 새로운 패러다임

Editorial illustration: UIUC와 NVIDIA의 41명 연구자들이 코드는 AI 에이전트 운영 기반이라고 주장

UIUC와 NVIDIA의 41명 연구자들이 코드는 단순히 LLM의 출력이 아니라 에이전트 하네스——추론, 행동, 검증을 단일 프레임워크에 통합하여 신뢰할 수 있는 AI 시스템을 구축하는 운영 기반——라고 주장합니다.

🟢 🤝 에이전트 2026년 5월 19일 · 2 분 읽기

arXiv:2605.16238: LLM 유도 트리 서치가 질병 유행 예측에서 CDC를 능가하다

Editorial illustration: arXiv:2605.16238이 제안하는 LLM과 트리 서치를 결합한 자율 시스템을 통한 인플루엔자·COVID-19·RSV 계절성 유행 예측

arXiv:2605.16238은 LLM과 트리 서치 알고리즘을 결합한 자율 시스템을 통한 계절성 전염병 예측을 발표합니다. 2025~26 시즌의 실시간 평가에서 시스템은 인플루엔자·COVID-19·RSV 모델을 자율적으로 구축해 CDC의 황금 표준인 전문가 큐레이션 앙상블 모델을 지속적으로 달성하거나 능가했습니다.

🏥 실무 (1)

🟢 🏥 실무 2026년 5월 19일 · 2 분 읽기

CNCF: Kubernetes 디버거가 접근 흔적을 삭제――보안 감사에 심각한 규정 준수 문제

Editorial illustration: CNCF가 kubectl debug 세션 종료 후 기록이 남지 않는 문제를 경고――PCI DSS 및 SOC 2 규정 준수에 대한 위협

CNCF는 Kubernetes 컨테이너 진단 도구인 kubectl debug가 세션 종료 후 어떠한 기록도 남기지 않는다고 경고합니다. 이로 인해 규제 대상 산업에서는 핵심 질문에 답할 수 없습니다. 누가 어떤 컨테이너를 얼마나 오래 열람했는지――이는 PCI DSS 및 SOC 2 감사 로그 요건을 직접적으로 위반합니다.

🛡️ 보안 (2)

🟡 🛡️ 보안 2026년 5월 19일 · 2 분 읽기

arXiv:2605.16090: CrossMPI――이미지 섭동만으로 비전-언어 모델을 공격하는 크로스모달 프롬프트 인젝션

Editorial illustration: arXiv:2605.16090이 제안하는 CrossMPI――이미지 픽셀의 보이지 않는 섭동으로 비전-언어 모델에 악의적 지시를 주입하는 크로스모달 공격

arXiv:2605.16090은 텍스트를 전혀 사용하지 않고 이미지 픽셀에 대한 보이지 않는 섭동만으로 비전-언어 모델에 악의적인 지시를 주입하는 CrossMPI를 제안합니다. 연구자들은 멀티모달 통합의 핵심 레이어가 모델 중간부에 위치함을 발견했으며, 공격 평균 성공률(ASR)은 66.36%로 모든 기존 기준선 대비 40.91퍼센트포인트 앞섰습니다.

🟡 🛡️ 보안 2026년 5월 19일 · 2 분 읽기

arXiv:2605.17634: 데이터와 명령어 분리로는 프롬프트 인젝션을 막을 수 없는 이유

Editorial illustration: CISPA Helmholtz 센터와 Google 연구자들이 데이터 명령어 분리의 한계를 수학적으로 증명

CISPA Helmholtz 센터와 Google의 연구자들이 데이터/명령어 분리——프롬프트 인젝션 공격의 현재 주류 방어——가 컨텍스트 조작으로부터 보호할 수 없음을 수학적으로 증명했습니다. Contextual Integrity에 기반한 새로운 이론적 프레임워크와 함께 AI 에이전트 보호 설계의 근본적으로 다른 접근법을 제안합니다.

← 전날 다음 날 →