2026년 5월 14일 목요일

15 개 뉴스 — 🟡 10 주목 , 🟢 5 흥미

← 전날 다음 날 →

🤖 모델 (3)

🟡 🤖 모델 2026년 5월 14일 · 2 분 읽기

arXiv:2605.13301 SU-01:30B A3B 모델, 3단계 훈련으로 IMO 2025·USAMO 2026·IPhO에서 금메달 수준 달성

에디토리얼 일러스트: 수학 공식과 AI 추론 트리가 있는 메달 시상대.

SU-01은 2026년 5월 14일 arXiv에 공개된 새로운 추론 훈련 방법론입니다(Yafu Li 및 27명의 공저자, 교신저자 Runzhe Zhan). 30B 파라미터 A3B 백본이 340K 궤적에 대한 역 퍼플렉시티 커리큘럼 SFT, 2단계 RL, 테스트 시간 스케일링이라는 세 가지 연속 단계를 통해 IMO 2025, USAMO 2026, IPhO 2024-2025에서 금메달 수준의 성능을 달성합니다. 추론 체인은 100K+ 토큰에 달합니다.

🟢 🤖 모델 2026년 5월 14일 · 2 분 읽기

Allen Institute: AIMIP 벤치마크——AI 기후 모델은 과거 데이터에서 2배 우수하지만 장기적 온난화에는 일반화하지 못합니다

편집 일러스트: 과거 데이터와 비교된 AI 모델 라인이 있는 기후 시계열 그래프.

AIMIP(AI 모델 비교 프로젝트)는 2026년 5월 13일 Allen Institute가 NVIDIA, Google Research, 워싱턴 대학교, 메릴랜드 대학교, ArchesWeather 그룹과 함께 발표한 AI 기상 및 기후 모델을 위한 새로운 커뮤니티 벤치마크입니다. 8개의 AI 모델 시뮬레이션에 대한 1단계 평가는 과거 데이터에서 오류가 두 배 감소한다는 것을 보여주었지만, 동시에 장기적 온난화 추세에 대한 심각한 일반화 불능도 드러났습니다.

🟢 🤖 모델 2026년 5월 14일 · 2 분 읽기

Microsoft Research GridSFM: 파운데이션 모델이 AC 최적 조류 계산을 DC 근사보다 100배 빠르게 해결합니다

편집 일러스트: AI 파운데이션 모델과 최적화 그래프가 있는 전력망 네트워크.

GridSFM은 2026년 5월 13일 Microsoft Research가 발표한 전력망을 위한 새로운 소형 파운데이션 모델입니다. 500개에서 80,000개 노드의 전력망에서 AC 최적 조류 계산을 밀리초 단위로 근사하며, DC 근사보다 100배, 완전한 AC 솔버보다 1,000배 빠릅니다. 중앙값 비용 격차는 2.23%이며, 실행 가능성 감지는 94.5%/96.1%를 달성하고, 연간 200억 달러의 혼잡 비용 절감 가능성이 있습니다.

📦 오픈소스 (2)

🤝 에이전트 (4)

🟡 🤝 에이전트 2026년 5월 14일 · 2 분 읽기

Amazon Nova Sonic + WebRTC: Kinesis Video Streams와 RAG/MCP를 위한 비동기 도구 호출을 통한 실시간 음성 에이전트

편집 일러스트: WebRTC 흐름과 클라우드 시스템으로의 도구 호출 화살표가 있는 음성 에이전트.

Amazon Nova Sonic + WebRTC 통합은 2026년 5월 13일 AWS가 발표한 실시간 음성 에이전트 애플리케이션을 위한 새로운 아키텍처입니다. 음성 대 음성 이벤트 프로세서가 Kinesis Video Streams WebRTC 시그널링을 통해 미디어와 텍스트 데이터 이벤트를 오케스트레이션하며, 서버 사이드 VAD가 오디오 토큰을 줄입니다. Nova Sonic은 MCP 서버, Strands 에이전트, RAG 시스템으로의 비동기 도구 호출을 지원하며, IoT와 커넥티드 차량 시나리오가 첫 번째 데모입니다.

🟡 🤝 에이전트 2026년 5월 14일 · 2 분 읽기

Anthropic: Claude Code v2.1.141, terminalSequence 훅·Bedrock Haiku 수정·『여기까지 요약』 되감기 옵션 추가

에디토리얼 일러스트: 새 훅 아이콘과 되감기 컨트롤이 있는 Claude Code 터미널.

Claude Code v2.1.141은 Anthropic CLI 에이전트의 신규 버전으로, 2026년 5월 13일에 출시되었습니다. 이번 주 세 번째 패치 버전은 훅 JSON 출력에 terminalSequence 필드, CLAUDE_CODE_PLUGIN_PREFER_HTTPS 및 ANTHROPIC_WORKSPACE_ID 환경 변수, claude agents --cwd 경로 스코핑, 이전 컨텍스트를 압축하는 새로운 되감기 메뉴 옵션 『여기까지 요약』을 추가합니다. Bedrock/Vertex Haiku 모델 ID 경쟁 조건 및 Windows 데몬 상태 문제도 수정되었습니다.

🟡 🤝 에이전트 2026년 5월 14일 · 2 분 읽기

LangChain: Managed Deep Agents——지속 실행과 메모리 레이어를 갖춘 LangSmith의 호스팅 런타임

편집 일러스트: 클라우드 환경에서 메모리와 도구 레이어가 있는 호스팅 에이전트 런타임.

Managed Deep Agents는 2026년 5월 13일 LangSmith 플랫폼의 프라이빗 베타로 발표된 LangChain의 새로운 호스팅 에이전트 런타임입니다. 지속 실행, 영구 메모리, 통합 툴링, 포괄적 관찰성을 제공합니다——프로덕션 딥 에이전트에 필요한 모든 인프라 구성 요소입니다. 에이전트 정의는 표준 AGENTS.md와 tools.json 파일을 통해 리포지토리에 유지됩니다.

🟡 🤝 에이전트 2026년 5월 14일 · 2 분 읽기

OpenAI: Codex Windows 샌드박스는 자율 에이전트를 위한 제어된 파일시스템 접근과 네트워크 제한을 도입합니다

편집 일러스트: 파일시스템과 네트워크 접근을 둘러싼 보안 레이어가 있는 Codex 터미널.

Codex Windows 샌드박스는 2026년 5월 13일에 발표된 OpenAI의 새로운 보안 아키텍처로, Codex 에이전트가 Windows 운영 체제에서 안전하게 실행될 수 있도록 합니다. 샌드박스는 안전하고 효율적인 코딩 에이전트를 가능하게 하기 위해 제어된 파일시스템 접근과 네트워크 제한을 도입합니다. Codex는 이제 macOS/Linux 개발자뿐만 아니라 Windows 사용자도 이용할 수 있는 크로스플랫폼 도구가 되었습니다.

🏥 실무 (4)

🟡 🏥 실무 2026년 5월 14일 · 2 분 읽기

Perplexity: finance_search Agent API 도구, 단일 호출로 OHLCV·재무상태표·실적 트랜스크립트·애널리스트 추정치 반환

에디토리얼 일러스트: OHLCV 차트와 AI 에이전트 화살표가 있는 금융 데이터 대시보드.

Perplexity finance_search는 2026년 5월에 출시된 신규 Agent API 도구로, 상장 기업의 구조화된 금융 데이터를 반환합니다. 준실시간 가격, OHLCV 범위, 프리마켓·애프터아워스 데이터, 손익계산서, 재무상태표, 현금흐름, 실적 발표 트랜스크립트, SEC 공시, 애널리스트 추정치, ETF 구성 종목이 포함됩니다. 모델이 프롬프트를 기반으로 어떤 필드를 가져올지 자동으로 결정합니다.

🟢 🏥 실무 2026년 5월 14일 · 2 분 읽기

AWS: Pulse AI + Bedrock 파이프라인이 금융 문서를 위해 Nova Micro를 파인튜닝합니다——3시간에 1,000개 문서 처리

편집 일러스트: 자동화된 추출 파이프라인과 구조화된 데이터가 있는 금융 문서.

AWS Pulse AI + Amazon Bedrock 금융 문서 처리는 2026년 5월 13일 AWS가 발표한 새로운 엔터프라이즈 파이프라인 블루프린트입니다. 복잡한 금융 문서(SEC 제출 서류, 대차대조표, 감사 자료)에서의 Pulse AI 추출과 Amazon Nova Micro 모델 파인튜닝을 결합합니다. 이전에 여러 날의 처리가 필요했던 1,000개 문서 배치가 3시간 이내에 처리되었으며, 파인튜닝된 모델은 50% 기준선 대비 100% 수표 데이터 추출을 달성했습니다.

🟢 🏥 실무 2026년 5월 14일 · 2 분 읽기

CNCF:KubeStellar AI 에이전트, 91% 테스트 커버리지·63개 CI/CD 워크플로우로 81% PR 승인율 달성

에디토리얼 일러스트: AI 에이전트 아이콘과 CI/CD 파이프라인 화살표가 있는 Kubernetes 클러스터.

KubeStellar AI Agents는 KubeStellar Console의 수석 메인테이너 Andy Anderson이 2026년 5월 14일에 공개한 CNCF 블로그 게시물의 새로운 케이스 스터디입니다. 두 개의 병렬 AI 코딩 에이전트를 사용한 멀티클러스터 Kubernetes 대시보드가 82일 동안 81%의 PR 승인율을 달성했습니다. 인프라: 63개 CI/CD 워크플로우, 32개 나이틀리 테스트 스위트, 12개 샤드 상에서 91% 커버리지, 버그에서 머지까지 약 30분. Anderson은 AI 코드베이스 성숙도의 5단계를 정의합니다.

🟢 🏥 실무 2026년 5월 14일 · 2 분 읽기

GitHub: Copilot Cloud Agent REST API가 대규모 리팩토링, 리포지토리 설정, 주간 릴리스 준비에 개방됩니다

편집 일러스트: 자율 에이전트 아이콘과 REST API 엔드포인트가 있는 GitHub Actions 워크플로.

GitHub Copilot Cloud Agent REST API는 2026년 5월 13일 공개 미리보기로 발표된 새로운 개발자 엔드포인트로, 자율적인 Copilot 작업의 프로그래밍 방식 실행을 가능하게 합니다. 세 가지 주요 사용 사례: 많은 리포지토리에 걸친 코드 리팩토링/마이그레이션 팬아웃, 개발자 포털에서의 원클릭 리포지토리 초기화, 릴리스 노트가 포함된 자동 주간 릴리스 준비입니다. Copilot Business와 Enterprise 구독자가 이용 가능합니다.

🛡️ 보안 (2)

← 전날 다음 날 →