2026년 5월 18일 월요일

11 개 뉴스 — 🟡 5 주목 , 🟢 6 흥미

🤖 모델 (1)

🟡 🤖 모델 2026년 5월 18일 · 3 분 읽기

GitHub Copilot: GPT-5.3-Codex, Business 및 Enterprise 기본 모델로 전환, 12개월 LTS 보장

GitHub는 2026년 5월 17일 GPT-5.3-Codex가 GPT-4.1을 대체하여 Copilot Business 및 Enterprise의 기본 모델이 된다고 발표했습니다. 이 변경은 엔터프라이즈 티어에만 해당됩니다(Copilot Pro, Pro+, Free 제외). GPT-5.3-Codex는 최초의 LTS(장기 지원) 모델로, 2026년 2월 5일부터 2027년 2월 4일까지 12개월 가용성이 보장됩니다. 가격: 프리미엄 요청 배수 1×. GPT-4.1은 2026년 6월 1일 지원 중단 전까지 배수 0×(무료)로 강제 활성화 상태를 유지합니다.

📦 오픈소스 (6)

🟡 📦 오픈소스 2026년 5월 18일 · 3 분 읽기

arXiv:2605.15041 CAST 프레임워크: 사례 기반 보정 LLM 도구 사용으로 BFCLv2 +5.85pp 달성 및 추론 길이 26% 감소

Editorial illustration: LLM agent s case library prikazom i tool call validation indicators.

CAST는 Renning Pang, Tian Lan, Leyuan Liu, Piao Tong, Sheng Cao, Xiaosong Zhang이 저술한 2026년 5월 14일 arXiv 논문으로 LLM 도구 사용을 위한 사례 기반 보정 프레임워크를 소개합니다. 이 접근 방식은 강화 학습을 위한 구조화된 정보로 과거 실행 궤적을 처리합니다. BFCLv2 기준선 대비 최대 +5.85 퍼센트 포인트 실행 정확도 향상과 평균 추론 길이 26% 감소를 달성합니다.

🟢 📦 오픈소스 2026년 5월 18일 · 4 분 읽기

arXiv:2605.15706 미분 가능한 에이전트 혼합: 동적 라우팅 에이전트 활성화로 9개 벤치마크 SOTA 달성

Editorial illustration: neural network routing graf s LLM agentima i sparse activation indicator-ima.

미분 가능한 에이전트 혼합(Differentiable Mixture-of-Agents)은 Xingjian Wu, Junkai Lu, Siyu Yan, Xiangfei Qiu, Jilin Hu, Chenjuan Guo, Bin Yang이 2026년 5월 15일 발표한 arXiv 논문으로, 멀티 에이전트 LLM 협업을 위한 미분 가능한 라우팅 메커니즘을 제안합니다. 고정 토폴로지 대신 추론 단계별로 에이전트를 동적으로 선택하고 활성화하며, 외부 주석 없는 예측 엔트로피 자기 지도 학습을 통한 테스트 시간 적응으로 9개 벤치마크에서 SOTA를 달성합니다.

🟢 📦 오픈소스 2026년 5월 18일 · 3 분 읽기

arXiv:2605.15100 이중 차원 일관성: 다섯 가지 벤치마크에서 정확도를 유지하면서 토큰 소비 10배 이상 감소

Editorial illustration: paralelni reasoning paths s confidence score badge-ovima i pruning ikonom.

이중 차원 일관성은 Rongman Xu, Yifei Li, Tianzhe Zhao, Yanrui Wu, Bo Li, Hang Yan이 작성한 2026년 5월 14일 arXiv 논문으로 추론 시 스케일링 효율성을 다룹니다. 이 프레임워크는 신뢰도 가중 베이즈 프로토콜과 트렌드 인식 계층적 가지치기를 결합합니다. 다섯 가지 벤치마크에서 강력한 기준선과 비교하여 토큰 소비를 10배 이상 줄이면서 정확도를 유지하거나 향상시키는 것을 실증합니다.

🟢 📦 오픈소스 2026년 5월 18일 · 3 분 읽기

arXiv:2605.15015 소형 프라이빗 LM: 교육 평가 설계에서 경쟁력 있는 결과 달성 및 휴먼 인 더 루프 권장

Editorial illustration: učionica scena s small LM ikonama, Bloom's taxonomy piramidom i human reviewer prikazom.

「교육 평가 설계의 팀원으로서의 소형 프라이빗 언어 모델」은 Chris Davis Jaldi, Anmol Saini, Shan Zhang, Noah Schroeder, Cogan Shimizu, Eleni Ilkou가 저술한 2026년 5월 14일 arXiv 논문입니다. 교육적으로 일치된 평가 문제 생성에서 소형 모델과 대형 대안을 체계적으로 비교했습니다. 소형 모델은 프라이버시 혜택과 함께 경쟁력 있는 결과를 달성하지만, 저자들은 모델 기반 평가에 체계적인 불일치가 있음을 강조하고 휴먼 인 더 루프 접근 방식을 권장합니다.

🟢 📦 오픈소스 2026년 5월 18일 · 3 분 읽기

arXiv:2605.15109 순회 컨텍스트: 에이전트 GraphRAG는 진정한 출처 추적을 위해 방문했지만 인용하지 않은 엔티티를 기록해야 합니다

Editorial illustration: knowledge graph s istaknutim traversal pathom i citation badge anotacijama uz uncited node-ove.

「이웃이 중요한 이유」는 Riccardo Terrenzi, Maximilian von Zastrow, Serkan Ayvaz가 저술한 2026년 5월 14일 arXiv 논문입니다(IJCAI-ECAI 2026 GENAIK·NORA 공동 워크숍 채택). 저자들은 에이전트 GraphRAG 시스템이 인용 충실도를 궤적 수준의 문제로 다루어야 한다고 주장합니다. 진정한 출처 추적은 인용된 증거뿐만 아니라 모델 추론에 영향을 미친 방문했지만 인용되지 않은 엔티티도 포함합니다.

🟢 📦 오픈소스 2026년 5월 18일 · 2 분 읽기

xAI SDK Python v1.13.0: prepare_extension()으로 생성된 클립 시리즈의 배치 비디오 확장 지원

Editorial illustration: serija video frameova s batch processing ikonom i xAI SDK kod snippet vizualizacijom.

xAI SDK Python v1.13.0이 2026년 5월 16일에 출시되었습니다(커밋 작성자 @double-di, PR #141). 배치 비디오 확장을 위한 새로운 prepare_extension() 메서드가 추가되었습니다. 이 기능은 v1.10.0에서 도입된 비디오 API를 확장하여 배치 처리 기능을 추가합니다. 개발자는 이제 각 클립을 순차적으로 처리하는 대신 한 번의 호출로 일련의 클립에 대한 확장을 준비할 수 있습니다.

🤝 에이전트 (3)

🟡 🤝 에이전트 2026년 5월 18일 · 3 분 읽기

arXiv:2605.16217 Argus: 심층 연구 에이전트를 위한 증거 조립 아키텍처, 8개 병렬 검색기로 +12.7pp 달성

Editorial illustration: knowledge graph s evidence node-ovima i parallel searcher agentima oko centralnog navigator-a.

Argus는 Zhen Zhang, Liangcai Su, Zhuo Chen 등이 2026년 5월 15일 발표한 arXiv 논문으로, 심층 연구 에이전트를 위한 증거 조립 프레임워크를 제안합니다. 이 시스템은 듀얼 에이전트 아키텍처인 검색기(ReAct 스타일 추적)와 내비게이터(공유 증거 그래프 + RL 합성)를 사용하며, 단일 검색기로 +5.5pp, 8개 병렬로 +12.7pp, 64개 병렬로 컨텍스트 초과 없이 BrowseComp에서 86.2점을 달성합니다.

🟡 🤝 에이전트 2026년 5월 18일 · 3 분 읽기

GitHub Copilot: Grok Code Fast 1이 2026년 5월 15일 지원 중단; 권장 대안은 GPT-5 mini와 Claude Haiku 4.5

Editorial illustration: deprecated stamp na xAI Grok ikoni s arrows prema GPT-5 mini i Claude Haiku 4.5 logosima.

GitHub은 2026년 5월 15일 모든 Copilot 경험(채팅, 인라인 편집, 질문, 에이전트 모드, 코드 완성)에서 Grok Code Fast 1 모델의 공식 지원 중단을 발표했습니다. 이 지원 중단은 5월 8일 발표 후 일주일만에 이루어졌습니다. 권장 대안: GPT-5 mini와 Claude Haiku 4.5 — 모두 표준 모델 정책을 통해 이용 가능합니다. 기업 관리자는 Copilot 설정을 통해 대안을 활성화해야 합니다.

🟢 🤝 에이전트 2026년 5월 18일 · 4 분 읽기

Databricks + Veeva Vault CRM: 생명과학 상업 워크플로를 위한 세 가지 전문 AI 에이전트

Editorial illustration: pharma sales rep s tablet i AI agent overlay s patient data dashboard.

Databricks는 2026년 5월 18일 Veeva Systems와의 파트너십 심화를 발표하며, 생명과학 산업을 위한 Vault CRM 워크플로에 Genie AI 에이전트를 직접 통합한다고 밝혔습니다. 세 가지 전문 에이전트 페르소나인 영업 담당자 에이전트, 의학 과학 연락 담당자(MSL) 에이전트, 테리토리 매니저 에이전트는 Unity Catalog 거버넌스를 통해 Databricks 레이크하우스에 액세스합니다. 이 발표는 보스턴에서 열리는 Veeva Commercial Summit(2026년 5월 19~20일)에 앞서 나왔습니다.

🛡️ 보안 (1)

🟡 🛡️ 보안 2026년 5월 18일 · 4 분 읽기

arXiv:2605.15338 슬리퍼 메모리 포이즈닝: LLM 에이전트 영구 메모리를 통한 GPT-5.5 공격 성공률 99.8%

Editorial illustration: LLM agent memory store s dormantnim adversarial token-ima i wake-up trigger ikone.

「Hidden in Memory」는 Sidharth Pulipaka, Stanislau Hlebik, Leonidas Raghav, Sahar Abdelnabi, Vyas Raina, Ivaxi Sheth, Mario Fritz가 2026년 5월 14일 발표한 arXiv 논문으로, 상태 기반 LLM 에이전트에 대한 지연 실행 공격을 제안합니다. 외부 컨텍스트(문서, 웹페이지)의 적대적 콘텐츠가 에이전트의 영구 메모리를 오염시켜 GPT-5.5에서 99.8%, Kimi-K2.6에서 95%의 성공률을 달성했으며, 오염된 메모리가 공격자 의도 행동을 유발하는 비율은 60~89%입니다.

← 전날 다음 날 →