2026년 5월 4일 월요일

9 개 뉴스 — 🟡 6 주목 , 🟢 3 흥미

← 전날 다음 날 →

🤖 모델 (2)

🤝 에이전트 (4)

🟡 🤝 에이전트 2026년 5월 4일 · 2 분 읽기

ArXiv AEM: 멀티턴 RL 에이전트를 위한 적응형 엔트로피 변조, SWE-bench Verified에서 +1.4% 향상

Editorial illustration: ArXiv AEM: 멀티턴 RL 에이전트를 위한 적응형 엔트로피 변조, SWE-bench Verified에서 +1.4% 향상

1.5B~32B 파라미터 모델에서 RL 에이전트 탐색·활용 균형을 동적으로 조절하는 비지도 훈련 기법

🟡 🤝 에이전트 2026년 5월 4일 · 2 분 읽기

ICML 2026 포지션 페이퍼: 저자 30명, 에이전트 AI 오케스트레이션은 베이즈 일관성을 가져야 한다

Editorial illustration: ICML 2026 포지션 페이퍼: 저자 30명, 에이전트 AI 오케스트레이션은 베이즈 일관성을 가져야 한다

학술 및 산업 연구소의 연구자 30명이 ICML 2026에 채택된 포지션 페이퍼를 발표하며, 에이전트 AI 시스템의 제어 계층이 베이즈 일관성을 준수해야 한다고 주장했다. 저자들은 LLM이 불확실성 하의 의사결정에 적합하지 않지만, 그 위의 오케스트레이터는 교정된 신념을 유지하고 유틸리티 인식 정책을 사용할 수 있어야 한다고 주장했다.

🟡 🤝 에이전트 2026년 5월 4일 · 2 분 읽기

ArXiv 프레임워크 '호출할 것인가 말 것인가': LLM이 외부 도구 필요성을 잘못 판단한다는 것을 밝혀

Editorial illustration: ArXiv 프레임워크 '호출할 것인가 말 것인가': LLM의 외부 도구 필요성 오판을 밝혀

Max Planck Institute for Software Systems 등의 연구자들이 LLM 에이전트의 도구 호출 결정을 세 가지 차원(필요성, 효익, 비용 수용성)으로 평가하는 프레임워크를 발표했다. 6개 모델과 3개 작업에 대한 실험에서 모델이 필요하다고 판단하는 도구와 실제로 정확도를 높이는 도구 사이에 상당한 격차가 있음이 드러났으며, 이는 운영 에이전트의 비용과 신뢰성에 직접적인 영향을 미친다.

🟢 🤝 에이전트 2026년 5월 4일 · 2 분 읽기

ArXiv: LLM 에이전트 도구의 숨겨진 비용 - '도구 사용세'는 도구가 도움이 될 때도 정확도를 낮춘다

Editorial illustration: ArXiv: LLM 에이전트 도구의 숨겨진 비용 - 도구 사용세는 도구가 도움이 될 때도 정확도를 낮춘다

연구자들이 LLM 에이전트에서 도구를 호출하면 숨겨진 비용인 '도구 사용세'가 발생한다는 것을 증명했다. 호출 형식과 프로토콜 오버헤드로 인한 이 비용을 인수분해 개입 프레임워크로 세 가지 구성 요소로 분리하고, 모델 변경 없이 손실을 부분적으로 완화하는 G-STEP 게이트를 도입했다.

🏥 실무 (1)

🛡️ 보안 (2)

← 전날 다음 날 →