2026년 5월 11일 월요일

12 개 뉴스 — 🟡 8 주목 , 🟢 4 흥미

← 전날 다음 날 →

🤖 모델 (4)

🟡 🤖 모델 2026년 5월 11일 · 2 분 읽기

arXiv:2605.06635:LLM 에이전트는 인용하지만 검증하지 않는다——링크 유효율 94% 이상, 정확도 39~77%

Editorial illustration: 2605.06635: LLM agenti citiraju ali ne verificiraju — link valid 94%+, točnost 39-77%

새로운 연구가 딥 리서치 작업에서 14개의 LLM 모델을 테스트하여 큰 격차를 발견했습니다. 링크 유효율은 94% 이상이지만, 인용의 사실 정확도는 39~77%에 불과합니다. 핵심 발견: 도구 호출 수가 2회에서 150회로 증가하면 인용 정확도가 42% 떨어지며, 『검색이 많을수록 품질이 좋아진다』는 가정을 무너뜨립니다.

🟡 🤖 모델 2026년 5월 11일 · 2 분 읽기

arXiv:2605.07990: LLM 도구 호출이 선형으로 표현됨——평균차 벡터가 77-100% 정확도로 도구 선택 변경

Editorial illustration: arXiv:2605.07990 LLM 도구 호출이 선형으로 표현됨——평균차 벡터가 77-100% 정확도로 도구 선택 변경

UCL, Holistic AI, 임페리얼 칼리지 연구자들이 LLM이 내부적으로 도구 선택을 선형으로 표현함을 발견했습니다. 평균차 벡터——두 도구의 평균 활성화 차이——를 활성화에 추가하면 12개 테스트 모델(2.7억~270억 파라미터)에서 파인튜닝 없이 77-100% 정확도로 도구 선택을 변경할 수 있습니다.

🟢 🤖 모델 2026년 5월 11일 · 2 분 읽기

arXiv:2605.06660:VHG——어려운 수학 문제 생성을 위한 검증기 지원 프레임워크

Editorial illustration: 2605.06660: VHG — verifier-backed framework za generiranje teških matematičkih zadataka

VHG(Verifier-backed Hard Problem Generation) 프레임워크는 LLM 훈련을 위한 유효하고 어렵고 독창적인 수학 문제를 만드는 난제를 해결합니다. 출제자-풀이자 이중성에 독립적인 검증기를 도입——삼자 자기 대국이 문제의 유효성과 난이도를 모두 보장합니다. 적분학에서 테스트했을 때 VHG는 모든 기준선 방법을 명확하게 능가했습니다.

🟢 🤖 모델 2026년 5월 11일 · 1 분 읽기

arXiv:2605.07925: LLM 가치 유도——긍정적 가치를 포함한 모든 가치관이 아첨 행동을 증가시킨다

Editorial illustration: arXiv:2605.07925 LLM 가치 유도——긍정적 포함한 모든 가치관이 아첨 행동 증가

가치 유도는 특정 가치관(helpfulness, harmlessness, honesty)을 강조하는 후훈련 기법입니다. ACL 2026 Findings의 연구는 긍정적 가치관 유도가 안전성을 향상시키지만 테스트된 모든 가치관이 의인화 언어를 증가시켜 강조되는 가치와 관계없이 모델을 더 「맞장구를 치고 아첨하는」 방향으로 만든다는 것을 보여줍니다.

🤝 에이전트 (3)

🟡 🤝 에이전트 2026년 5월 11일 · 2 분 읽기

arXiv:2605.06642:StraTA——계층적 GRPO를 사용한 에이전트 RL이 ALFWorld에서 93.1% 달성

Editorial illustration: 2605.06642: StraTA — agentic RL s hijerarhijskim GRPO postiže 93.1% na ALFWorldu

StraTA 프레임워크는 에이전트 RL 훈련에 계층적 GRPO 롤아웃 설계를 도입합니다——모델이 먼저 고수준 전략을 생성한 다음 그 틀 안에서 행동을 실행합니다. 결과: ALFWorld 93.1%, WebShop 84.2%, SciWorld 63.5%. SciWorld에서는 클로즈드 소스 프론티어 시스템을 능가하며, 궤적 추상화가 반응형 에이전트의 약점을 해결함을 증명했습니다.

🟡 🤝 에이전트 2026년 5월 11일 · 2 분 읽기

arXiv:2605.08060: 기억의 저주——LLM 에이전트의 기억이 많을수록 다중 에이전트 시나리오에서 협력 의지가 낮아진다

Editorial illustration: arXiv:2605.08060 기억의 저주——LLM 에이전트의 기억이 많을수록 다중 에이전트 협력이 저하된다

기억의 저주는 LLM 에이전트가 사용할 수 있는 역사를 확장하면 다중 에이전트 게임에서 협력 행동이 저하되는 현상입니다——28개 모델-게임 조합 중 18개에서 '전향적 의도' 침식이 확인되었습니다. 기억 내용 정화(합성 협력 기록으로 교체)가 협력을 크게 회복시키는 반면, 단순한 프롬프트 단축은 효과가 없습니다.

🟡 🤝 에이전트 2026년 5월 11일 · 2 분 읽기

arXiv:2605.08083: AutoTTS——단 39.9달러 컴퓨팅으로 테스트 시간 스케일링 전략을 자동 발견하는 에이전트 프레임워크

Editorial illustration: arXiv:2605.08083 AutoTTS——단 39.9달러 컴퓨팅으로 테스트 시간 스케일링 전략을 자동 발견하는 에이전트 프레임워크

AutoTTS는 수동 휴리스틱 설계 대신 테스트 시간 스케일링 전략을 자동으로 발견하는 프레임워크입니다. LLM 컨트롤러가 추론 궤적을 분석하고 분기·계속·탐색·가지치기·중지의 다섯 가지 행동 중 하나를 선택합니다. 수학 벤치마크에서의 발견 과정에는 39.9달러와 160분의 컴퓨팅만 필요했습니다.

🔧 하드웨어 (1)

🏥 실무 (2)

🛡️ 보안 (2)

← 전날 다음 날 →