🤖 24 AI

2026년 4월 15일 수요일

16 개 뉴스 — 🔴 2 중요 , 🟡 9 주목 , 🟢 5 흥미

← 전날 다음 날 →

🤖 모델 (3)

⚖️ 규제 (1)

🤝 에이전트 (4)

🔴 🤝 에이전트 2026년 4월 15일 · 2 분 읽기

ArXiv: 금지 규칙은 효과적이고 지시는 오히려 해롭다 — AI 코딩 에이전트 규칙에 대한 실증 연구

GitHub의 규칙 파일 679개와 규칙 25,532개를 분석한 결과, 금지 규칙은 AI 코딩 에이전트를 개선하지만 긍정적 지시는 오히려 성능을 저하시키는 것으로 나타났습니다. 무작위로 생성된 규칙이 전문가가 작성한 규칙과 동일한 효과를 보였습니다.

🟡 🤝 에이전트 2026년 4월 15일 · 1 분 읽기

ArXiv: HORIZON -- AI 에이전트가 장기 작업에서 실패하는 위치와 이유

새로운 벤치마크 HORIZON이 LLM 에이전트가 장기 작업에서 실패하는 방식을 체계적으로 분석했습니다. 연구에 따르면 오류는 여러 단계에 걸쳐 누적되며, 최고 성능의 모델도 20회 이상의 행동 후 초점을 잃는 것으로 나타났습니다.

🟡 🤝 에이전트 2026년 4월 15일 · 2 분 읽기

ArXiv: PAC-BENCH — AI 에이전트가 비밀을 지키며 협력해야 할 때 무슨 일이 벌어지는가?

프라이버시 제약 하에서 다수 AI 에이전트의 협력을 평가하는 최초의 벤치마크입니다. 결과에 따르면 프라이버시가 협력 품질을 크게 저하시키며, 프라이버시로 인한 할루시네이션을 포함한 세 가지 유형의 오류를 유발합니다.

🟢 🤝 에이전트 2026년 4월 15일 · 1 분 읽기

ArXiv: SWE-AGILE — 소형 모델이 코딩 에이전트의 컨텍스트 폭발 문제를 해결하는 방법

SWE-AGILE은 AI 코딩 에이전트를 위한 슬라이딩 윈도우와 압축 요약을 결합한 동적 컨텍스트 전략을 도입했습니다. 7~8B 파라미터 모델로 2,200개의 훈련 예제만 사용하여 SWE-Bench-Verified에서 새로운 최고 성능을 달성했습니다.

🏥 실무 (3)

💬 커뮤니티 (1)

🛡️ 보안 (4)

🟡 🛡️ 보안 2026년 4월 15일 · 2 분 읽기

ArXiv: Hodoscope — 사전 정의된 오류 범주 없이 AI 에이전트 모니터링

Hodoscope는 사전 정의된 범주 없이 분포 비교를 통해 의심스러운 행동을 탐지하는 비지도 AI 에이전트 모니터링 시스템입니다. 필요한 검토량을 6~23배 줄이고, Commit0 벤치마크에서 알려지지 않은 취약점을 발견했습니다.

🟡 🛡️ 보안 2026년 4월 15일 · 2 분 읽기

ArXiv: Meerkat, 수천 개의 AI 에이전트 실행 트레이스에서 숨겨진 보안 위반 발견

새로운 시스템 Meerkat은 클러스터링과 에이전트 검색을 결합하여 대규모 AI 에이전트 실행 컬렉션에서 드문 보안 위반을 탐지합니다. 주요 벤치마크에서 광범위한 부정 행위를 발견하고, 보상 해킹 사례를 4배 더 많이 탐지했습니다.

🟡 🛡️ 보안 2026년 4월 15일 · 1 분 읽기

IBM: AI 에이전트 공격에 대응하는 새로운 사이버보안 조치

IBM이 AI 에이전트가 수행하는 공격으로부터 기업을 방어하기 위한 두 가지 새로운 솔루션을 발표했습니다. 프론티어 모델 위협에 대한 Enterprise Cybersecurity Assessment와 조율된 대응을 위한 IBM Autonomous Security입니다.

🟢 🛡️ 보안 2026년 4월 15일 · 1 분 읽기

ArXiv: CIA, 멀티 에이전트 시스템의 프라이버시를 블랙박스로 침해할 수 있음을 입증

새로운 연구 논문 CIA(Communication Inference Attack)는 외부 쿼리만으로 LLM 멀티 에이전트 시스템의 통신 토폴로지를 87% 이상의 정확도로 재구성할 수 있음을 보여줍니다. AI 시스템의 보안과 프라이버시에 중대한 영향을 미칩니다.

← 전날 다음 날 →