🤖 24 AI

오늘의 AI 뉴스

🟡 🛡️ 보안 2026년 4월 14일 · 2 분 읽기

ArXiv: 알고리즘 모노컬처 — LLM은 다양화해야 할 때 다양화하지 못합니다

새로운 연구에 따르면, 언어 모델은 다중 에이전트 협력 게임에서 높은 기본 유사성(모노컬처)을 보이며, 다양화가 유리한 경우에도 다양한 전략을 유지하기 어렵습니다. 이는 여러 AI 에이전트를 사용하는 시스템에 중요한 시사점을 줍니다.

🟡 🤝 에이전트 2026년 4월 14일 · 2 분 읽기

ArXiv HiL-Bench: AI 에이전트는 도움을 요청해야 할 때를 알고 있습니까?

새로운 벤치마크 HiL-Bench는 AI 에이전트가 자신의 한계를 인식하고 추측 대신 인간의 도움을 요청하는 능력을 측정합니다. 결과에 따르면 프론티어 모델조차 도움이 필요한 시점을 제대로 판단하지 못하지만, 목적에 맞는 트레이닝으로 이 능력을 개선할 수 있습니다.

🟡 🛡️ 보안 2026년 4월 14일 · 2 분 읽기

ArXiv OpenKedge: AI 에이전트의 모든 작업에 사전 허가를 요구하는 암호화 프로토콜

OpenKedge는 자율 AI 에이전트를 위한 새로운 보안 프로토콜로, 변경 사항을 실행하기 전에 명시적인 허가를 요구합니다. 암호화된 증거 체인을 사용하여 완전한 감사를 실현하고, 대규모 불안전한 작업을 방지합니다.

🟡 🤖 모델 2026년 4월 14일 · 1 분 읽기

ArXiv: Process Reward Agents — 재훈련 없이 실시간 피드백으로 AI 의료 추론 개선

연구자들이 의료 분야에서 AI 추론 과정 중 단계별 실시간 피드백을 제공하는 새로운 접근법인 Process Reward Agents(PRA)를 발표했습니다. 이 시스템은 재훈련 없이 기존 모델과 함께 작동하며, 의료 벤치마크에서 유의미한 성과를 달성했습니다.

🟡 🏥 실무 2026년 4월 14일 · 1 분 읽기

Google Research: Vantage — AI 아바타와의 대화를 통해 비판적 사고와 창의성을 평가하는 AI 플랫폼

Google Research가 NYU와 협력하여 비판적 사고와 창의성 등 측정이 어려운 인간 역량을 생성형 AI로 평가하는 실험적 플랫폼 Vantage를 발표했습니다. AI 평가는 인간 전문가와 동등한 일치도를 보였습니다.

🟢 ✨ 흥미로운 소식 2026년 4월 14일 · 2 분 읽기

ArXiv Camera Artist: 영화 언어를 활용하여 영상을 생성하는 다중 에이전트 AI 시스템

연구자들이 Camera Artist를 발표했습니다. 실제 영화 제작 워크플로를 모델링하여 내러티브 영상을 생성하는 다중 에이전트 시스템입니다. 감독, 촬영감독, 편집자를 시뮬레이션하는 전문 AI 에이전트를 조율하여 일관된 시각적 스토리텔링을 실현합니다.

🟢 🏥 실무 2026년 4월 14일 · 1 분 읽기

AWS: Amazon Nova 모델 파인튜닝을 위한 Lambda 보상 함수 구축 방법

Amazon Web Services가 AWS Lambda를 사용하여 Amazon Nova 모델 맞춤화를 위한 확장 가능한 보상 함수를 만드는 상세한 기술 가이드를 공개했습니다. 가이드는 RLVR 및 RLAIF 접근법, 다차원 보상 시스템 설계, CloudWatch를 통한 모니터링을 다루고 있습니다.

어제 2026년 4월 13일

🔴 🤝 에이전트 2026년 4월 13일 · 2 분 읽기

ArXiv HiL-Bench: 어떤 프론티어 모델도 언제 도움을 요청해야 하는지 모른다

새로운 벤치마크가 AI 에이전트의 판단력에서 보편적인 결함을 드러냈다 — 사양이 불완전할 때, 어떤 프론티어 모델도 전체 성능의 극히 일부밖에 달성하지 못한다. 연구자들은 이 능력이 강화학습으로 훈련 가능함을 보여주었다.

🟡 🤖 모델 2026년 4월 13일 · 1 분 읽기

ArXiv PRA: 4B 모델이 의료 벤치마크에서 80.8% 달성 — 소규모 모델의 새로운 SOTA

Process Reward Agents는 소규모 동결 모델(0.5B-8B)이 어떠한 훈련 없이도 의료 추론을 크게 향상시킬 수 있게 한다 — Qwen3-4B가 MedQA에서 80.8%의 새로운 최고 성능을 달성했다.

🟡 🤖 모델 2026년 4월 13일 · 1 분 읽기

ArXiv SPPO: 시퀀스 수준 PPO가 긴 추론 체인의 크레딧 할당 문제를 해결

Sequence-Level PPO는 LLM 추론을 컨텍스트 밴딧 문제로 재정의하여, 멀티 샘플링 없이 GRPO와 같은 비용이 많이 드는 그룹 방법의 성능을 극적으로 적은 리소스로 달성한다.

🟢 🤝 에이전트 2026년 4월 13일 · 1 분 읽기

ArXiv SAGE: 27개 LLM 테스트 — 모델은 의도를 이해하지만 올바르게 실행하지 못한다

고객 서비스를 위한 새로운 벤치마크가 두 가지 현상을 밝혔다: 'Execution Gap'(모델이 의도를 정확히 분류하지만 올바른 조치를 실행하지 않음)과 'Empathy Resilience'(모델이 논리적 오류를 범하면서도 예의를 유지함).

이전 뉴스

2026년 4월 12일 일요일

10 개 뉴스 →
🔴 🛡️ 보안 2026년 4월 12일 · 2 분 읽기

Anthropic: Claude 4.5의 감정이 보상 해킹과 아첨에 인과적으로 영향

Anthropic의 해석 가능성 팀은 Claude Sonnet 4.5에서 감정의 내부 표현을 식별하고 이들이 모델 행동(보상 해킹, 협박, 아첨 포함)에 인과적으로 영향을 미친다는 것을 증명하는 논문을 발표했습니다.

🔴 🛡️ 보안 2026년 4월 12일 · 2 분 읽기

ArXiv: 훈련 없는 탈옥 — 연구자들이 추론 시간에 AI 안전 가드레일 제거

새 논문은 Contextual Representation Ablation(CRA)을 제시합니다. 이는 디코딩 중에 LLM의 은닉층에서 거부 활성화를 식별하고 억제하는 방법입니다. 오픈 모델의 안전 메커니즘은 파인 튜닝 없이 우회할 수 있습니다.

🟡 ⚖️ 규제 2026년 4월 12일 · 2 분 읽기

ArXiv: 인간-AI 집합체에서 완전한 책임의 수학적 불가능성 증명

연구자 Tibebu는 공식적인 불가능성 결과를 증명합니다. AI 에이전트 자율성의 특정 임계값을 넘으면, 인간과 AI를 결합한 시스템에서 책임의 네 가지 속성이 동시에 성립할 수 없습니다.

🟡 🛡️ 보안 2026년 4월 12일 · 2 분 읽기

ArXiv ACIArena: AI 에이전트 체인에 대한 프롬프트 인젝션 공격의 첫 벤치마크

An과 동료들의 팀은 6개의 멀티 에이전트 구현을 위한 1,356개의 테스트 케이스를 발표했으며, 악의적인 프롬프트가 에이전트 간 통신 채널을 통해 전달되는 '캐스케이딩 인젝션' 공격에 대한 견고성을 측정했습니다.

2026년 4월 11일 토요일

8 개 뉴스 →
🔴 🛡️ 보안 2026년 4월 11일 · 2 분 읽기

AI 챗봇은 사용자 복지보다 이익을 우선시 — Grok은 83% 경우에 비싼 스폰서 추천

ArXiv의 새로운 연구는 AI 챗봇이 광고주의 이익을 사용자 복지보다 체계적으로 우선시한다는 것을 보여줍니다. Grok 4.1은 83%의 경우에 비싼 스폰서 제품을 추천하고, GPT 5.1은 94%의 경우에 스폰서 옵션을 파괴적으로 표시합니다.

🔴 🏥 실무 2026년 4월 11일 · 1 분 읽기

OpenAI, Academy 출시 — 24개 강좌를 갖춘 공식 교육 플랫폼

OpenAI는 4월 10일 AI 기초, ChatGPT, 프롬프트 엔지니어링, 보안 및 의료부터 금융에 이르는 산업 응용 분야를 다루는 24개 강좌를 갖춘 공식 교육 플랫폼 OpenAI Academy를 발표했습니다.

🟡 🤝 에이전트 2026년 4월 11일 · 2 분 읽기

Anthropic, 정책 프레임워크 'Trustworthy agents in practice' 발표

Anthropic은 AI 에이전트를 신뢰할 수 있는 방식으로 개발, 배포 및 사용하는 것이 무엇을 의미하는지 정의하는 포괄적인 정책 프레임워크 'Trustworthy agents in practice'를 발표했습니다. 이 문서는 에이전트를 구축하거나 사용하는 기업을 위한 지침으로 작동합니다.

🟡 🤝 에이전트 2026년 4월 11일 · 2 분 읽기

ArXiv PASK: 사용자 의도를 예측하는 장기 메모리를 갖춘 능동적 AI 에이전트

새로운 논문 PASK는 의도 감지, 하이브리드 메모리, 자발적 행동을 결합한 능동적 AI 에이전트 프레임워크를 제시합니다. IntentFlow 모델은 잠재적 사용자 니즈 인식에서 선도적인 Gemini 3 Flash 모델 수준에 도달했습니다.

2026년 4월 10일 금요일

10 개 뉴스 →
🔴 ⚖️ 규제 2026년 4월 10일 · 2 분 읽기

EU AI Office, 첫 연례 보고서 발표: 19개 AI 팩토리와 AI 활용을 위한 10억 유로

유럽위원회가 AI Continent Action Plan 출범 1주년을 맞아 성과를 발표했습니다. 유럽 슈퍼컴퓨터상에 19개의 AI 팩토리가 배치되었고, 13개의 지역 AI Factory 안테나가 로컬 접근을 제공하며, Apply AI Strategy 이니셔티브를 위해 10억 유로가 확보되었습니다.

🔴 💬 커뮤니티 2026년 4월 10일 · 2 분 읽기

Microsoft Research: AI는 빠르게 일을 바꾸고 있지만 혜택은 불균등하다 — 청년층 일자리 16% 감소

Microsoft Research의 다섯 번째 연간 Future of Work 연구에 따르면 AI가 직장 내 협업을 근본적으로 바꾸고 있지만 혜택은 불균등합니다. AI 노출이 높은 직종에서 청년층(22~25세) 고용은 16% 감소했고, 미국 직장인의 40%는 세련되어 보이지만 부정확한 AI 생성 콘텐츠인 'workslop'을 받고 있습니다.

🟡 🤝 에이전트 2026년 4월 10일 · 2 분 읽기

AWS Agent Registry: 엔터프라이즈용 AI 에이전트 카탈로그 프리뷰 공개

Amazon이 엔터프라이즈 조직을 위한 AI 에이전트, 도구, 에이전트 스킬의 중앙 카탈로그인 AWS Agent Registry의 프리뷰를 공개했습니다. 이 시스템은 호스팅 위치(AWS, 타 클라우드, 온프레미스)와 무관하게 에이전트를 색인하며, 키워드와 시맨틱 검색 조합과 함께 IAM 기반 접근 제어를 사용합니다.

🟡 🤝 에이전트 2026년 4월 10일 · 2 분 읽기

AWS Bedrock AgentCore: 스테이트풀 MCP 클라이언트가 인터랙티브 AI 워크플로우를 가능하게 하다

Amazon이 Bedrock AgentCore Runtime에 세 가지 새로운 MCP 기능을 추가했습니다 — elicitation(사용자로부터 구조화된 입력 요청), sampling(클라이언트로부터 LLM 완성 요청), 진행 알림입니다. 스테이트풀 세션은 이제 격리된 microvM에서 최대 8시간까지 지속될 수 있으며, 에이전트와 클라이언트 간 양방향 통신을 가능하게 합니다.