ArXiv: Process Reward Agents — 재훈련 없이 실시간 피드백으로 AI 의료 추론 개선
연구자들이 의료 분야에서 AI 추론 과정 중 단계별 실시간 피드백을 제공하는 새로운 접근법인 Process Reward Agents(PRA)를 발표했습니다. 이 시스템은 재훈련 없이 기존 모델과 함께 작동하며, 의료 벤치마크에서 유의미한 성과를 달성했습니다.
14 개 뉴스 — 🔴 2 중요 , 🟡 9 주목 , 🟢 3 흥미
Cloudflare가 OpenAI의 GPT-5.4 및 Codex 모델을 새로운 Agent Cloud 플랫폼에 통합하여, 엔터프라이즈 사용자가 속도와 보안에 중점을 둔 실제 비즈니스 작업용 AI 에이전트를 구축, 배포, 확장할 수 있게 되었습니다.
Allen Institute for AI가 지식 테스트에서의 AI 성과와 실제 과학적 발견 능력 사이의 극적인 격차를 드러내는 두 가지 벤치마크를 분석했습니다. 모델은 교과서 수준에서 80%에 도달하지만 복잡한 과학 과제에서는 20%로 떨어집니다.
새로운 벤치마크 HiL-Bench는 AI 에이전트가 자신의 한계를 인식하고 추측 대신 인간의 도움을 요청하는 능력을 측정합니다. 결과에 따르면 프론티어 모델조차 도움이 필요한 시점을 제대로 판단하지 못하지만, 목적에 맞는 트레이닝으로 이 능력을 개선할 수 있습니다.
Google이 Chrome에 Skills 기능을 출시했습니다. 사용자가 AI 프롬프트를 원클릭으로 재사용 가능한 도구로 저장할 수 있습니다. 이 기능은 Gemini를 활용하며 Mac, Windows, ChromeOS 플랫폼에서 작동합니다.
Google Research가 NYU와 협력하여 비판적 사고와 창의성 등 측정이 어려운 인간 역량을 생성형 AI로 평가하는 실험적 플랫폼 Vantage를 발표했습니다. AI 평가는 인간 전문가와 동등한 일치도를 보였습니다.
Amazon Web Services가 AWS Lambda를 사용하여 Amazon Nova 모델 맞춤화를 위한 확장 가능한 보상 함수를 만드는 상세한 기술 가이드를 공개했습니다. 가이드는 RLVR 및 RLAIF 접근법, 다차원 보상 시스템 설계, CloudWatch를 통한 모니터링을 다루고 있습니다.
Perplexity는 2026년 4월에 여러 API 업데이트를 발표했습니다. 시각적 AI 워크플로를 위한 네이티브 n8n 통합, AWS Marketplace를 통한 간편한 조달, 그리고 인증 없이 사용 가능한 새로운 /v1/models 엔드포인트입니다.
영국 AI 안전 연구소가 Anthropic의 Claude Mythos Preview 모델에 대한 평가를 발표했습니다. 자율적 사이버 공격 능력에서 상당한 발전이 확인되었습니다. 이 모델은 기업 네트워크에 대한 32단계 공격 시뮬레이션을 완수한 최초의 AI 모델입니다.
새로운 연구에 따르면, 언어 모델은 다중 에이전트 협력 게임에서 높은 기본 유사성(모노컬처)을 보이며, 다양화가 유리한 경우에도 다양한 전략을 유지하기 어렵습니다. 이는 여러 AI 에이전트를 사용하는 시스템에 중요한 시사점을 줍니다.
OpenKedge는 자율 AI 에이전트를 위한 새로운 보안 프로토콜로, 변경 사항을 실행하기 전에 명시적인 허가를 요구합니다. 암호화된 증거 체인을 사용하여 완전한 감사를 실현하고, 대규모 불안전한 작업을 방지합니다.
GitHub이 AI 에이전트 보안에 초점을 맞춘 Secure Code Game 시즌 4를 시작했습니다. 플레이어는 프롬프트 인젝션, 메모리 포이즈닝, 도구 악용 등의 취약점을 5개의 단계적 레벨을 통해 학습합니다.