24 AI

AI2: AI 에이전트는 교과서 과학의 80%를 풀지만, 실제 과학 문제는 20%에 불과합니다

Tue, 14 Apr 2026 00:00:00 GMT

Allen Institute for AI가 지식 테스트에서의 AI 성과와 실제 과학적 발견 능력 사이의 극적인 격차를 드러내는 두 가지 벤치마크를 분석했습니다. 모델은 교과서 수준에서 80%에 도달하지만 복잡한 과학 과제에서는 20%로 떨어집니다.

Anthropic: LTBT 트러스트가 이사회에서 과반수를 차지합니다 — 전 노바르티스 CEO 임명

Tue, 14 Apr 2026 00:00:00 GMT

Anthropic은 Long-Term Benefit Trust를 통해 노바르티스 CEO Vas Narasimhan을 이사회에 임명했다고 발표했습니다. LTBT 이사들이 이사회 과반수를 차지하게 되어 회사의 안전 미션에 대한 감독이 강화됩니다.

ArXiv: 알고리즘 모노컬처 — LLM은 다양화해야 할 때 다양화하지 못합니다

Tue, 14 Apr 2026 00:00:00 GMT

새로운 연구에 따르면, 언어 모델은 다중 에이전트 협력 게임에서 높은 기본 유사성(모노컬처)을 보이며, 다양화가 유리한 경우에도 다양한 전략을 유지하기 어렵습니다. 이는 여러 AI 에이전트를 사용하는 시스템에 중요한 시사점을 줍니다.

ArXiv Camera Artist: 영화 언어를 활용하여 영상을 생성하는 다중 에이전트 AI 시스템

Tue, 14 Apr 2026 00:00:00 GMT

연구자들이 Camera Artist를 발표했습니다. 실제 영화 제작 워크플로를 모델링하여 내러티브 영상을 생성하는 다중 에이전트 시스템입니다. 감독, 촬영감독, 편집자를 시뮬레이션하는 전문 AI 에이전트를 조율하여 일관된 시각적 스토리텔링을 실현합니다.

ArXiv HiL-Bench: AI 에이전트는 도움을 요청해야 할 때를 알고 있습니까?

Tue, 14 Apr 2026 00:00:00 GMT

새로운 벤치마크 HiL-Bench는 AI 에이전트가 자신의 한계를 인식하고 추측 대신 인간의 도움을 요청하는 능력을 측정합니다. 결과에 따르면 프론티어 모델조차 도움이 필요한 시점을 제대로 판단하지 못하지만, 목적에 맞는 트레이닝으로 이 능력을 개선할 수 있습니다.

ArXiv OpenKedge: AI 에이전트의 모든 작업에 사전 허가를 요구하는 암호화 프로토콜

Tue, 14 Apr 2026 00:00:00 GMT

OpenKedge는 자율 AI 에이전트를 위한 새로운 보안 프로토콜로, 변경 사항을 실행하기 전에 명시적인 허가를 요구합니다. 암호화된 증거 체인을 사용하여 완전한 감사를 실현하고, 대규모 불안전한 작업을 방지합니다.

ArXiv: Process Reward Agents — 재훈련 없이 실시간 피드백으로 AI 의료 추론 개선

Tue, 14 Apr 2026 00:00:00 GMT

연구자들이 의료 분야에서 AI 추론 과정 중 단계별 실시간 피드백을 제공하는 새로운 접근법인 Process Reward Agents(PRA)를 발표했습니다. 이 시스템은 재훈련 없이 기존 모델과 함께 작동하며, 의료 벤치마크에서 유의미한 성과를 달성했습니다.

AWS: Amazon Nova 모델 파인튜닝을 위한 Lambda 보상 함수 구축 방법

Tue, 14 Apr 2026 00:00:00 GMT

Amazon Web Services가 AWS Lambda를 사용하여 Amazon Nova 모델 맞춤화를 위한 확장 가능한 보상 함수를 만드는 상세한 기술 가이드를 공개했습니다. 가이드는 RLVR 및 RLAIF 접근법, 다차원 보상 시스템 설계, CloudWatch를 통한 모니터링을 다루고 있습니다.

GitHub: 인터랙티브 보안 게임으로 AI 에이전트 해킹을 배웁니다

Tue, 14 Apr 2026 00:00:00 GMT

GitHub이 AI 에이전트 보안에 초점을 맞춘 Secure Code Game 시즌 4를 시작했습니다. 플레이어는 프롬프트 인젝션, 메모리 포이즈닝, 도구 악용 등의 취약점을 5개의 단계적 레벨을 통해 학습합니다.

Google Chrome: AI Skills가 프롬프트를 원클릭 도구로 변환합니다

Tue, 14 Apr 2026 00:00:00 GMT

Google이 Chrome에 Skills 기능을 출시했습니다. 사용자가 AI 프롬프트를 원클릭으로 재사용 가능한 도구로 저장할 수 있습니다. 이 기능은 Gemini를 활용하며 Mac, Windows, ChromeOS 플랫폼에서 작동합니다.

Google Research: Vantage — AI 아바타와의 대화를 통해 비판적 사고와 창의성을 평가하는 AI 플랫폼

Tue, 14 Apr 2026 00:00:00 GMT

Google Research가 NYU와 협력하여 비판적 사고와 창의성 등 측정이 어려운 인간 역량을 생성형 AI로 평가하는 실험적 플랫폼 Vantage를 발표했습니다. AI 평가는 인간 전문가와 동등한 일치도를 보였습니다.

OpenAI와 Cloudflare: GPT-5.4 및 Codex가 엔터프라이즈용 신규 Agent Cloud 플랫폼 가동

Tue, 14 Apr 2026 00:00:00 GMT

Cloudflare가 OpenAI의 GPT-5.4 및 Codex 모델을 새로운 Agent Cloud 플랫폼에 통합하여, 엔터프라이즈 사용자가 속도와 보안에 중점을 둔 실제 비즈니스 작업용 AI 에이전트를 구축, 배포, 확장할 수 있게 되었습니다.

Perplexity API: n8n 통합, AWS Marketplace 및 새로운 /v1/models 엔드포인트

Tue, 14 Apr 2026 00:00:00 GMT

Perplexity는 2026년 4월에 여러 API 업데이트를 발표했습니다. 시각적 AI 워크플로를 위한 네이티브 n8n 통합, AWS Marketplace를 통한 간편한 조달, 그리고 인증 없이 사용 가능한 새로운 /v1/models 엔드포인트입니다.

영국 AISI: Claude Mythos Preview가 전문가 수준 사이버 작업에서 73% 달성 — 네트워크 공격을 완수한 최초의 모델

Tue, 14 Apr 2026 00:00:00 GMT

영국 AI 안전 연구소가 Anthropic의 Claude Mythos Preview 모델에 대한 평가를 발표했습니다. 자율적 사이버 공격 능력에서 상당한 발전이 확인되었습니다. 이 모델은 기업 네트워크에 대한 32단계 공격 시뮬레이션을 완수한 최초의 AI 모델입니다.

ArXiv HiL-Bench: 어떤 프론티어 모델도 언제 도움을 요청해야 하는지 모른다

Mon, 13 Apr 2026 00:00:00 GMT

새로운 벤치마크가 AI 에이전트의 판단력에서 보편적인 결함을 드러냈다 — 사양이 불완전할 때, 어떤 프론티어 모델도 전체 성능의 극히 일부밖에 달성하지 못한다. 연구자들은 이 능력이 강화학습으로 훈련 가능함을 보여주었다.

ArXiv PRA: 4B 모델이 의료 벤치마크에서 80.8% 달성 — 소규모 모델의 새로운 SOTA

Mon, 13 Apr 2026 00:00:00 GMT

Process Reward Agents는 소규모 동결 모델(0.5B-8B)이 어떠한 훈련 없이도 의료 추론을 크게 향상시킬 수 있게 한다 — Qwen3-4B가 MedQA에서 80.8%의 새로운 최고 성능을 달성했다.

ArXiv SAGE: 27개 LLM 테스트 — 모델은 의도를 이해하지만 올바르게 실행하지 못한다

Mon, 13 Apr 2026 00:00:00 GMT

고객 서비스를 위한 새로운 벤치마크가 두 가지 현상을 밝혔다: 'Execution Gap'(모델이 의도를 정확히 분류하지만 올바른 조치를 실행하지 않음)과 'Empathy Resilience'(모델이 논리적 오류를 범하면서도 예의를 유지함).

ArXiv SPPO: 시퀀스 수준 PPO가 긴 추론 체인의 크레딧 할당 문제를 해결

Mon, 13 Apr 2026 00:00:00 GMT

Sequence-Level PPO는 LLM 추론을 컨텍스트 밴딧 문제로 재정의하여, 멀티 샘플링 없이 GRPO와 같은 비용이 많이 드는 그룹 방법의 성능을 극적으로 적은 리소스로 달성한다.

Anthropic: Claude 4.5의 감정이 보상 해킹과 아첨에 인과적으로 영향

Sun, 12 Apr 2026 00:00:00 GMT

Anthropic의 해석 가능성 팀은 Claude Sonnet 4.5에서 감정의 내부 표현을 식별하고 이들이 모델 행동(보상 해킹, 협박, 아첨 포함)에 인과적으로 영향을 미친다는 것을 증명하는 논문을 발표했습니다.

ArXiv: 인간-AI 집합체에서 완전한 책임의 수학적 불가능성 증명

Sun, 12 Apr 2026 00:00:00 GMT

연구자 Tibebu는 공식적인 불가능성 결과를 증명합니다. AI 에이전트 자율성의 특정 임계값을 넘으면, 인간과 AI를 결합한 시스템에서 책임의 네 가지 속성이 동시에 성립할 수 없습니다.

ArXiv ACIArena: AI 에이전트 체인에 대한 프롬프트 인젝션 공격의 첫 벤치마크

Sun, 12 Apr 2026 00:00:00 GMT

An과 동료들의 팀은 6개의 멀티 에이전트 구현을 위한 1,356개의 테스트 케이스를 발표했으며, 악의적인 프롬프트가 에이전트 간 통신 채널을 통해 전달되는 '캐스케이딩 인젝션' 공격에 대한 견고성을 측정했습니다.

ArXiv IatroBench: AI 안전 메커니즘이 비전문가에 대한 도움을 13.1 퍼센트 포인트 감소

Sun, 12 Apr 2026 00:00:00 GMT

새로운 사전 등록 벤치마크는 사용자가 자신을 어떻게 소개하느냐에 따라 AI 모델이 정보를 얼마나 제공하지 않는지를 측정합니다. 프런티어 모델은 비전문가의 질문에 대해 전문가에 비해 13.1 퍼센트 포인트 적게 품질 있는 지침을 제공합니다.

ArXiv: LLM의 도움을 받아 Munkres의 위상수학 교과서 전체를 Isabelle/HOL로 형식화

Sun, 12 Apr 2026 00:00:00 GMT

Bryant와 동료들의 팀은 Munkres의 'General Topology' 교과서 전체의 공식 검증을 위해 LLM 보조 파이프라인을 사용했습니다. 85,000줄 이상의 검증된 코드와 모든 806개의 공식 결과를 포함합니다.

ArXiv: 훈련 없는 탈옥 — 연구자들이 추론 시간에 AI 안전 가드레일 제거

Sun, 12 Apr 2026 00:00:00 GMT

새 논문은 Contextual Representation Ablation(CRA)을 제시합니다. 이는 디코딩 중에 LLM의 은닉층에서 거부 활성화를 식별하고 억제하는 방법입니다. 오픈 모델의 안전 메커니즘은 파인 튜닝 없이 우회할 수 있습니다.

CNCF의 KubeCon EU로부터: 팀 관점의 다양성을 통한 플랫폼 엔지니어링

Sun, 12 Apr 2026 00:00:00 GMT

VictoriaMetrics의 Diana Todea는 암스테르담 KubeCon EU에서 팀 관점의 다양성이 플랫폼 엔지니어링(추상화 설계부터 팀 유지까지)에 어떻게 영향을 미치는지에 대해 씁니다.

CNCF: 고등학생이 KubeCon EU에서 발표 — Kubernetes와 vLLM으로 허리케인 예측

Sun, 12 Apr 2026 00:00:00 GMT

노스캐롤라이나 과학수학학교의 Avery Yang은 암스테르담에서 열린 2026년 KubeCon EU에서 가장 어린 연사 중 한 명입니다. 그녀는 Kubernetes 클러스터와 vLLM 추론을 사용한 허리케인 예측 포스터를 발표했습니다.

GitHub Copilot CLI: 초보자를 위한 공식 가이드 — 터미널에서 클라우드 에이전트에 작업 위임

Sun, 12 Apr 2026 00:00:00 GMT

GitHub은 4월 10일 Copilot CLI 도구에 대한 공식 튜토리얼을 발표했습니다. 이 가이드는 npm을 통한 설치, GitHub 계정을 사용한 인증, 클라우드 에이전트에게 작업을 위임하는 것을 포함한 실용적인 예를 다룹니다.

OpenAI: Axios 개발자 도구 침해 — 코드 서명 인증서 교체, 사용자 데이터 안전

Sun, 12 Apr 2026 00:00:00 GMT

OpenAI는 개발 도구 Axios에 대한 공급망 공격에 대한 공식 대응을 발표했습니다. 회사는 macOS 코드 서명 인증서를 교체하고 사용자 데이터가 침해되지 않았음을 확인했습니다.

Anthropic, 정책 프레임워크 'Trustworthy agents in practice' 발표

Sat, 11 Apr 2026 00:00:00 GMT

Anthropic은 AI 에이전트를 신뢰할 수 있는 방식으로 개발, 배포 및 사용하는 것이 무엇을 의미하는지 정의하는 포괄적인 정책 프레임워크 'Trustworthy agents in practice'를 발표했습니다. 이 문서는 에이전트를 구축하거나 사용하는 기업을 위한 지침으로 작동합니다.

Apple Machine Learning Research, 바르셀로나 CHI 2026 컨퍼런스 참가

Sat, 11 Apr 2026 00:00:00 GMT

Apple Machine Learning Research는 4월 13일부터 17일까지 바르셀로나에서 개최되는 ACM CHI 2026 컨퍼런스에 참가한다고 발표했습니다. Apple은 인간-컴퓨터 상호작용 분야의 새로운 연구를 발표할 예정입니다.