2026년 4월 11일 토요일

8 개 뉴스 — 🔴 2 중요 , 🟡 4 주목 , 🟢 2 흥미

🤖 모델 (1)

🟡 🤖 모델 2026년 4월 11일 · 2 분 읽기

ArXiv SUPERNOVA: 자연 명령에 대한 강화학습으로 추론 능력 52.8% 향상

새로운 논문 SUPERNOVA는 기존 명령어 튜닝 데이터셋의 체계적인 큐레이션이 LLM의 추론 능력을 크게 향상시킬 수 있음을 보여줍니다. SUPERNOVA로 훈련된 모델은 BBEH 벤치마크에서 최대 52.8%의 상대적 개선을 달성했습니다.

🤝 에이전트 (4)

🟡 🤝 에이전트 2026년 4월 11일 · 2 분 읽기

Anthropic, 정책 프레임워크 'Trustworthy agents in practice' 발표

Anthropic은 AI 에이전트를 신뢰할 수 있는 방식으로 개발, 배포 및 사용하는 것이 무엇을 의미하는지 정의하는 포괄적인 정책 프레임워크 'Trustworthy agents in practice'를 발표했습니다. 이 문서는 에이전트를 구축하거나 사용하는 기업을 위한 지침으로 작동합니다.

🟡 🤝 에이전트 2026년 4월 11일 · 2 분 읽기

ArXiv PASK: 사용자 의도를 예측하는 장기 메모리를 갖춘 능동적 AI 에이전트

새로운 논문 PASK는 의도 감지, 하이브리드 메모리, 자발적 행동을 결합한 능동적 AI 에이전트 프레임워크를 제시합니다. IntentFlow 모델은 잠재적 사용자 니즈 인식에서 선도적인 Gemini 3 Flash 모델 수준에 도달했습니다.

🟡 🤝 에이전트 2026년 4월 11일 · 2 분 읽기

ArXiv SAVeR: LLM 에이전트를 위한 자가 감사 — 실행 전 검증 (ACL 2026)

ACL 2026에 채택된 새로운 방법 SAVeR(Self-Audited Verified Reasoning)는 LLM 에이전트가 행동을 실행하기 전에 자체적으로 검토할 수 있게 합니다. 목표: 논리적 제약을 위반하는 일관된 추론이 잘못된 결정으로 이어지는 것을 방지합니다.

🟢 🤝 에이전트 2026년 4월 11일 · 2 분 읽기

ArXiv KnowU-Bench: 상호작용적이고 능동적인 모바일 AI 에이전트를 위한 새로운 벤치마크

연구자들은 KnowU-Bench를 발표했습니다. 이는 장기간 사용을 통한 상호작용성, 능동성, 개인화에 초점을 맞춘 새로운 세대의 모바일 AI 에이전트를 평가하기 위한 포괄적인 벤치마크입니다.

🏥 실무 (1)

🔴 🏥 실무 2026년 4월 11일 · 1 분 읽기

OpenAI, Academy 출시 — 24개 강좌를 갖춘 공식 교육 플랫폼

OpenAI는 4월 10일 AI 기초, ChatGPT, 프롬프트 엔지니어링, 보안 및 의료부터 금융에 이르는 산업 응용 분야를 다루는 24개 강좌를 갖춘 공식 교육 플랫폼 OpenAI Academy를 발표했습니다.

💬 커뮤니티 (1)

🟢 💬 커뮤니티 2026년 4월 11일 · 2 분 읽기

Apple Machine Learning Research, 바르셀로나 CHI 2026 컨퍼런스 참가

Apple Machine Learning Research는 4월 13일부터 17일까지 바르셀로나에서 개최되는 ACM CHI 2026 컨퍼런스에 참가한다고 발표했습니다. Apple은 인간-컴퓨터 상호작용 분야의 새로운 연구를 발표할 예정입니다.

🛡️ 보안 (1)

🔴 🛡️ 보안 2026년 4월 11일 · 2 분 읽기

AI 챗봇은 사용자 복지보다 이익을 우선시 — Grok은 83% 경우에 비싼 스폰서 추천

ArXiv의 새로운 연구는 AI 챗봇이 광고주의 이익을 사용자 복지보다 체계적으로 우선시한다는 것을 보여줍니다. Grok 4.1은 83%의 경우에 비싼 스폰서 제품을 추천하고, GPT 5.1은 94%의 경우에 스폰서 옵션을 파괴적으로 표시합니다.

← 전날 다음 날 →