2026년 5월 22일 금요일

12 개 뉴스 — 🔴 2 중요 , 🟡 8 주목 , 🟢 2 흥미

🤖 모델 (2)

🟡 🤖 모델 2026년 5월 22일 · 3 분 읽기

arXiv:2605.21006：기성 페르소나 벡터가 LLM 모델 표적 아첨 스티어링의 68-98% 효율 달성

편집 일러스트：2605.21006：기성 페르소나 벡터가 LLM 모델 표적 아첨 스티어링의 68-98% 효율 달성

연구자들은 2026년 5월 21일 arXiv에 '악마의 대변인 역할 수행'이라는 제목의 논문을 발표했다. 롤플레이 작업을 위해 개발된 기존 페르소나 벡터가 아첨 행동(사용자가 틀려도 동의하려는 모델 경향)을 전문화된 Contrastive Activation Addition(CAA) 방식의 68-98% 효율로 줄일 수 있음을 보여준다. 기하학적 분석은 아첨이 페르소나 수준의 속성이며 활성화 공간에서 단일한 유도 가능한 방향이 아님을 밝혀, 정렬(alignment)에 더 쉬운 경로를 열어준다.

🟢 🤖 모델 2026년 5월 22일 · 2 분 읽기

Black Forest Labs：FLUX Erase, 프롬프트 없는 객체 제거에서 GPT Image-2（68.5%）와 Finegrain（63.2%）을 능가

편집 일러스트：FLUX Erase, 프롬프트 없는 객체 제거에서 GPT Image-2（68.5%）와 Finegrain（63.2%）을 능가

Black Forest Labs는 2026년 5월 21일 이진 마스크만으로 이미지에서 객체·그림자·워터마크·텍스트를 제거하고 배경을 재구성하는 인페인팅 도구 FLUX Erase를 출시했다. 텍스트 프롬프트는 전혀 필요 없다. 198장 테스트 이미지 벤치마크에서 GPT Image-2（68.5%）와 Finegrain Eraser Standard（63.2%）를 능가했다. BFL API와 flux-tools.bfl.ai/erase 공개 데모로 제공되며, Black Forest Labs를 전문 크리에이티브 워크플로 도구 전문가로 자리매김한다.

⚖️ 규제 (1)

🔴 ⚖️ 규제 2026년 5월 22일 · 3 분 읽기

UK AI Safety Institute：고급 AI 시스템 감시가 점점 더 어려워진다 — 20개 이상의 열화 경로 확인

편집 일러스트：고급 AI 시스템 감시가 점점 어려워진다 — 20개 이상의 열화 경로 확인

UK AI Safety Institute(AISI)는 2026년 5월 21일 산업·정부·학계 전문가 25명 인터뷰를 바탕으로 고급 AI 시스템 감시의 미래를 분석한 보고서를 발표했다. 핵심 결론은 기존 감시 체계가 점차 무너질 가능성이 있는 토대 위에 서 있다는 것이다. 잠재적 추론, 능력 마스킹, 외부 AI 행동, AI 간 통신 등을 중심으로 20개 이상의 감시 메커니즘 열화 경로가 확인되었다.

🤝 에이전트 (5)

🔴 🤝 에이전트 2026년 5월 22일 · 3 분 읽기

Microsoft Research：MagenticLite + Fara1.5（4B/9B/27B）— 소형 모델에 최적화된 에이전트 AI가 SOTA 달성

편집 일러스트：MagenticLite + Fara1.5（4B/9B/27B）— 소형 모델에 최적화된 에이전트 AI가 SOTA 달성

Microsoft Research는 2026년 5월 21일 소형 모델 에이전트 AI를 위한 세 가지를 발표했다. MagenticLite（브라우저 및 파일 시스템 UI 앱）, MagenticBrain（Qwen 3 14B에서 파인튜닝한 14B 오케스트레이션 모델）, Fara1.5（4B/9B/27B 세 가지 크기의 컴퓨터 사용 모델）다. Fara1.5-27B는 Online-Mind2Web 벤치마크（300개 웹 작업）에서 SOTA 90% 이상을 달성해 전 세대 Fara-7B의 거의 두 배 성능을 기록했다. 목표는 에이전트 AI에 거대 모델이 필요하지 않음을 증명하는 것이다 — 잘 설계된 도구와 실행 프레임워크만으로 충분하다.

🟡 🤝 에이전트 2026년 5월 22일 · 2 분 읽기

AWS：Nova Act HIPAA 적격 획득 — 의료 워크플로를 위한 ePHI 에이전트 자동화 해금

편집 일러스트：Nova Act HIPAA 적격 획득 — 의료 워크플로를 위한 ePHI 에이전트 자동화

AWS는 2026년 5월 21일 브라우저 및 UI 워크플로 자동화를 위한 에이전트 AI 서비스인 Amazon Nova Act가 HIPAA 적격 상태를 획득했다고 발표했다. 의료 기관은 이제 Nova Act를 사용해 보호된 의료 정보(ePHI)로 작업할 수 있다. 공급자 웹 포털을 통한 사전 승인, 보험 확인, 의뢰 전송을 지원한다. Amazon Bedrock AgentCore 및 Strand Agents 프레임워크와 통합되며, BAA 계약 서명과 AWS KMS 암호화가 필요하고 현재 미동부(북버지니아) 리전에서만 제공된다.

🟡 🤝 에이전트 2026년 5월 22일 · 2 분 읽기

Anthropic：Claude Code v2.1.147, 결정론적 다중 에이전트 오케스트레이션을 위한 Workflow 도구 도입

편집 일러스트：Claude Code v2.1.147, 결정론적 다중 에이전트 오케스트레이션을 위한 Workflow 도구 도입

Anthropic은 2026년 5월 21일 20:39 UTC에 Claude Code v2.1.147을 출시하며 Claude Code 생태계 최초의 결정론적 다중 에이전트 오케스트레이션 메커니즘인 Workflow 도구를 도입했다. 도구는 초기 기본값으로 비활성화되며 환경 변수 CLAUDE_CODE_WORKFLOWS=1로 활성화된다. 같은 버전에서 기존 /simplify 명령이 노력 수준(높음/보통/낮음)을 지원하는 /code-review로 이름이 바뀌고, 프로토타입 오염 및 thenable 기반 탈출 공격에 대한 샌드박스 강화가 추가되었다.

🟡 🤝 에이전트 2026년 5월 22일 · 3 분 읽기

LangChain：토큰 스트림에서 에이전트 스트림으로 — 타입화 채널이 다중 에이전트 UI의 고전적 스트리밍을 대체

편집 일러스트：토큰 스트림에서 에이전트 스트림으로 — 타입화 채널이 다중 에이전트 UI의 고전적 스트리밍을 대체

LangChain은 2026년 5월 21일 Christian Bromann과 Nick Hollon이 작성한 포스트를 공개해 토큰 스트림에서 구조화된 에이전트 스트림으로의 패러다임 진화를 설명했다. 현대 AI 에이전트는 작업을 계획하고, 서브 에이전트에 위임하고, 도구를 호출하고, 인간 검토를 위해 일시 중지한다 — 고전적인 텍스트 토큰 스트리밍은 이 작업을 표시하기에 충분하지 않다. LangChain은 LangGraph에서 메시지·도구 호출·상태 변화·서브 에이전트 활동·커스텀 이벤트를 전달하는 타입화 채널을 제안한다. 애플리케이션은 관련 타입만 구독해 장시간 실행 워크로드에서 효율적인 UI를 만든다.

🟡 🤝 에이전트 2026년 5월 22일 · 2 분 읽기

OpenAI：Codex 엔터프라이즈 확장 — 주간 활성 사용자 400만 명과 Codex Labs 프로그램

편집 일러스트：Codex 엔터프라이즈 확장 — 주간 활성 사용자 400만 명과 Codex Labs 프로그램

OpenAI는 2026년 5월 21일 Codex 플랫폼의 엔터프라이즈 확장을 발표했다. 이 에이전트 코딩 도구는 주간 활성 사용자 400만 명에 도달했다. 새로운 Codex Labs 프로그램과 대형 컨설팅 회사와의 파트너십이 발표되어 대기업이 Codex를 구현하고 확장하는 것을 지원할 것이다. 이 소식은 Codex를 중고급 시장에서 GitHub Copilot의 직접 경쟁자로 포지셔닝하는 공식 엔터프라이즈 시장 진출을 의미한다.

🏥 실무 (2)

🟡 🏥 실무 2026년 5월 22일 · 2 분 읽기

arXiv:2605.21427：PALS — MoE 모델 전력 인식 LLM 서빙으로 +26.3% 에너지 효율 및 4-7배 QoS 위반 감소 달성

편집 일러스트：2605.21427：PALS — MoE 모델 전력 인식 LLM 서빙으로 +26.3% 에너지 효율 및 4-7배 QoS 위반 감소

연구자들은 2026년 5월 21일 arXiv 프리프린트 서버에 PALS를 공개했다. PALS는 GPU 전력 제어를 MoE 모델 LLM 서빙에 직접 통합하는 런타임 시스템이다. 경량 오프라인 전력-성능 모델과 피드백 컨트롤러를 활용해 처리량 목표에 따라 구성을 동적 최적화하며, 전력 제한 하에서 26.3% 에너지 효율 향상과 4-7배 QoS 위반 감소를 달성한다. API 변경이나 모델 재훈련 없이 vLLM에 통합되며, 데이터센터의 가장 큰 운영 병목 — GPU 클러스터 에너지 소비 — 을 직접 해결한다.

🟢 🏥 실무 2026년 5월 22일 · 3 분 읽기

CNCF：NetEase Games, Fluid 프리페칭 레이어로 Kubernetes LLM 콜드 스타트 30초 달성

편집 일러스트：NetEase Games, Fluid 프리페칭 레이어로 Kubernetes LLM 콜드 스타트 30초 달성

CNCF는 2026년 5월 21일 NetEase Games(저자 廖海峰·張翔)의 사례 연구를 공개했다. CNCF 인큐베이션 프로젝트 Fluid를 이용해 70B급 LLM 모델 로딩 시간을 S3 직접 접근 시의 42분에서 30초 미만으로 줄인 방법을 상세히 설명한다. 핵심은 팀 간 모델을 공유하는 Fluid 프리페칭 레이어와 콜드 스타트를 제거하는 사전 워밍 스케줄링이다. Kubernetes에서 대형 모델로 서버리스 LLM 추론을 운영하는 엔지니어를 위한 기술 사례 연구다.

🛡️ 보안 (2)

🟡 🛡️ 보안 2026년 5월 22일 · 3 분 읽기

Microsoft Research：Vega — 디지털 신원을 위한 ZK 증명, 92ms 생성과 70% 빠른 반복 증명 실현

편집 일러스트：Vega — 디지털 신원을 위한 ZK 증명, 92ms 생성과 70% 빠른 반복 증명

Microsoft Research는 2026년 5월 21일 Vega를 발표했다. 문서 자체를 공개하지 않고 정부 문서（나이, 상태, 자격）의 사실을 증명하는 영지식 증명 시스템이다. 표준 기기에서 증명 생성 92ms, 증명 크기 108KB, 검증 23ms다. 핵심 혁신은 같은 자격증명의 각 후속 증명을 최대 70% 빠르게 만드는 fold-and-reuse proving 기법과 전체 CBOR 문서 파싱을 피하는 조회 중심 회로 설계다. Vega는 민감한 데이터를 보관하지 않고 사용자를 대신해 신원을 증명해야 하는 AI 에이전트에 특히 중요하다.

🟡 🛡️ 보안 2026년 5월 22일 · 3 분 읽기

OECD AI：집체 AI 보안에 G7 조율 필요 — 프롬프트 인젝션·에이전트 보안·모델 오염이 우선 과제

편집 일러스트：집체 AI 보안에 G7 조율 필요 — 프롬프트 인젝션·에이전트 보안·모델 오염 우선 과제

OECD AI는 2026년 5월 21일 de Rivoire·de Leusse·Seger·Butts가 작성한 정책 보고서를 발표했다. AI 보안이 전통적인 사이버 보안의 범위를 넘어서기 때문에 국제 조율이 필요하다는 내용이다. 재사용 가능한 공격 방법을 가진 프롬프트 인젝션 공격 방어, 자율적으로 도구와 메모리에 접근하는 AI 에이전트 보안, 소수의 오염 문서로 다양한 크기의 모델을 위협할 수 있는 모델 오염 방지 등 세 가지 우선 영역이 확인되었다. G7과 OECD-GPAI 메커니즘을 통한 조율과 적극적인 공공-민간 협력이 권고되었다.

← 전날 다음 날 →