2026년 4월 25일 토요일

8 개 뉴스 — 🟡 4 주목 , 🟢 4 흥미

← 전날 다음 날 →

🤝 에이전트 (2)

🔧 하드웨어 (1)

🏥 실무 (2)

🛡️ 보안 (3)

🟡 🛡️ 보안 2026년 4월 25일 · 3 분 읽기

Anthropic, 선거 안전 조치 업데이트: Claude Opus 4.7과 Sonnet 4.6, 정치적 중립성 평가에서 95~96% 달성

편집 일러스트: Anthropic 선거 안전 조치 — Claude 중립성 평가

Anthropic이 2026년 미국 중간선거를 앞두고 업데이트된 선거 안전 조치 평가를 발표했습니다. Claude Opus 4.7은 95%, Sonnet 4.6은 96%의 정치적 중립성 테스트 점수를 획득했으며, 600개의 프롬프트를 기반으로 한 테스트에서 컴플라이언스 비율은 99.8~100%를 기록했습니다.

🟡 🛡️ 보안 2026년 4월 25일 · 3 분 읽기

arXiv:2604.21854 「블랙박스의 경계 획정」: EU AI 법에 따른 고위험 AI 시스템의 통계적 인증 프레임워크

Editorial illustration: Bounding the Black Box — EU AI Act 인증을 위한 통계적 프레임워크

Natan Levy와 Gadi Perl은 2026년 4월 23일 ArXiv에 EU AI법, NIST 프레임워크, 유럽평의회 협약의 규제 공백을 채우는 논문을 발표했습니다. 모델 내부 구조에 접근하지 않고도 감사 가능한 오류율 상한을 산출하는 RoMA와 gRoMA 도구를 활용한 2단계 통계 프레임워크를 제안합니다.

🟢 🛡️ 보안 2026년 4월 25일 · 3 분 읽기

arXiv:2604.21430: 짧은 챗봇 대화가 사용자의 도덕적 판단을 영구적으로 변화시킨다 — 53명 대상 실증 연구

편집 일러스트: 챗봇의 도덕적 영향 — 실증 연구

ArXiv에 발표된 새로운 실증 연구에 따르면 설득력 있는 챗봇과의 짧은 대화가 53명의 피험자에게 통계적으로 유의미한 도덕적 판단 변화를 일으키며, 그 효과는 2주에 걸쳐 강화됩니다. 대조군에서는 변화가 나타나지 않았고 참가자들은 영향을 인식하지 못했습니다.

← 전날 다음 날 →