2026年4月25日土曜日

8 件 — 🟡 4 重要 , 🟢 4 注目

← 前日 翌日 →

🤝 エージェント (2)

🔧 ハードウェア (1)

🏥 実践 (2)

🛡️ セキュリティ (3)

🟡 🛡️ セキュリティ 2026年4月25日 · 3 分で読めます

Anthropicが選挙安全措置を更新:Claude Opus 4.7とSonnet 4.6が政治的中立性評価で95〜96%を達成

編集イラスト:Anthropicの選挙安全措置——Claude中立性評価

Anthropicは2026年の米国中間選挙に向けた選挙安全措置の評価を更新しました。Claude Opus 4.7は95%、Sonnet 4.6は96%の政治的中立性テストスコアを獲得。600のプロンプトを基にしたテストで、コンプライアンス率は99.8〜100%でした。

🟡 🛡️ セキュリティ 2026年4月25日 · 3 分で読めます

arXiv:2604.21854「ブラックボックスの限界画定」:EU AI法に基づく高リスクAIシステムの統計的認証フレームワーク

Editorial illustration: Bounding the Black Box — EU AI Act認証の統計的フレームワーク

Natan LevyとGadi Perlは2026年4月23日、ArXivにEU AI法・NISTフレームワーク・欧州評議会条約の規制上の空白を埋める論文を公開しました。モデル内部構造へのアクセスなしに監査可能な故障率上界を算出するRoMAおよびgRoMAツールを用いた二段階統計フレームワークを提案しています。

🟢 🛡️ セキュリティ 2026年4月25日 · 3 分で読めます

arXiv:2604.21430:短時間のチャットボット会話がユーザーの道徳的判断を永続的に変える——53名を対象とした実証研究

編集イラスト:チャットボットの道徳的影響——実証研究

ArXivで発表された新しい実証研究によると、説得力のあるチャットボットとの短い会話が53名の被験者に統計的に有意な道徳的判断の変化をもたらし、その効果は2週間にわたって増強することが示されました。対照群では変化は見られず、参加者は影響に気づいていませんでした。

← 前日 翌日 →