2026年5月22日金曜日

12 件 — 🔴 2 重大 , 🟡 8 重要 , 🟢 2 注目

🤖 モデル (2)

🟡 🤖 モデル 2026年5月22日 · 4 分で読めます

arXiv:2605.21006：既製ペルソナベクトルがLLMモデルの的を絞った追従ステアリングの68-98%の効果を達成

編集イラスト：2605.21006：既製ペルソナベクトルがLLMモデルの的を絞った追従ステアリングの68-98%の効果を達成

研究者たちは2026年5月21日、arXivに「悪魔の代弁者を演じる」と題する論文を発表した。ロールプレイ用に開発された既製ペルソナベクトルが、追従性（ユーザーが誤っていても同意しようとするモデルの傾向）を専門化されたContrastive Activation Addition（CAA）手法の68-98%の効率で低減できることを示している。追従性はペルソナレベルの属性であり、活性化空間内の単一の誘導可能な方向ではないという幾何学的分析はアライメントへのより容易な経路を開く。

🟢 🤖 モデル 2026年5月22日 · 3 分で読めます

Black Forest Labs：FLUX Eraseがプロンプトなしの物体削除でGPT Image-2（68.5%）とFinegrain（63.2%）を上回る

編集イラスト：FLUX Eraseがプロンプトなし物体削除でGPT Image-2（68.5%）とFinegrain（63.2%）を超える

Black Forest Labsは2026年5月21日、バイナリマスクだけで画像から物体・影・透かし・テキストを削除し背景を再構成するインペインティングツールFLUX Eraseをローンチした。テキストプロンプトは一切不要だ。198枚のテスト画像によるベンチマークでGPT Image-2（68.5%）とFinegrain Eraser Standard（63.2%）を上回る優位性を示した。BFL APIとflux-tools.bfl.ai/eraseの公開デモで利用可能で、Black Forest LabsをプロCreativeワークフローツールのスペシャリストとして位置づける。

⚖️ 規制 (1)

🔴 ⚖️ 規制 2026年5月22日 · 3 分で読めます

UK AI Safety Institute：先進AIシステムの監視がますます困難に — 20以上の劣化経路を特定

編集イラスト：先進AIシステムの監視がますます困難になる — 20以上の劣化経路を特定

UK AI Safety Institute（AISI）は2026年5月21日、産業・政府・学術界の専門家25名へのインタビューをもとに先進AIシステム監視の将来を分析した報告書を公表した。主要な知見は、現在の監視が侵食されつつある基盤の上に成り立っているというものだ。20以上の監視メカニズム劣化経路が特定され、潜在的推論、能力マスキング、AIエージェントの外部行動、AI間通信が重点分野として挙げられた。

🤝 エージェント (5)

🔴 🤝 エージェント 2026年5月22日 · 3 分で読めます

Microsoft Research：MagenticLite + Fara1.5（4B/9B/27B）— 小型モデル向けに最適化したエージェントAIがSOTAを達成

編集イラスト：MagenticLite + Fara1.5（4B/9B/27B）— 小型モデル向けに最適化したエージェントAIがSOTAを達成

Microsoft Researchは2026年5月21日、小型モデルに対するエージェントAIの3点セットを発表した。MagenticLite（ブラウザおよびファイルシステムUIアプリ）、MagenticBrain（Qwen 3 14Bからファインチューニングした14Bオーケストレーションモデル）、Fara1.5（4B/9B/27Bの3サイズのコンピュータ使用モデル）だ。Fara1.5-27BはOnline-Mind2Webベンチマーク（300のウェブタスク）でSOTAの90%超を達成し、前世代Fara-7Bのほぼ2倍のスコアを記録した。エージェントAIに巨大モデルは不要で、うまく設計されたツールと実行フレームワークだけで十分だと示すことが目的だ。

🟡 🤝 エージェント 2026年5月22日 · 3 分で読めます

AWS：Nova ActがHIPAA適格を取得 — 医療ワークフロー向けePHIエージェント自動化が解禁

編集イラスト：Nova ActがHIPAA適格を取得 — 医療ワークフロー向けePHIエージェント自動化が解禁

AWSは2026年5月21日、ブラウザおよびUIワークフロー自動化のためのエージェントAIサービスAmazon Nova ActがHIPAA適格ステータスを取得したと発表した。医療機関はNova Actを使って保護された医療情報（ePHI）を扱えるようになった。事前承認、保険確認、プロバイダーウェブポータルを通じた紹介状送付に対応する。Amazon Bedrock AgentCoreおよびStrand Agentsフレームワークと統合し、署名済みBAA契約とAWS KMS暗号化が必要で、現在は米東部（北バージニア）リージョンのみで利用可能だ。

🟡 🤝 エージェント 2026年5月22日 · 3 分で読めます

Anthropic：Claude Code v2.1.147が確定性マルチエージェントオーケストレーションのWorkflowツールを導入

編集イラスト：Claude Code v2.1.147が確定性マルチエージェントオーケストレーションのWorkflowツールを導入

Anthropicは2026年5月21日20:39 UTCにClaude Code v2.1.147をリリースし、Claude Codeエコシステム初の確定性マルチエージェントオーケストレーション機構となるWorkflowツールを導入した。ツールは初期デフォルト無効で、環境変数CLAUDE_CODE_WORKFLOWS=1で有効化する。同バージョンで既存の/simplifyコマンドがhigh/medium/lowの努力レベルを持つ/code-reviewに改名され、プロトタイプ汚染攻撃とtheableベースのエスケープ攻撃に対するサンドボックス強化も追加された。

🟡 🤝 エージェント 2026年5月22日 · 4 分で読めます

LangChain：トークンストリームからエージェントストリームへ — 型付きチャネルがマルチエージェントUIの古典的ストリーミングに取って代わる

編集イラスト：トークンストリームからエージェントストリームへ — 型付きチャネルがマルチエージェントUIの古典的ストリーミングに取って代わる

LangChainは2026年5月21日、Christian BromannとNick Hollonによるポストを公開し、トークンストリームから構造化されたエージェントストリームへのパラダイム的進化を論じた。現代のAIエージェントはタスクを計画し、サブエージェントに委任し、ツールを呼び出し、人間のレビューのために一時停止する — 古典的なテキストトークンストリーミングではその作業を表示するのに不十分だ。LangChainはLangGraphでメッセージ、ツール呼び出し、状態変化、サブエージェントの活動、カスタムイベントを運ぶ型付きチャネルを提案する。アプリケーションは関連する型のみをサブスクライブし、長時間実行のワークロードでも効率的なUIを実現する。

🟡 🤝 エージェント 2026年5月22日 · 3 分で読めます

OpenAI：Codexのエンタープライズ展開 — 週間アクティブユーザー400万人とCodex Labsプログラム

編集イラスト：Codexエンタープライズ展開 — 週間アクティブユーザー400万人とCodex Labsプログラム

OpenAIは2026年5月21日、Codexプラットフォームの企業向け展開を発表した。このエージェントコーディングツールは週間アクティブユーザー400万人に達した。新しいCodex Labsプログラムと大手コンサルティング会社とのパートナーシップが発表され、大企業がCodexを実装・拡張するのを支援する。この発表はCodexをGitHub Copilotの中高端市場での直接競合として位置づける正式なエンタープライズ市場参入の動きだ。

🏥 実践 (2)

🟡 🏥 実践 2026年5月22日 · 3 分で読めます

arXiv:2605.21427：PALS — MoEモデルの電力対応LLMサービングで+26.3%エネルギー効率と4-7倍QoS違反削減を達成

編集イラスト：2605.21427：PALS — MoEモデルの電力対応LLMサービングで+26.3%エネルギー効率と4-7倍QoS違反削減を達成

研究者たちは2026年5月21日、arXivプレプリントサーバーにPALSを公表した。PALSはGPU電力制御をMoEモデルのLLMサービングに直接統合するランタイムシステムだ。軽量なオフライン電力性能モデルとフィードバックコントローラーを用いてスループット目標に基づく設定を動的最適化し、電力制約下で26.3%のエネルギー効率向上と4-7倍のQoS違反削減を実現する。APIの変更やモデルの再トレーニングなしにvLLMに統合可能で、データセンターの増大する運営上のボトルネック — GPUクラスターのエネルギー消費 — に直接対処する。

🟢 🏥 実践 2026年5月22日 · 3 分で読めます

CNCF：NetEase GamesがFluidプリフェッチレイヤーでKubernetes上の30秒LLMコールドスタートを達成

編集イラスト：NetEase GamesがFluidプリフェッチレイヤーでKubernetes上の30秒LLMコールドスタートを達成

CNCFは2026年5月21日、NetEase Games（廖海峰・張翔著）のケーススタディを公開した。CNCFインキュベーションプロジェクトFluidを使って70Bクラスのモデル読み込み時間をS3直接アクセスの42分から30秒未満に短縮した方法を詳述している。鍵はFluidプリフェッチレイヤーによるチーム間のモデル共有と、コールドスタートを排除する事前ウォーミングスケジューリングだ。Kubernetes上で大規模モデルのサーバーレスLLM推論を行うエンジニア向けの技術ケーススタディだ。

🛡️ セキュリティ (2)

🟡 🛡️ セキュリティ 2026年5月22日 · 3 分で読めます

Microsoft Research：Vega — デジタルアイデンティティ向けZKプルーフ、92ms生成と70%高速な再証明を実現

編集イラスト：Vega — デジタルアイデンティティのZKプルーフ、92ms生成と70%高速な再証明

Microsoft Researchは2026年5月21日、Vegaを発表した。政府文書（年齢・ステータス・資格）の事実を文書自体を開示せずに証明するゼロ知識証明システムだ。標準的なデバイスでの証明生成は92ms、証明サイズは108KB、検証は23msだ。fold-and-reuse provingにより同一クレデンシャルの各後続証明が最大70%高速になる点と、CBORドキュメント全体のパースを回避するルックアップ中心の回路設計が主要なイノベーションだ。Vegaはユーザーに代わって機密データを保存せずに身元を証明する必要があるAIエージェントにとって特に重要だ。

🟡 🛡️ セキュリティ 2026年5月22日 · 3 分で読めます

OECD AI：集合的AIセキュリティにはG7調整が必要 — プロンプトインジェクション、エージェントセキュリティ、モデルポイズニングが優先事項

編集イラスト：集合的AIセキュリティにはG7調整が必要 — プロンプトインジェクション、エージェントセキュリティ、モデルポイズニング優先事項

OECD AIは2026年5月21日、de Rivoire、de Leusse、Seger、Buttsによる政策レポートを公表し、AIセキュリティは従来のサイバーセキュリティの枠を超えるため国際調整が必要だと論じた。3つの優先分野として、再利用可能な攻撃手法によるプロンプトインジェクション攻撃への防御、自律的にツールとメモリにアクセスするAIエージェントのセキュリティ、少数の汚染ドキュメントで異なる規模のモデルを危険にさらせるモデルポイズニングの防止が特定された。G7とOECD-GPAIメカニズムを通じた官民連携の活発な推進が推奨された。

← 前日翌日 →