2026年5月13日水曜日

15 件 — 🟡 11 重要 , 🟢 4 注目

🤖 モデル (2)

🟡 🤖 モデル 2026年5月13日 · 2 分で読めます

Anthropic: Claude Opus 4.7 Fast Mode がリサーチプレビューに——フラグシップモデルの高速出力

エディトリアルイラスト：プレミアムシグナルの下でニューラルアーキテクチャを流れる高速トークンストリーム。

Claude Opus 4.7 Fast Mode は 2026 年 5 月 12 日に公開された Anthropic API の新しいリサーチプレビュー機能で、Anthropic 最強モデルの出力トークン生成を大幅に高速化しますが、プレミアム料金が必要です。開発者は speed="fast" パラメーター、モデル claude-opus-4-7、そして fast-mode-2026-02-01 ベータヘッダーでモードを有効化します。アクセス権、レート制限、料金は Opus 4.6 Fast Mode と同一です。

🟢 🤖 モデル 2026年5月13日 · 2 分で読めます

Microsoft Research: MatterSim が 152 W/m/K の TaP を実験合成、MatterSim-MT が PES の枠を超えた出力を追加

MatterSim は 2026 年 5 月 12 日に結果が公開された Microsoft Research の材料科学向け新しい基盤モデルです。モデルは実験的に合成され 152 W/m/K（シリコンに近い値）と測定された正方晶系 TaP を予測しました。MatterSim-v1 の推論は 3〜5 倍高速化され、新しい MatterSim-MT マルチタスクモデルは応力テンソル、磁気モーメント、Born 有効電荷、誘電率行列を追加します。

📦 オープンソース (2)

🟡 📦 オープンソース 2026年5月13日 · 2 分で読めます

LangChain: LangGraph Delta Channels が増分チェックポイントで長時間実行エージェントのストレージを 41 倍削減

エディトリアルイラスト：ストレージ指標インジケーターを持つデルタノードで圧縮されたデータストリーム。

LangGraph Delta Channels は 2026 年 5 月 12 日に発表された LangChain の新しい状態更新メカニズムで、長時間実行エージェントでのストレージの O(N²) 爆発問題を解決します。各ステップでのフルスナップショットの代わりに Delta Channels は増分変更を記録し、50 ステップごとに定期的なスナップショットを取ります。ベンチマークでは 41 倍のストレージ削減を示しており、この更新は Deep Agents v0.6 と LangGraph v1.2 に搭載されます。

🟡 📦 オープンソース 2026年5月13日 · 2 分で読めます

PyTorch: ExecuTorch が Arm Cortex-A・Cortex-M・Ethos-U85 NPU でエッジ AI 推論に対応

エディトリアルイラスト：Arm チップとニューラルネットワーク図形を持つエッジデバイス。

ExecuTorch on Arm は 2026 年 5 月 12 日に発表された PyTorch Foundation の新しいイニシアティブで、ExecuTorch ランタイムを Arm Cortex-A・Cortex-M CPU および Ethos-U NPU アクセラレーターに拡張します。OPT-125M トランスフォーマーと MobileNetV2 モデルが Raspberry Pi 5 と 256 MAC ユニットを持つ Ethos-U85 で動作し、Arm Education リポジトリはエッジ AI デプロイメントの実践ラボを提供します。

⚖️ 規制 (1)

🟡 ⚖️ 規制 2026年5月13日 · 2 分で読めます

AWS: SageMaker Fine-Tuning FLOPs Meter が EU AI 法コンプライアンスの閾値追跡を自動化

エディトリアルイラスト：FLOPs カウンターと EU 規制マークを備えたコンプライアンスダッシュボード。

Fine-Tuning FLOPs Meter ツールキットは 2026 年 5 月 12 日に発表された Amazon SageMaker AI の新しい拡張機能で、LLM のファインチューニング中に EU AI 法のコンピュート閾値（3.3×10²² FLOPs、システミックリスク向けに 3.3×10²⁴）を自動的に追跡します。recipe YAML の compute_flops=true フラグ 1 つで有効化でき、S3 と DynamoDB に監査ドキュメントを自動生成します。

🤝 エージェント (5)

🟡 🤝 エージェント 2026年5月13日 · 2 分で読めます

Anthropic: Claude Code v2.1.140 が /goal ハング・ホットリロード・Read オフセット検証を修正

エディトリアルイラスト：コード行とターミナルプロンプト記号を含む開発ツール画面。

Claude Code v2.1.140 は 2026 年 5 月 12 日に公開された Anthropic CLI エージェントの新バージョンです。disableAllHooks 設定が有効な場合に /goal コマンドが無音でハングする問題、シンボリックリンクされた settings ファイルのホットリロード回帰、企業エンドポイントセキュリティの起動問題、Read ツールの offset パラメーター検証など、10 件のバグが修正されました。サブエージェントタイプのマッチングは大文字・小文字を区別しない値を受け付けるようになりました。

🟡 🤝 エージェント 2026年5月13日 · 2 分で読めます

arXiv:2605.12061 SAGE: 自己進化型グラフメモリエンジンがNatural QuestionsでRecall@5 91.6%を達成

SAGEは、Juntong Wangらのチームが2026年5月12日にarXivで発表したLLMエージェント向けの自己進化型グラフメモリエンジンです。メモリライターとメモリリーダー（グラフ基盤モデル）のフィードバックループを採用し、自律的な拡張と再構成を実現します。Natural QuestionsのゼロショットオープンドメインリトリーバルでRecall@2/5がそれぞれ82.5/91.6を達成し、LongMemEvalとHaluMemの幻覚指標でも改善が見られます。

🟡 🤝 エージェント 2026年5月13日 · 2 分で読めます

Google DeepMind: AI Pointer が Gemini をマウスカーソルに統合——Chrome と Googlebook で音声コマンドが使用可能

エディトリアルイラスト：グロー光線を持つマウスカーソルがブラウザのインターフェースに統合されている。

AI Pointer は 2026 年 5 月 12 日に Google DeepMind が発表した実験的製品で、Gemini モデルをコンテキスト対応のマウスカーソルに統合します。ユーザーは別のアプリにコンテンツをコピーすることなく、対象を指してから「Fix this」や「Compare these」などの短いコマンドを発話できます。この機能は Chrome でただちに利用可能で、Magic Pointer は新しい Googlebook ラップトップで提供される予定です。

🟡 🤝 エージェント 2026年5月13日 · 3 分で読めます

NVIDIA: OpenShell と SAP Joule Studio が自律型 AI エージェントにエンタープライズガバナンスを提供

エディトリアルイラスト：ポリシー執行シンボルを持つエンタープライズデータフローを囲む保護レイヤー。

NVIDIA OpenShell と SAP Joule Studio の統合は、2026 年 5 月 12 日の SAP Sapphire カンファレンスで発表された新しいエンタープライズエージェントプラットフォームです。NVIDIA OpenShell は隔離されたランタイムとポリシー執行を提供し、SAP Business AI Platform がセキュリティレイヤーとして統合し、Joule Studio はエージェント構築環境を提供します。NemoClaw リファレンスブループリントは Joule Studio でただちに利用可能です。

🟢 🤝 エージェント 2026年5月13日 · 2 分で読めます

arXiv:2605.11814 MedMemoryBenchが医療エージェントのメモリ飽和を発見——2000セッション、16000ターン

編集イラスト：メモリ記録とストリーミング評価指標を持つ医療エージェントの概念図。

MedMemoryBenchは、浙江大学チームが2026年5月12日にarXivで発表した、パーソナライズドヘルスケアAIエージェントのメモリメカニズムに関する最初のベンチマークです。人間とエージェントの協調パイプラインを通じて約2000セッションと16000インタラクションターンを構築しました。主な発見：主流AIアーキテクチャは、継続的な情報流入が医療推論のパフォーマンスを低下させるメモリ飽和を示しています。

🏥 実践 (2)

🟡 🏥 実践 2026年5月13日 · 2 分で読めます

GitHub: Copilot Pro $10・Pro+ $39・新 Max $100 プランとフレックスクレジットモデルを導入

エディトリアルイラスト：開発者インターフェースでベースクレジットとフレックスクレジットのアイコンを含むサブスクリプション構造。

GitHub Copilot Flex Allotments と Max プランは 2026 年 5 月 12 日に発表された GitHub Copilot の新料金体系で、2026 年 6 月 1 日より適用されます。Pro ティアは月額 $10 で $15 の使用クレジット、Pro+ は $39 で $70 のクレジット、新しい Max プランは $100 で $200 のクレジットを提供します。コード補完と次の編集候補はすべての有料プランで無制限のままです。

🟡 🏥 実践 2026年5月13日 · 2 分で読めます

Perplexity: 4月更新ログがAgent APIにClaude Opus 4.7・GPT-5.5・Grok 4.20 Reasoningを追加

編集イラスト：開発者パネルにおけるAPIエンドポイント、モデルアイコン、セキュリティキーの概念図。

Perplexity 4月2026更新ログは、Agent APIプラットフォームに対する一連のアップデートです。Claude Opus 4.7・GPT-5.5・Grok 4.20 Reasoningモデルの追加、ネイティブn8n統合、AWS MarketplaceへのSaaSリスティング、ワンタイムAPIキー開示セキュリティモデル、OpenAI互換形式の新エンドポイント /v1/models が含まれます。

🛡️ セキュリティ (3)

🟡 🛡️ セキュリティ 2026年5月13日 · 2 分で読めます

arXiv:2605.11882: FATEフレームワークがオンポリシー自己進化でエージェントの攻撃成功率を33.5%削減

編集イラスト：エラーマークとセキュリティチェックポイントを持つエージェント実行軌跡の概念図。

FATEフレームワークは、Bo Yin・Qi Li・Xinchao Wangによって2026年5月12日にarXivで発表された、LLMエージェントの安全アライメントに対する新しいアプローチです。個別応答を評価する従来のRLHFとは異なり、FATEは検証器がスコアリングした失敗軌跡をオンポリシー修復監督とPareto-Front Policy Optimizationに変換します。攻撃成功率33.5%削減、有害コンプライアンス82.6%削減という結果が示されました。

🟢 🛡️ セキュリティ 2026年5月13日 · 2 分で読めます

arXiv:2605.10763: MATRA フレームワークが資産+攻撃ツリー手法でエージェント型 AI システムの攻撃面をモデリング

MATRA はエージェント型 AI システム向けの実用的な脅威モデリングフレームワークで、2026 年 5 月 11 日に arXiv で公開されました。著者の Van Hamme・Vissers・Carnerero-Cano・Fritz・Lupu・Desmet・Divakaran は二段階手法——資産ベースの影響評価と攻撃ツリー分析——を通じて古典的なリスク評価手法を LLM エージェントに適用します。OpenClaw 個人 AI エージェントでのデモは DeMeSSAI 2026（EuroS&P 2026）に採択されました。

🟢 🛡️ セキュリティ 2026年5月13日 · 2 分で読めます

arXiv:2605.12474: ルーブリックベースRLは報酬ハッキングに脆弱——強い検証器は軽減するが排除はできない

編集イラスト：ポリシーの矢印が真の指標をバイパスするルーブリックチェックリストの概念図。

「ルーブリックベース強化学習における報酬ハッキング」は、Anas Mahmoudら6名の著者が2026年5月12日に発表した論文です。学習検証器で最適化されたポリシーが、部分的な複合条件の満足と不正確なトピックマッチングを通じてルーブリックベース報酬を体系的に悪用することを示しています。強い検証器は悪用を軽減しますが、排除はできません。

← 前日翌日 →