2026年5月19日火曜日

17 件 — 🔴 3 重大 , 🟡 9 重要 , 🟢 5 注目

🤖 モデル (3)

🔴 🤖 モデル 2026年5月19日 · 4 分で読めます

arXiv:2605.15514: RoPEは長いコンテキストで位置もトークンも区別できない――基本的限界の理論的証明

Editorial illustration: arXiv論文2605.15514がRoPE位置エンコーディングの根本的限界を理論的に証明――長コンテキストで位置とトークンの区別能力を失う

arXiv論文2605.15514は、Llama・Mistral・Qwen・GPT-NeoXを含むほぼすべての現代的な大規模言語モデルが使用するRotary Positional Embeddings（RoPE）が、長いコンテキストで位置とトークンを区別する能力を失うことを数学的に証明しています。著者らは根本的に新しいアーキテクチャメカニズムが必要と結論付けています。

🟡 🤖 モデル 2026年5月19日 · 2 分で読めます

Anthropic: Claude APIのウェブ検索ツールがSEC申告書の充実した構造化データを返すよう更新

Editorial illustration: Anthropicが2026年5月18日にClaude APIのウェブ検索ツールを更新し、SEC申告書からより豊富で構造化されたデータを返すよう改善

Anthropicは2026年5月18日、Claude APIのウェブ検索ツールを更新し、10-K・10-Q・8-K文書を含むSEC申告書からより豊富で構造化されたデータを返すようにしました。このアップグレードにより、引用付きの一次情報源を用いた収益分析・デューデリジェンス・調査のための金融エージェント構築が容易になります。

🟢 🤖 モデル 2026年5月19日 · 2 分で読めます

arXiv:2605.18732：幻覚のスケーリング則——大きなモデルが必ずしも少ないエラーを意味しない

研究者が38のモデルと8900以上の参考文献で、LLMの事実想起がシグモイド曲線に従うことを示しました：パラメータ数とトレーニングデータでのトピックの出現頻度の組み合わせが分散の60〜94%を説明します。幻覚はランダムではありません——予測可能で測定可能です。

📦 オープンソース (2)

🟡 📦 オープンソース 2026年5月19日 · 2 分で読めます

PyTorch: ExecuTorch MLX DelegateがApple Silicon GPUでモデル推論を3〜6倍高速化

Editorial illustration: PyTorchチームがExecuTorch MLX Delegateを公開――Apple MLXフレームワークを活用してApple Silicon GPUでの推論を3〜6倍高速化

PyTorchチームが実験的なExecuTorch MLX Delegateを公開しました。Apple MLXフレームワークとMetal GPUカーネルを活用して、Apple Siliconチップ上で3〜6倍のスループット向上を実現するバックエンドです。Llama 3.2・Qwen 3・Phi-4 mini・Whisper・Voxtralのリアルタイムストリーミング文字起こしに対応します。

🟢 📦 オープンソース 2026年5月19日 · 2 分で読めます

GitHub: Copilot Spaces APIが一般提供開始

Editorial illustration: GitHubがCopilot Spaces REST APIの一般提供を発表――チームがコンテキスト対応AIワークスペースをプログラムで作成・管理できるようになった

GitHubはCopilot SpacesのREST APIの一般提供を発表し、チームがコンテキスト対応AIワークスペースをプログラムで作成・設定・削除できるようになりました。新しいインターフェースは、手動ワークフローに依存せずに多数のSpacesを管理する組織に特に有用です。

⚖️ 規制 (1)

🟡 ⚖️ 規制 2026年5月19日 · 2 分で読めます

EU AI Office：高リスクAIシステム分類に関するパブリックコンサルテーション——期限は2026年6月23日

Editorial illustration: 欧州委員会がAIシステム高リスク分類ガイドライン草案に関するパブリックコンサルテーションを開始

欧州委員会が、AIシステムがいつ「高リスク」カテゴリに該当するかを定義するガイドライン草案に関するパブリックコンサルテーションを開始しました。開発者から市民社会まで、すべての利害関係者は2026年6月23日22:00 CETまでフィードバックを提出できます。

🤝 エージェント (8)

🔴 🤝 エージェント 2026年5月19日 · 3 分で読めます

Anthropic: StainlessのM&Aにより、MCPサーバーツールとSDK開発をClaudeプラットフォームに直接統合

Editorial illustration: Anthropicが2026年5月18日にStainlessを買収。同社は2022年設立で、すべての公式Anthropic SDKおよびMCPサーバーツールを手掛けていた

Anthropicは2026年5月18日、2022年創業のStainlessを買収しました。同社はすべての公式AnthropicSDKおよびMCPサーバーツールを手掛けており、数百社向けにSDKを生成しています。この買収は、Claudeエージェントとexternalなデータやツールとのインテグレーション強化を目的としています。

🔴 🤝 エージェント 2026年5月19日 · 3 分で読めます

Anthropic：MCP Tunnels、セルフホストサンドボックス、ツール出力の自動ファイルスピル

Editorial illustration: AnthropicがClaude APIプラットフォームにエージェント開発者向け3つの重要アップデートを導入

AnthropicはClaude APIプラットフォームに3つの重要なアップデートを導入しました。プライベートネットワークへのインターネット公開不要な接続を実現するMCP Tunnels、Anthropic管理インフラの代替となるセルフホストサンドボックス、そして100Kトークンを超えるツール出力の自動ファイルスピル機能です。

🟡 🤝 エージェント 2026年5月19日 · 3 分で読めます

arXiv:2605.18661：AI自動研究のロードマップとユーザーガイド

Editorial illustration: arXiv論文2605.18661が自律的に研究論文を生成するAIシステムを分析

NUSとNTUの研究者によるarXiv論文2605.18661では、わずか15ドルで研究論文を自律的に生成するシステムを分析しています。主要な発見：フロンティアLLMは結果を捏造し、アイデアの新規性を信頼性高く評価できません。包括的なロードマップは、信頼できる支援と安全でないAI自律性の境界を定義しています。

🟡 🤝 エージェント 2026年5月19日 · 3 分で読めます

arXiv:2605.16233: FORGE――ファインチューニングなしでAIエージェントが共有メモリを獲得する手法

Editorial illustration: arXiv:2605.16233が提案するFORGE――LLMエージェントが集団的な経験の広報を通じてモデル重みを変更せずに共有メモリを構築する手法

arXiv:2605.16233は、モデルの重みを一切更新せずにLLMエージェントが集団的な経験の共有を通じて共有メモリを構築するFORGEを提案しています。ネットワーク防御タスクCybORG CAGE-2においてゼロ基準より1.7〜7.7倍の性能向上を達成し、能力の低いモデルで特に顕著な改善が見られました。

🟡 🤝 エージェント 2026年5月19日 · 2 分で読めます

Anthropic Claude Code v2.1.144：バックグラウンドセッションへの/resumeサポートと75秒ハングの修正

Editorial illustration: Anthropic Claude Code CLI v2.1.144バックグラウンドセッションの/resume対応と経過時間表示

Anthropic Claude Code CLI v2.1.144では、「Agent completed · 3h 2m 5s」のような経過時間表示付きのバックグラウンドセッション/resumeサポートが導入され、API接続不可時の75秒ハングが修正され、ツールを静かに失っていたMCP tools/listページネーションバグが解決され、各種ターミナルおよびMCP修正が提供されました。

🟡 🤝 エージェント 2026年5月19日 · 2 分で読めます

GitHub: Copilot CLIのリモートコントロールがすべてのプラットフォームで一般提供開始

Editorial illustration: GitHubがGitHub Copilot CLIのリモートコントロール機能の一般提供を発表――/remote onコマンドでクロスデバイス管理が可能に

GitHubはGitHub Copilot CLIのリモートコントロール機能の一般提供（GA）を発表しました。/remote onコマンドにより、開発者はモバイルデバイス・ウェブ・VS Code・JetBrains IDEからアクティブなターミナルセッションを監視・管理でき、作業フローを中断せずに済みます。

🟢 🤝 エージェント 2026年5月19日 · 3 分で読めます

arXiv:2605.18747：操作基盤としてのコード——AIエージェントの新しいパラダイム

Editorial illustration: UIUCとNVIDIAの41人の研究者がコードはAIエージェント操作基盤であると主張

UIUCとNVIDIAから41人の研究者が、コードはLLMの単なる出力ではなくエージェントハーネス——推論、行動、検証を一つの枠組みに統合し、信頼性の高いAIシステムを構築するための操作基盤——であると主張しています。

🟢 🤝 エージェント 2026年5月19日 · 2 分で読めます

arXiv:2605.16238: LLM誘導ツリーサーチが疾患流行予測でCDCを超える精度を実現

Editorial illustration: arXiv:2605.16238が提案するLLMとツリーサーチを組み合わせた自律システムによるインフルエンザ・COVID-19・RSVの季節性流行予測

arXiv:2605.16238は、LLMとツリーサーチアルゴリズムを組み合わせた自律システムによる季節性流行予測を発表しています。2025〜26シーズンのリアルタイム評価において、システムはインフルエンザ・COVID-19・RSVのモデルを自律構築し、CDCのゴールドスタンダードである専門家キュレーション集成モデルを一貫して達成または上回りました。

🏥 実践 (1)

🟢 🏥 実践 2026年5月19日 · 2 分で読めます

CNCF: Kubernetesデバッガがアクセス痕跡を削除――セキュリティ監査に深刻な問題

Editorial illustration: CNCFがkubectl debugセッション終了後に記録が残らない問題を警告――PCI DSSおよびSOC 2コンプライアンスへの脅威

CNCFは、Kubernetesコンテナの診断ツールであるkubectl debugがセッション終了後に一切の記録を残さないと警告しています。このため規制対象業界では「誰がどのコンテナを、どれくらいの時間見ていたか」という重要な問いに答えられず、PCI DSSおよびSOC 2の監査ログ要件に直接違反することになります。

🛡️ セキュリティ (2)

🟡 🛡️ セキュリティ 2026年5月19日 · 2 分で読めます

arXiv:2605.16090: CrossMPI――画像の摂動のみで視覚言語モデルを攻撃するクロスモーダルプロンプトインジェクション

Editorial illustration: arXiv:2605.16090が提案するCrossMPI――画像ピクセルへの不可視摂動で視覚言語モデルに悪意ある指示を注入するクロスモーダル攻撃

arXiv:2605.16090は、テキストを一切使用せず、画像ピクセルへの不可視の摂動だけで視覚言語モデルに悪意ある指示を注入するCrossMPIを提案しています。研究者はマルチモーダル統合の重要層がモデルの中間部に位置することを発見し、攻撃の平均成功率（ASR）は66.36%と、すべての既知ベースライン手法を40.91ポイント上回ります。

🟡 🛡️ セキュリティ 2026年5月19日 · 3 分で読めます

arXiv:2605.17634：データと命令の分離ではプロンプトインジェクションを防げない理由

Editorial illustration: CISPA HelmholtzセンターとGoogle研究者がデータ命令分離の限界を数学的に証明

CISPA HelmholtzセンターとGoogleの研究者たちが、データ/命令分離——プロンプトインジェクション攻撃の現在の主流的防御——がコンテキスト操作から保護できないことを数学的に証明しました。Contextual Integrityに基づく新しい理論的フレームワークとともに、AIエージェント保護設計の根本的に異なるアプローチを提案しています。

← 前日翌日 →