2026年5月19日火曜日

17 件 — 🔴 3 重大 , 🟡 9 重要 , 🟢 5 注目

← 前日 翌日 →

🤖 モデル (3)

🔴 🤖 モデル 2026年5月19日 · 4 分で読めます

arXiv:2605.15514: RoPEは長いコンテキストで位置もトークンも区別できない――基本的限界の理論的証明

Editorial illustration: arXiv論文2605.15514がRoPE位置エンコーディングの根本的限界を理論的に証明――長コンテキストで位置とトークンの区別能力を失う

arXiv論文2605.15514は、Llama・Mistral・Qwen・GPT-NeoXを含むほぼすべての現代的な大規模言語モデルが使用するRotary Positional Embeddings(RoPE)が、長いコンテキストで位置とトークンを区別する能力を失うことを数学的に証明しています。著者らは根本的に新しいアーキテクチャメカニズムが必要と結論付けています。

🟡 🤖 モデル 2026年5月19日 · 2 分で読めます

Anthropic: Claude APIのウェブ検索ツールがSEC申告書の充実した構造化データを返すよう更新

Editorial illustration: Anthropicが2026年5月18日にClaude APIのウェブ検索ツールを更新し、SEC申告書からより豊富で構造化されたデータを返すよう改善

Anthropicは2026年5月18日、Claude APIのウェブ検索ツールを更新し、10-K・10-Q・8-K文書を含むSEC申告書からより豊富で構造化されたデータを返すようにしました。このアップグレードにより、引用付きの一次情報源を用いた収益分析・デューデリジェンス・調査のための金融エージェント構築が容易になります。

🟢 🤖 モデル 2026年5月19日 · 2 分で読めます

arXiv:2605.18732:幻覚のスケーリング則——大きなモデルが必ずしも少ないエラーを意味しない

Editorial illustration: LLM幻覚スケーリング則研究

研究者が38のモデルと8900以上の参考文献で、LLMの事実想起がシグモイド曲線に従うことを示しました:パラメータ数とトレーニングデータでのトピックの出現頻度の組み合わせが分散の60〜94%を説明します。幻覚はランダムではありません——予測可能で測定可能です。

📦 オープンソース (2)

⚖️ 規制 (1)

🤝 エージェント (8)

🔴 🤝 エージェント 2026年5月19日 · 3 分で読めます

Anthropic: StainlessのM&Aにより、MCPサーバーツールとSDK開発をClaudeプラットフォームに直接統合

Editorial illustration: Anthropicが2026年5月18日にStainlessを買収。同社は2022年設立で、すべての公式Anthropic SDKおよびMCPサーバーツールを手掛けていた

Anthropicは2026年5月18日、2022年創業のStainlessを買収しました。同社はすべての公式AnthropicSDKおよびMCPサーバーツールを手掛けており、数百社向けにSDKを生成しています。この買収は、Claudeエージェントとexternalなデータやツールとのインテグレーション強化を目的としています。

🔴 🤝 エージェント 2026年5月19日 · 3 分で読めます

Anthropic:MCP Tunnels、セルフホストサンドボックス、ツール出力の自動ファイルスピル

Editorial illustration: AnthropicがClaude APIプラットフォームにエージェント開発者向け3つの重要アップデートを導入

AnthropicはClaude APIプラットフォームに3つの重要なアップデートを導入しました。プライベートネットワークへのインターネット公開不要な接続を実現するMCP Tunnels、Anthropic管理インフラの代替となるセルフホストサンドボックス、そして100Kトークンを超えるツール出力の自動ファイルスピル機能です。

🟡 🤝 エージェント 2026年5月19日 · 3 分で読めます

arXiv:2605.18661:AI自動研究のロードマップとユーザーガイド

Editorial illustration: arXiv論文2605.18661が自律的に研究論文を生成するAIシステムを分析

NUSとNTUの研究者によるarXiv論文2605.18661では、わずか15ドルで研究論文を自律的に生成するシステムを分析しています。主要な発見:フロンティアLLMは結果を捏造し、アイデアの新規性を信頼性高く評価できません。包括的なロードマップは、信頼できる支援と安全でないAI自律性の境界を定義しています。

🟡 🤝 エージェント 2026年5月19日 · 3 分で読めます

arXiv:2605.16233: FORGE――ファインチューニングなしでAIエージェントが共有メモリを獲得する手法

Editorial illustration: arXiv:2605.16233が提案するFORGE――LLMエージェントが集団的な経験の広報を通じてモデル重みを変更せずに共有メモリを構築する手法

arXiv:2605.16233は、モデルの重みを一切更新せずにLLMエージェントが集団的な経験の共有を通じて共有メモリを構築するFORGEを提案しています。ネットワーク防御タスクCybORG CAGE-2においてゼロ基準より1.7〜7.7倍の性能向上を達成し、能力の低いモデルで特に顕著な改善が見られました。

🟡 🤝 エージェント 2026年5月19日 · 2 分で読めます

Anthropic Claude Code v2.1.144:バックグラウンドセッションへの/resumeサポートと75秒ハングの修正

Editorial illustration: Anthropic Claude Code CLI v2.1.144バックグラウンドセッションの/resume対応と経過時間表示

Anthropic Claude Code CLI v2.1.144では、「Agent completed · 3h 2m 5s」のような経過時間表示付きのバックグラウンドセッション/resumeサポートが導入され、API接続不可時の75秒ハングが修正され、ツールを静かに失っていたMCP tools/listページネーションバグが解決され、各種ターミナルおよびMCP修正が提供されました。

🟡 🤝 エージェント 2026年5月19日 · 2 分で読めます

GitHub: Copilot CLIのリモートコントロールがすべてのプラットフォームで一般提供開始

Editorial illustration: GitHubがGitHub Copilot CLIのリモートコントロール機能の一般提供を発表――/remote onコマンドでクロスデバイス管理が可能に

GitHubはGitHub Copilot CLIのリモートコントロール機能の一般提供(GA)を発表しました。/remote onコマンドにより、開発者はモバイルデバイス・ウェブ・VS Code・JetBrains IDEからアクティブなターミナルセッションを監視・管理でき、作業フローを中断せずに済みます。

🟢 🤝 エージェント 2026年5月19日 · 3 分で読めます

arXiv:2605.18747:操作基盤としてのコード——AIエージェントの新しいパラダイム

Editorial illustration: UIUCとNVIDIAの41人の研究者がコードはAIエージェント操作基盤であると主張

UIUCとNVIDIAから41人の研究者が、コードはLLMの単なる出力ではなくエージェントハーネス——推論、行動、検証を一つの枠組みに統合し、信頼性の高いAIシステムを構築するための操作基盤——であると主張しています。

🟢 🤝 エージェント 2026年5月19日 · 2 分で読めます

arXiv:2605.16238: LLM誘導ツリーサーチが疾患流行予測でCDCを超える精度を実現

Editorial illustration: arXiv:2605.16238が提案するLLMとツリーサーチを組み合わせた自律システムによるインフルエンザ・COVID-19・RSVの季節性流行予測

arXiv:2605.16238は、LLMとツリーサーチアルゴリズムを組み合わせた自律システムによる季節性流行予測を発表しています。2025〜26シーズンのリアルタイム評価において、システムはインフルエンザ・COVID-19・RSVのモデルを自律構築し、CDCのゴールドスタンダードである専門家キュレーション集成モデルを一貫して達成または上回りました。

🏥 実践 (1)

🛡️ セキュリティ (2)

← 前日 翌日 →