arXiv:2605.15514: RoPEは長いコンテキストで位置もトークンも区別できない――基本的限界の理論的証明
arXiv論文2605.15514は、Llama・Mistral・Qwen・GPT-NeoXを含むほぼすべての現代的な大規模言語モデルが使用するRotary Positional Embeddings(RoPE)が、長いコンテキストで位置とトークンを区別する能力を失うことを数学的に証明しています。著者らは根本的に新しいアーキテクチャメカニズムが必要と結論付けています。
17 件 — 🔴 3 重大 , 🟡 9 重要 , 🟢 5 注目
arXiv論文2605.15514は、Llama・Mistral・Qwen・GPT-NeoXを含むほぼすべての現代的な大規模言語モデルが使用するRotary Positional Embeddings(RoPE)が、長いコンテキストで位置とトークンを区別する能力を失うことを数学的に証明しています。著者らは根本的に新しいアーキテクチャメカニズムが必要と結論付けています。
Anthropicは2026年5月18日、Claude APIのウェブ検索ツールを更新し、10-K・10-Q・8-K文書を含むSEC申告書からより豊富で構造化されたデータを返すようにしました。このアップグレードにより、引用付きの一次情報源を用いた収益分析・デューデリジェンス・調査のための金融エージェント構築が容易になります。
研究者が38のモデルと8900以上の参考文献で、LLMの事実想起がシグモイド曲線に従うことを示しました:パラメータ数とトレーニングデータでのトピックの出現頻度の組み合わせが分散の60〜94%を説明します。幻覚はランダムではありません——予測可能で測定可能です。
PyTorchチームが実験的なExecuTorch MLX Delegateを公開しました。Apple MLXフレームワークとMetal GPUカーネルを活用して、Apple Siliconチップ上で3〜6倍のスループット向上を実現するバックエンドです。Llama 3.2・Qwen 3・Phi-4 mini・Whisper・Voxtralのリアルタイムストリーミング文字起こしに対応します。
GitHubはCopilot SpacesのREST APIの一般提供を発表し、チームがコンテキスト対応AIワークスペースをプログラムで作成・設定・削除できるようになりました。新しいインターフェースは、手動ワークフローに依存せずに多数のSpacesを管理する組織に特に有用です。
Anthropicは2026年5月18日、2022年創業のStainlessを買収しました。同社はすべての公式AnthropicSDKおよびMCPサーバーツールを手掛けており、数百社向けにSDKを生成しています。この買収は、Claudeエージェントとexternalなデータやツールとのインテグレーション強化を目的としています。
AnthropicはClaude APIプラットフォームに3つの重要なアップデートを導入しました。プライベートネットワークへのインターネット公開不要な接続を実現するMCP Tunnels、Anthropic管理インフラの代替となるセルフホストサンドボックス、そして100Kトークンを超えるツール出力の自動ファイルスピル機能です。
NUSとNTUの研究者によるarXiv論文2605.18661では、わずか15ドルで研究論文を自律的に生成するシステムを分析しています。主要な発見:フロンティアLLMは結果を捏造し、アイデアの新規性を信頼性高く評価できません。包括的なロードマップは、信頼できる支援と安全でないAI自律性の境界を定義しています。
arXiv:2605.16233は、モデルの重みを一切更新せずにLLMエージェントが集団的な経験の共有を通じて共有メモリを構築するFORGEを提案しています。ネットワーク防御タスクCybORG CAGE-2においてゼロ基準より1.7〜7.7倍の性能向上を達成し、能力の低いモデルで特に顕著な改善が見られました。
Anthropic Claude Code CLI v2.1.144では、「Agent completed · 3h 2m 5s」のような経過時間表示付きのバックグラウンドセッション/resumeサポートが導入され、API接続不可時の75秒ハングが修正され、ツールを静かに失っていたMCP tools/listページネーションバグが解決され、各種ターミナルおよびMCP修正が提供されました。
GitHubはGitHub Copilot CLIのリモートコントロール機能の一般提供(GA)を発表しました。/remote onコマンドにより、開発者はモバイルデバイス・ウェブ・VS Code・JetBrains IDEからアクティブなターミナルセッションを監視・管理でき、作業フローを中断せずに済みます。
UIUCとNVIDIAから41人の研究者が、コードはLLMの単なる出力ではなくエージェントハーネス——推論、行動、検証を一つの枠組みに統合し、信頼性の高いAIシステムを構築するための操作基盤——であると主張しています。
arXiv:2605.16238は、LLMとツリーサーチアルゴリズムを組み合わせた自律システムによる季節性流行予測を発表しています。2025〜26シーズンのリアルタイム評価において、システムはインフルエンザ・COVID-19・RSVのモデルを自律構築し、CDCのゴールドスタンダードである専門家キュレーション集成モデルを一貫して達成または上回りました。
arXiv:2605.16090は、テキストを一切使用せず、画像ピクセルへの不可視の摂動だけで視覚言語モデルに悪意ある指示を注入するCrossMPIを提案しています。研究者はマルチモーダル統合の重要層がモデルの中間部に位置することを発見し、攻撃の平均成功率(ASR)は66.36%と、すべての既知ベースライン手法を40.91ポイント上回ります。
CISPA HelmholtzセンターとGoogleの研究者たちが、データ/命令分離——プロンプトインジェクション攻撃の現在の主流的防御——がコンテキスト操作から保護できないことを数学的に証明しました。Contextual Integrityに基づく新しい理論的フレームワークとともに、AIエージェント保護設計の根本的に異なるアプローチを提案しています。