2026年5月15日金曜日

15 件 — 🟡 10 重要 , 🟢 5 注目

← 前日 翌日 →

🤖 モデル (2)

🟡 🤖 モデル 2026年5月15日 · 2 分で読めます

Amazon Nova 2 Sonic: エンドツーエンド遅延500ms以下・音声遅延30ms以下の音声対音声基盤モデル

編集イラスト:音声エージェントに音声波形とエッジネットワークグラフィック。

Amazon Nova 2 Sonicは2026年5月14日にAmazon Bedrockを通じて発表された第2世代の音声対音声基盤モデルです。別個の音声認識・音声合成サービスの必要性を排除し、エンドツーエンド遅延500ms以下、Streamエッジネットワーク経由の音声遅延30ms以下、ネイティブターン検出、割り込みサポート、会話中の関数呼び出しを実現します。Stream Vision Agentsフレームワークが双方向音声ストリーム管理を抽象化します。

🟡 🤖 モデル 2026年5月15日 · 3 分で読めます

arXiv:2605.15177 OpenDeepThink: Bradley-Terry 集約による並列推論で Gemini 3.1 Pro の Codeforces Elo が +405 向上

編集イラスト:ペアワイズ判定シンボルと Elo レーティングを持つ並列推論分岐の図。

OpenDeepThink は、Shang Zhou および共同研究者が 2026 年 5 月 14 日に arXiv で発表した新しいポピュレーションベースのテスト時計算スケーリング手法です。このフレームワークは、ポイントワイズ LLM 判定ではなく、ペアワイズ Bradley-Terry 比較によって複数の推論候補を並列サンプリングし、最良のものを選択します。結果として、8 回のシーケンシャル LLM 呼び出しラウンド(約 27 分)を通じて、Gemini 3.1 Pro は Codeforces ベンチマークで +405 Elo の向上を達成しました。チームはまた、73 の専門家評価 Codeforces 問題を含む CF-73 データセットを公開しました。

📦 オープンソース (2)

🟡 📦 オープンソース 2026年5月15日 · 3 分で読めます

arXiv:2605.15040 Orchard: オープンソースのエージェントフレームワークが 3 つの専用レシピで SWE-bench Verified 67.5% を達成

編集イラスト:3 列のレシピ列とサンドボックスランタイムアイコンを持つエージェントフレームワークの図。

Orchard は、Baolin Peng、Wenlin Yao および 12 名の共著者が 2026 年 5 月 14 日に arXiv で発表した新しいオープンソースのエージェントモデリングフレームワークです。このフレームワークは、軽量な環境レイヤーと 3 つの専用トレーニングレシピ(SWE ソフトウェアエンジニアリング、GUI ビジョン言語、Claw 個人アシスタント)を組み合わせています。Orchard-SWE バリアントは RL トレーニング後に SWE-bench Verified で 67.5% を達成し、コーディングエージェント向けの最先端オープンソースソリューションとなっています。

🟡 📦 オープンソース 2026年5月15日 · 3 分で読めます

LangChain: Labs自律エージェント研究プログラム——パートナーにHarvey、NVIDIA、Prime Intellect、Fireworks、Baseten

編集イラスト:エージェントフィードバックループとパートナーブランドアイコンを持つ研究ラボ。

LangChain Labsは2026年5月14日にHarrison Chaseが発表した新しい応用研究プログラムで、運用データ——本番トレース、ユーザーフィードバック、評価結果——からエージェントを自律的に改善することを目指しています。LangSmithがトレースシグナル収集のバックボーンとして機能します。初期パートナーにはHarvey(法律AI)、NVIDIA(GPU/インフラ)、Prime Intellect(分散コンピュート)、Fireworks(推論)、Baseten(デプロイメント)が含まれます。

⚖️ 規制 (1)

🤝 エージェント (3)

🟡 🤝 エージェント 2026年5月15日 · 3 分で読めます

Anthropic: Claude Code v2.1.142 — Fast Mode のデフォルトを Opus 4.7 に変更、バックグラウンドセッション向けに --add-dir と --mcp-config フラグを追加

編集イラスト:バックグラウンドエージェントセッションとフラグ一覧が表示された Claude Code ターミナル画面。

Claude Code v2.1.142 は、2026 年 5 月 14 日にリリースされた Anthropic CLI エージェントの新バージョンです。v2.1.139、v2.1.140、v2.1.141 に続く今週 4 つ目のパッチです。claude agents バックグラウンドセッション向けに 8 つの新しいフラグ(--add-dir、--settings、--mcp-config、--plugin-dir、--permission-mode、--model、--effort、--dangerously-skip-permissions)が追加されました。Fast Mode のデフォルトモデルが Opus 4.6 から Opus 4.7 に変更されています。MCP ツールタイムアウト、git worktree 認識、macOS スリープデーモン、Windows ネットワークドライブのデッドロックも修正されました。

🟡 🤝 エージェント 2026年5月15日 · 3 分で読めます

GitHub: Copilot Appがテクニカルプレビューに——独立セッションとAgent Merge機能を持つスタンドアロンGitHubネイティブデスクトップエージェント

編集イラスト:gitブランチグラフィックとAgent Mergeフローを持つデスクトップアプリ。

GitHub Copilot Appは2026年5月14日に発表されたテクニカルプレビューの新しいスタンドアロンGitHubネイティブデスクトップアプリケーションです。IDEプラグインと異なり、タスクごとに独立したセッションを提供します——各セッションは独自のブランチ、ファイル、会話状態、タスク状態を持ちます。Agent Merge機能がレビューコメントへの対処、失敗したチェックの修正、条件充足後のマージを自律的に行います。Copilot Pro/Pro+は早期アクセスで、Business/Enterpriseは段階的ロールアウトで利用可能です。

🟢 🤝 エージェント 2026年5月15日 · 3 分で読めます

OpenAI: Codex from Anywhere——リアルタイム監視とステアリング制御を備えたコーディングエージェントのモバイル・Web展開

編集イラスト:Codex CLIアイコンとリモート開発ストリームを持つスマートフォン。

OpenAI Codex from Anywhereは2026年5月14日に発表されたコーディングエージェントの新しいモバイル・Web展開フェーズです。開発者はスマートフォンやタブレットのChatGPTモバイルアプリを通じてコーディングタスクをリアルタイムで監視、操作、承認できます。このアプローチはCodexをWindows Sandbox(5月13日)とCodex CLIの展開から異種コンピューティング環境に拡張し、OpenAIのクロスプラットフォーム戦略を完成させます。

🔧 ハードウェア (1)

🏥 実践 (4)

🟡 🏥 実践 2026年5月15日 · 2 分で読めます

Amazon Lex: Assisted NLU LLMモードが追加料金なしで92%の意図認識精度と84%のスロット解決率を達成

編集イラスト:MLとLLMコンポーネントを持つチャットボット意図フロー。

Amazon Lex Assisted NLUは2026年5月14日に発表された、大規模言語モデルで従来のLex NLUを強化するチャットボット向け新LLM駆動モードです。平均92%の意図分類精度と84%のスロット解決精度を達成し、実際のデプロイメントでは意図分類が11〜15%改善、フォールバック応答が23.5%減少しました。プライマリモード(毎回入力)とフォールバックモード(低信頼度時のみ)の2モードが標準Lex料金に含まれます。

🟢 🏥 実践 2026年5月15日 · 3 分で読めます

GitHub Copilot Cloud Agent: 自動モデル選択でトークン乗数が10%割引に

編集イラスト:回転するモデルアイコンと割引率を持つAIエージェント。

GitHub Copilot Cloud Agent自動モデル選択は2026年5月14日に発表された新機能で、システム状態とモデルパフォーマンスシグナルに基づいてタスクに最適なモデルを自動的に選択します。自動モードのユーザーは標準モデル乗数に対して10%割引を受け、週ごとのレート制限が免除されます。この機能はモデルの手動選択の必要性を排除し、週末前にレート制限に達するエンタープライズユーザーの一般的なフラストレーションに対処します。

🟢 🏥 実践 2026年5月15日 · 3 分で読めます

IBM Consulting: Forward Deployed Units——6人のAI+人間チームがリヤドエア・ネスレ・ハイネケンで30人チームの仕事を担う

編集イラスト:ワークスペースで共に働く6人のチームメンバー——人間とAIエージェント。

IBM Forward Deployed Units(FDUs)は2026年5月14日にMohamad Ali(IBM Consulting シニアバイスプレジデント)が発表した新しいエンタープライズコンサルティングモデルです。シニアコンサルタント、エンジニア、AIエージェントで構成される6人のポッドが従来の30人コンサルティングチームを置き換えます。ワンショットのプロジェクト論理に代わる継続的なエンゲージメントを導入します。リヤドエア、ネスレ、ハイネケン、ピアソンで実際に展開済みです。

🟢 🏥 実践 2026年5月15日 · 3 分で読めます

OpenAI: Sea Limited(Garena、Shopee)がアジアのエンジニアリングチームを通じて Codex を展開——AI ネイティブ開発のケーススタディ

編集イラスト:複数のモニターに Codex CLI 表示を持つアジアのエンジニアリングチームの図。

OpenAI Sea Codex ケーススタディは、2026 年 5 月 14 日に発表されたエンタープライズ展開記事です。Sea Limited(Garena と Shopee の親会社)の CPO が、アジアのエンジニアリングチームを通じた OpenAI Codex コーディングエージェントの展開戦略を説明しています。Sea は Codex を AI ネイティブなソフトウェア開発ツールとして位置づけています——既存の慣行を加速させる開発支援ツールではなく、ワークフローの根本的な変革として捉えています。

💬 コミュニティ (1)

🛡️ セキュリティ (1)

← 前日 翌日 →