2026年5月8日金曜日

10 件 — 🔴 5 重大 , 🟡 5 重要

🤖 モデル (2)

🔴 🤖 モデル 2026年5月8日 · 2 分で読めます

OpenAI: 推論と翻訳に対応した3つの新しいリアルタイム音声モデルをAPIに追加

編集イラスト：推論と翻訳に対応した3つの新しいリアルタイム音声モデルをAPIに追加

OpenAIは2026年5月7日、APIに3つの新しいリアルタイム音声モデルを発表しました。GPT-Realtime-2はGPT-5クラスの推論と128,000トークンのコンテキストを備え、GPT-Realtime-Translateは70以上の入力言語から13の出力言語へのリアルタイム翻訳を実現し、GPT-Realtime-Whisperはライブ音声文字起こしを提供します。

🟡 🤖 モデル 2026年5月8日 · 2 分で読めます

Google: Gemini 3.1 Flash-Liteが一般提供（GA）開始

Gemini 3.1 Flash-Liteは2026年5月7日よりGemini APIを通じて安定した本番エンドポイントとして一般提供（GA）されています。このモデルは速度、スケール、コスト効率に最適化されており、プレビュー版は2026年5月25日に終了します。

⚖️ 規制 (1)

🔴 ⚖️ 規制 2026年5月8日 · 2 分で読めます

EU AI Office: 欧州委員会がAI法透明性義務ガイドライン草案に関するパブリックコンサルテーションを開始

Editorial illustration: 欧州委員会がAI法透明性義務ガイドライン草案に関するパブリックコンサルテーションを開始

欧州委員会はAI法の透明性義務に関するガイドライン草案を公表し、2026年6月3日を締め切りとするパブリックコンサルテーションを開始した。義務は2026年8月2日から適用される。プロバイダーはAI生成コンテンツに機械可読マーカーを付与し、ユーザーにAIシステムとのやり取りを通知しなければならない。

🤝 エージェント (4)

🔴 🤝 エージェント 2026年5月8日 · 2 分で読めます

Google DeepMind: AlphaEvolveがGoogle Cloudで利用可能に、初の産業成果を報告

編集イラスト：AlphaEvolveがGoogle Cloudで利用可能に、初の産業成果を報告

Google DeepMindは2026年5月、AlphaEvolveエージェントの初の産業影響レポートを発表し、Google Cloudを通じた商業利用を開始しました。KlarnaはTransformerモデルのトレーニング速度を2倍に向上させ、FM Logisticはルーティング効率を10.4%改善し、Schrödingerは分子シミュレーションを4倍高速化しました。

🔴 🤝 エージェント 2026年5月8日 · 2 分で読めます

AWS: Bedrock AgentCore Paymentsがx402プロトコルとステーブルコインをAIエージェント向けに導入

編集イラスト：Bedrock AgentCore Paymentsがx402プロトコルとステーブルコインをAIエージェント向けに導入

AWSはAmazon Bedrock AgentCore Paymentsをプレビューリリースしました。これはAIエージェントが自律的に決済を行うための最初のマネージドインフラです。オープンなx402 HTTPプロトコルとステーブルコインを使用し、CoinbaseおよびStripe（Privy経由）との提携により実現しており、予算制限とAgentCoreコンソールを通じた完全な監査が可能です。

🟡 🤝 エージェント 2026年5月8日 · 2 分で読めます

arXiv:2605.05191: LongSeekerがContext-ReActフレームワークでBrowseCompにて61.5%を達成

編集イラスト：2605.05191: LongSeekerがContext-ReActフレームワークでBrowseCompにて61.5%を達成

研究者らは、5つの動的コンテキスト管理オペレーションを持つContext-ReActフレームワークを使用した長期検索エージェントLongSeekerを発表しました。このモデルはBrowseCompベンチマークで61.5%を達成し、Tongyi DeepResearchを18ポイント上回りました。

🟡 🤝 エージェント 2026年5月8日 · 2 分で読めます

CNCF: KubernetesバグフィックスにおけるAIエージェントの3つのデータ取得戦略を比較

Editorial illustration: KubernetesバグフィックスにおけるAIエージェントの3つのデータ取得戦略を比較

CNCFのベンチマークが、実際のKubernetesバグを修正するAIエージェント向けのRAG、ハイブリッド、純粋ローカル取得の3戦略を比較。RAGが最速（1分16秒）だが、主要ボトルネックは速度でもコストでもなく「スコープディスカバリー」——エージェントが複数ファイルにわたる影響コードを特定する能力——だった。

🏥 実践 (1)

🟡 🏥 実践 2026年5月8日 · 2 分で読めます

GitHub: AIプルリクエストをレビューするための5つのリスクと10分フレームワーク

編集イラスト：AIプルリクエストをレビューするための5つのリスクと10分フレームワーク

GitHubはAI生成コードのレビューに関する実践的ガイドを公開し、5つの重要なリスクと10分間の構造化されたコードレビューフレームワークを定義しました。プラットフォーム上の5件に1件以上のプルリクエストにエージェントが関与しています。

🛡️ セキュリティ (2)

🔴 🛡️ セキュリティ 2026年5月8日 · 2 分で読めます

OpenAI: GPT-5.5とGPT-5.5-CyberがTrusted Access for Cyberプログラムを拡大

編集イラスト：GPT-5.5とGPT-5.5-CyberがTrusted Access for Cyberプログラムを拡大

OpenAIはTrusted Access for Cyber（TAC）プログラムを数千人の確認済み防御的セキュリティ研究者と、重要なソフトウェアインフラを保護する数百のチームに拡大しました。プログラムでは制限が緩和されたGPT-5.5と、リバースエンジニアリングとマルウェア分析に特化したGPT-5.5-Cyberを導入しています。

🟡 🛡️ セキュリティ 2026年5月8日 · 2 分で読めます

arXiv:2605.04572: SQSDが無害なファインチューニングもモデルの安全性を損なうことを発見

編集イラスト：2605.04572: SQSDが無害なファインチューニングもモデルの安全性を損なうことを発見

ICML 2026に採択されたこの論文は、SQSD — ファインチューニング中の安全性劣化に対する個々のサンプルの寄与を定量化する手法を発表しています。研究者らは、一見無害なファインチューニングサンプルも累積的にパラメータを「危険アライン」方向にシフトさせることを示しました。

← 前日翌日 →