2026年5月6日水曜日

16 件 — 🔴 2 重大 , 🟡 11 重要 , 🟢 3 注目

← 前日 翌日 →

🤖 モデル (4)

🔴 🤖 モデル 2026年5月6日 · 2 分で読めます

OpenAI: GPT-5.5 Instant が ChatGPT の新しいデフォルトモデルに、幻覚を削減

編集イラスト:青い背景に GPT-5.5 Instant が新しいデフォルトモデルとして表示された ChatGPT インターフェース

GPT-5.5 Instant は OpenAI が 2026 年 5 月 5 日に発表した新しい ChatGPT のデフォルトモデルです。より賢く正確な回答、幻覚の削減、個性化の向上をもたらし、同時にシステムカードも公開されました。

🟡 🤖 モデル 2026年5月6日 · 2 分で読めます

arXiv:2605.03871: EvoLM — 外部監督なしで自己改善する言語モデル

編集イラスト:外部監督なしにスコアと改善を交換するフィードバックループ内の2つの言語モデル

EvoLMは外部監督を排除するポストトレーニング手法です——Qwen3-8BルーブリックジェネレーターはRewardBench-2でGPT-4.1を25.7%上回り、SkyWork-RMを16%上回ります。訓練されたポリシーはOLMo3-Adaptベンチマークで69.3%を達成します。

🟡 🤖 モデル 2026年5月6日 · 2 分で読めます

Google: Gemini API File Search が画像とテキストのマルチモーダル検索に対応

編集イラスト:Gemini API が埋め込みモデルを通じて画像とテキストを共通のセマンティック検索に組み合わせている

Google が Gemini API の File Search をマルチモーダル検索に拡張し、gemini-embedding-2 モデルを通じて画像とテキスト文書のネイティブな埋め込みと検索を可能にしました。2 つの新しい grounding フィールドと Batch API 向けのイベント駆動型 webhook サポートが追加されました。

🟡 🤖 モデル 2026年5月6日 · 2 分で読めます

Microsoft Research: DroidSpeak がファインチューニング済み LLM バリアント間で KV キャッシュを共有し、4× の高いスループットを実現

編集イラスト:データセンターで複数のファインチューニング済み LLM バリアント間の KV キャッシュ共有の図

Microsoft Research が NSDI 2026 で DroidSpeak を発表しました。これはアーキテクチャが同一のファインチューニング済み LLM バリアント間で KV キャッシュを共有するシステムで、数十のドメインモデルを持つエンタープライズシナリオで最大 4× の高いスループットを達成し、品質の低下は最小限です。

📦 オープンソース (1)

⚖️ 規制 (2)

🤝 エージェント (4)

🟡 🤝 エージェント 2026年5月6日 · 2 分で読めます

Anthropic: 10 種類の金融サービス向けエージェントテンプレートを提供、Claude Opus 4.7 が Vals AI Finance ベンチマークで 64.37% を達成

編集イラスト:リサーチとオペレーションの 2 グループに分けられた金融エージェントアイコン付きの 10 枚の抽象カード

Anthropic が金融サービス向けの 10 種類のエージェントテンプレートを公開しました。pitchbook ビルダー、KYC スクリーナー、月末決算ツールが含まれます。テンプレートは Claude Cowork と Claude Code のプラグインとして提供され、Claude Opus 4.7 は Vals AI Finance ベンチマークで 64.37% を達成しています。

🟡 🤝 エージェント 2026年5月6日 · 2 分で読めます

arXiv:2605.03675: MEMTIER — 五層メモリアーキテクチャが長期エージェントに記憶力を取り戻す

編集イラスト:エピソードJSONLからセマンティックデータベースへのデータフローで接続された5つの水平メモリ層

MEMTIERは長期自律エージェント向けの五層メモリアーキテクチャです——LongMemEval-SベンチマークでQwen2.5-7Bを使用すると精度が0.050から0.382に跳ね上がり、72時間の動作後もツール実行成功率が低下しなくなります。

🟡 🤝 エージェント 2026年5月6日 · 2 分で読めます

AWS: AgentCore Browser が OS レベルのアクションを取得——8 つの新しいプリミティブ

編集イラスト:Amazon Bedrock AgentCore 環境でエージェントがブラウザの境界外のシステムダイアログをクリックしている

AWS は 5 月 5 日に Amazon Bedrock AgentCore Browser の OS レベルアクションを発表しました。これにより、エージェントが DOM の範囲外でオペレーティングシステムのネイティブインターフェースと対話できるようになります。8 つのアクションとアクション・スクリーンショット・リアクションループが導入され、追加設定なしで利用可能です。

🟢 🤝 エージェント 2026年5月6日 · 2 分で読めます

arXiv:2605.02503: DataClaw——探索的データ分析における AI エージェントのプロセス品質を測る過程指向ベンチマーク

編集イラスト:AI エージェントが中間結果を含むインタラクティブなノートブックで探索的データ分析のステップを案内している

DataClaw は、AI エージェントが探索的データ分析においてどのように作業するかの完全なプロセスを評価する新しいベンチマークです。最終的な答えだけでなく、誤った方法で正しい結果に到達するエージェントの弱点を明らかにします。

🔧 ハードウェア (1)

🏥 実践 (2)

💬 コミュニティ (1)

🛡️ セキュリティ (1)

← 前日 翌日 →