OpenAI: GPT-5.5 Instant が ChatGPT の新しいデフォルトモデルに、幻覚を削減
GPT-5.5 Instant は OpenAI が 2026 年 5 月 5 日に発表した新しい ChatGPT のデフォルトモデルです。より賢く正確な回答、幻覚の削減、個性化の向上をもたらし、同時にシステムカードも公開されました。
16 件 — 🔴 2 重大 , 🟡 11 重要 , 🟢 3 注目
GPT-5.5 Instant は OpenAI が 2026 年 5 月 5 日に発表した新しい ChatGPT のデフォルトモデルです。より賢く正確な回答、幻覚の削減、個性化の向上をもたらし、同時にシステムカードも公開されました。
EvoLMは外部監督を排除するポストトレーニング手法です——Qwen3-8BルーブリックジェネレーターはRewardBench-2でGPT-4.1を25.7%上回り、SkyWork-RMを16%上回ります。訓練されたポリシーはOLMo3-Adaptベンチマークで69.3%を達成します。
Google が Gemini API の File Search をマルチモーダル検索に拡張し、gemini-embedding-2 モデルを通じて画像とテキスト文書のネイティブな埋め込みと検索を可能にしました。2 つの新しい grounding フィールドと Batch API 向けのイベント駆動型 webhook サポートが追加されました。
Microsoft Research が NSDI 2026 で DroidSpeak を発表しました。これはアーキテクチャが同一のファインチューニング済み LLM バリアント間で KV キャッシュを共有するシステムで、数十のドメインモデルを持つエンタープライズシナリオで最大 4× の高いスループットを達成し、品質の低下は最小限です。
新しい研究は、臨床LLMの安全性が精度と同じスケーリング則に従わないことを示しています——RAGのクリーンな証拠が精度を73.5%から94.1%に高め、高リスクエラーを12%から2.6%に削減する効果がモデルサイズの増大を上回ります。
英国の AI Security Institute が 5 月 5 日に Microsoft とのフロンティア AI 安全に関するパートナーシップを発表しました。協力は 3 つの研究分野をカバーします:高リスク能力の評価、防護措置のテスト、対話型 AI の社会的回復力研究。
Anthropic が金融サービス向けの 10 種類のエージェントテンプレートを公開しました。pitchbook ビルダー、KYC スクリーナー、月末決算ツールが含まれます。テンプレートは Claude Cowork と Claude Code のプラグインとして提供され、Claude Opus 4.7 は Vals AI Finance ベンチマークで 64.37% を達成しています。
MEMTIERは長期自律エージェント向けの五層メモリアーキテクチャです——LongMemEval-SベンチマークでQwen2.5-7Bを使用すると精度が0.050から0.382に跳ね上がり、72時間の動作後もツール実行成功率が低下しなくなります。
AWS は 5 月 5 日に Amazon Bedrock AgentCore Browser の OS レベルアクションを発表しました。これにより、エージェントが DOM の範囲外でオペレーティングシステムのネイティブインターフェースと対話できるようになります。8 つのアクションとアクション・スクリーンショット・リアクションループが導入され、追加設定なしで利用可能です。
DataClaw は、AI エージェントが探索的データ分析においてどのように作業するかの完全なプロセスを評価する新しいベンチマークです。最終的な答えだけでなく、誤った方法で正しい結果に到達するエージェントの弱点を明らかにします。
IBMはContext StudioのローンチによりEnterprise Advantageプラットフォームを拡張しました。これはデジタル主権を保護しながら組織独自のデータに基づいてAIエージェントを構築するツールです。Providence Healthは採用管理時間を90%削減し、IBMは18ヶ月以内に運用コストを25%以上削減すると予測しています。
AnthropicはClaude Code v2.1.131ホットフィックスリリースを公開しました。ハードコードされたビルドパスによるWindowsでのVS Code拡張機能の有効化失敗と、Mantle推論エンドポイントへのx-api-keyヘッダーの欠如という2つのバグを修正します。すべての主要プラットフォームのバイナリが公開されました。