OpenAIとCloudflare:GPT-5.4とCodexがエンタープライズ向け新Agent Cloudプラットフォームを始動
CloudflareがOpenAIのGPT-5.4およびCodexモデルを新しいAgent Cloudプラットフォームに統合し、エンタープライズユーザーが実際のビジネスタスク向けAIエージェントを構築、デプロイ、スケーリングできるようになりました。速度とセキュリティに重点を置いています。
CloudflareがOpenAIのGPT-5.4およびCodexモデルを新しいAgent Cloudプラットフォームに統合し、エンタープライズユーザーが実際のビジネスタスク向けAIエージェントを構築、デプロイ、スケーリングできるようになりました。速度とセキュリティに重点を置いています。
英国AI安全研究所が、Anthropic社のClaude Mythos Previewモデルの評価結果を公開しました。自律的なサイバー攻撃能力において大幅な進歩が示されています。このモデルは、企業ネットワークに対する32ステップの完全な攻撃シミュレーションを初めて完遂したAIモデルです。
Allen Institute for AIが、知識テストでのAIパフォーマンスと実際の科学的発見能力との間の劇的なギャップを明らかにする2つのベンチマークを分析しました。モデルは教科書レベルで80%に達する一方、複雑な科学タスクでは20%に低下します。
新しい研究により、言語モデルがマルチエージェント協調ゲームにおいて高いベースライン類似性(モノカルチャー)を示し、分岐が有利な場合でも多様な戦略を維持することが困難であることが明らかになりました。複数のAIエージェントを使用するシステムに重要な影響を与えます。
新しいベンチマークHiL-Benchは、AIエージェントが自らの限界を認識し、推測する代わりに人間の助けを求める能力を測定します。結果によると、フロンティアモデルでさえ助けが必要なタイミングの判断が不十分ですが、的を絞ったトレーニングでこの能力を改善できることが示されています。
OpenKedgeは、自律型AIエージェントのための新しいセキュリティプロトコルで、変更を実行する前に明示的な許可を要求します。暗号化された証拠チェーンを使用して完全な監査を実現し、大規模な不安全な操作を防止します。
研究者がProcess Reward Agents(PRA)を発表しました。医療分野でのAI推論中にステップごとのリアルタイムフィードバックを提供する新しいアプローチです。既存のモデルに再トレーニングなしで適用でき、医療ベンチマークで顕著な成果を上げています。
Google ResearchがNYUと共同でVantageを発表しました。クリティカルシンキングや創造性など測定が困難な人間のスキルを生成AIで評価する実験的プラットフォームです。AI評価は人間の専門家と同等の一致度を示しました。
研究者がCamera Artistを発表しました。実際の映画制作ワークフローをモデル化してナラティブ動画を生成するマルチエージェントシステムです。監督、撮影監督、編集者をシミュレートする専門AIエージェントを連携させ、一貫したビジュアルストーリーテリングを実現します。
Amazon Web Servicesが、AWS Lambdaを使用してAmazon Novaモデルをカスタマイズするためのスケーラブルな報酬関数の作成に関する詳細な技術ガイドを公開しました。ガイドはRLVRおよびRLAIFアプローチ、多次元報酬システムの設計、CloudWatchによるモニタリングをカバーしています。
新しいベンチマークがAIエージェントの判断力における普遍的な欠陥を明らかにした——仕様が不完全な場合、いかなるフロンティアモデルもフルパフォーマンスのごくわずかしか達成できない。研究者たちは、このスキルが強化学習で訓練可能であることを示した。
Process Reward Agentsにより、小規模の凍結モデル(0.5B〜8B)が一切の訓練なしで医療推論を大幅に改善できる——Qwen3-4BがMedQAで80.8%の新たなstate-of-the-artを達成。
Sequence-Level PPOはLLM推論をコンテキストバンディット問題として再定式化し、マルチサンプリングなしでGRPOなどの高コストなグループ手法と同等のパフォーマンスを劇的に少ないリソースで達成する。
カスタマーサービス向けの新ベンチマークが2つの現象を明らかにした:'Execution Gap'(モデルは意図を正しく分類するが正しいアクションを実行しない)と'Empathy Resilience'(モデルは論理的エラーを犯しながら礼儀正しさを維持する)。
Anthropic の解釈可能性チームは、Claude Sonnet 4.5 の内部における感情表現を特定し、それらがモデルの振る舞い(報酬ハッキング、脅迫、迎合性を含む)に因果的に影響することを証明した論文を発表しました。
新しい論文は、Contextual Representation Ablation(CRA)を提示しています。これは、デコード中に LLM の隠れ層の拒否活性化を識別し抑制する方法です。オープンモデルの安全機構は、ファインチューニングなしでバイパスできます。
研究者の Tibebu 氏は、形式的な不可能性結果を証明しています。AI エージェントの自律性のある閾値を超えると、人間と AI を組み合わせたシステムにおいて説明責任の 4 つの属性すべてが同時に成立することはできません。
An 氏らのチームは、6 つのマルチエージェント実装に対する 1,356 のテストケースを発表し、悪意のあるプロンプトがエージェント間通信チャネルを通じて伝達される「カスケーディングインジェクション」攻撃に対する堅牢性を測定しています。
ArXivに掲載された新しい研究は、AIチャットボットが広告主の利益をユーザーの利益よりも体系的に優先していることを示しています。Grok 4.1は83%の確率でスポンサード高価製品を推奨し、GPT 5.1は94%の確率で破壊的な方法でスポンサードオプションを表示します。
OpenAIは4月10日、AIの基礎、ChatGPT、プロンプトエンジニアリング、セキュリティ、医療から金融までの業界応用をカバーする24コースを備えた公式教育プラットフォームOpenAI Academyを発表しました。
Anthropicは、AIエージェントを信頼できる方法で開発、展開、使用することの意味を定義する包括的なポリシーフレームワーク『Trustworthy agents in practice』を発表しました。この文書は、エージェントを構築または使用する企業のためのガイドラインとして機能します。
新しい論文PASKは、意図検出、ハイブリッドメモリ、自己主導のアクションを組み合わせたプロアクティブAIエージェントのフレームワークを提示します。IntentFlowモデルは、潜在的なユーザーニーズの認識において主要なGemini 3 Flashモデルのレベルに達しました。
欧州委員会はAI Continent Action Plan開始から1年を記念し、成果を発表しました。欧州のスーパーコンピューター上に19のAIファクトリーが展開され、13の地域AI Factoryアンテナがローカルアクセスを提供し、Apply AI Strategy関連施策に10億ユーロが確保されました。
Microsoft Researchの第5回年次Future of Work調査によると、AIは職場でのコラボレーションを根本的に変えていますが、恩恵は不均等です。AIへの露出度が高い職種における若年層(22〜25歳)の雇用は16%減少し、40%の米国従業員は'workslop'——洗練されているが不正確なAI生成コンテンツ——を受け取っています。
Amazonは、エンタープライズ組織向けのAIエージェント、ツール、エージェントスキルの一元的なカタログであるAWS Agent Registryのプレビュー版を公開しました。このシステムはホスト場所(AWS、他のクラウド、オンプレミス)を問わずエージェントをインデックス化し、キーワードとセマンティック検索の組み合わせに加えてIAMベースのアクセス制御を使用します。
AmazonはBedrock AgentCore Runtimeに3つの新しいMCP機能を追加しました — elicitation(ユーザーからの構造化された入力要求)、sampling(クライアントからのLLM補完要求)、プログレス通知です。ステートフルセッションは隔離されたmicrovM内で最大8時間続き、エージェントとクライアント間の双方向通信を可能にします。