ArXiv:Process Reward Agents——リアルタイムフィードバックで再トレーニングなしにAIの医療推論を改善
研究者がProcess Reward Agents(PRA)を発表しました。医療分野でのAI推論中にステップごとのリアルタイムフィードバックを提供する新しいアプローチです。既存のモデルに再トレーニングなしで適用でき、医療ベンチマークで顕著な成果を上げています。
14 件 — 🔴 2 重大 , 🟡 9 重要 , 🟢 3 注目
CloudflareがOpenAIのGPT-5.4およびCodexモデルを新しいAgent Cloudプラットフォームに統合し、エンタープライズユーザーが実際のビジネスタスク向けAIエージェントを構築、デプロイ、スケーリングできるようになりました。速度とセキュリティに重点を置いています。
Allen Institute for AIが、知識テストでのAIパフォーマンスと実際の科学的発見能力との間の劇的なギャップを明らかにする2つのベンチマークを分析しました。モデルは教科書レベルで80%に達する一方、複雑な科学タスクでは20%に低下します。
新しいベンチマークHiL-Benchは、AIエージェントが自らの限界を認識し、推測する代わりに人間の助けを求める能力を測定します。結果によると、フロンティアモデルでさえ助けが必要なタイミングの判断が不十分ですが、的を絞ったトレーニングでこの能力を改善できることが示されています。
GoogleはChromeにSkills機能を導入しました。AIプロンプトをワンクリックで再利用可能なツールとして保存できます。この機能はGeminiを活用し、Mac、Windows、ChromeOSプラットフォームで動作します。
Google ResearchがNYUと共同でVantageを発表しました。クリティカルシンキングや創造性など測定が困難な人間のスキルを生成AIで評価する実験的プラットフォームです。AI評価は人間の専門家と同等の一致度を示しました。
Amazon Web Servicesが、AWS Lambdaを使用してAmazon Novaモデルをカスタマイズするためのスケーラブルな報酬関数の作成に関する詳細な技術ガイドを公開しました。ガイドはRLVRおよびRLAIFアプローチ、多次元報酬システムの設計、CloudWatchによるモニタリングをカバーしています。
Perplexityは2026年4月にいくつかのAPIアップデートを発表しました。ビジュアルAIワークフロー向けのネイティブn8n統合、AWS Marketplaceでの提供による簡便な調達、および認証不要の新しい/v1/modelsエンドポイントです。
英国AI安全研究所が、Anthropic社のClaude Mythos Previewモデルの評価結果を公開しました。自律的なサイバー攻撃能力において大幅な進歩が示されています。このモデルは、企業ネットワークに対する32ステップの完全な攻撃シミュレーションを初めて完遂したAIモデルです。
新しい研究により、言語モデルがマルチエージェント協調ゲームにおいて高いベースライン類似性(モノカルチャー)を示し、分岐が有利な場合でも多様な戦略を維持することが困難であることが明らかになりました。複数のAIエージェントを使用するシステムに重要な影響を与えます。
OpenKedgeは、自律型AIエージェントのための新しいセキュリティプロトコルで、変更を実行する前に明示的な許可を要求します。暗号化された証拠チェーンを使用して完全な監査を実現し、大規模な不安全な操作を防止します。
GitHubがAIエージェントのセキュリティに焦点を当てたSecure Code Gameの第4シーズンを開始しました。プレイヤーは5つの段階的なレベルを通じて、プロンプトインジェクション、メモリポイズニング、ツール悪用などの脆弱性の攻略を学びます。