2026年4月14日火曜日

14 件 — 🔴 2 重大 , 🟡 9 重要 , 🟢 3 注目

🤖 モデル (1)

🟡 🤖 モデル 2026年4月14日 · 2 分で読めます

ArXiv：Process Reward Agents——リアルタイムフィードバックで再トレーニングなしにAIの医療推論を改善

研究者がProcess Reward Agents（PRA）を発表しました。医療分野でのAI推論中にステップごとのリアルタイムフィードバックを提供する新しいアプローチです。既存のモデルに再トレーニングなしで適用でき、医療ベンチマークで顕著な成果を上げています。

⚖️ 規制 (1)

🟡 ⚖️ 規制 2026年4月14日 · 2 分で読めます

Anthropic：LTBTトラストが取締役会で過半数を占める — 元ノバルティスCEOが任命

Anthropicは、Long-Term Benefit Trustを通じてノバルティスCEOのVas Narasimhanを取締役会に任命したと発表しました。LTBTの取締役が過半数を占めることで、同社の安全性ミッションへの監督が強化されます。

🤝 エージェント (3)

🔴 🤝 エージェント 2026年4月14日 · 2 分で読めます

OpenAIとCloudflare：GPT-5.4とCodexがエンタープライズ向け新Agent Cloudプラットフォームを始動

CloudflareがOpenAIのGPT-5.4およびCodexモデルを新しいAgent Cloudプラットフォームに統合し、エンタープライズユーザーが実際のビジネスタスク向けAIエージェントを構築、デプロイ、スケーリングできるようになりました。速度とセキュリティに重点を置いています。

🟡 🤝 エージェント 2026年4月14日 · 2 分で読めます

AI2：AIエージェントは教科書レベルの科学の80%を解けるが、本物の科学的問題では20%にとどまる

Allen Institute for AIが、知識テストでのAIパフォーマンスと実際の科学的発見能力との間の劇的なギャップを明らかにする2つのベンチマークを分析しました。モデルは教科書レベルで80%に達する一方、複雑な科学タスクでは20%に低下します。

🟡 🤝 エージェント 2026年4月14日 · 2 分で読めます

ArXiv HiL-Bench：AIエージェントは助けを求めるべきタイミングを知っていますか？

新しいベンチマークHiL-Benchは、AIエージェントが自らの限界を認識し、推測する代わりに人間の助けを求める能力を測定します。結果によると、フロンティアモデルでさえ助けが必要なタイミングの判断が不十分ですが、的を絞ったトレーニングでこの能力を改善できることが示されています。

🏥 実践 (4)

🟡 🏥 実践 2026年4月14日 · 2 分で読めます

Google Chrome：AI Skillsがプロンプトをワンクリックツールに変換

GoogleはChromeにSkills機能を導入しました。AIプロンプトをワンクリックで再利用可能なツールとして保存できます。この機能はGeminiを活用し、Mac、Windows、ChromeOSプラットフォームで動作します。

🟡 🏥 実践 2026年4月14日 · 2 分で読めます

Google Research：Vantage——AIアバターとの対話でクリティカルシンキングと創造性を評価するAIプラットフォーム

Google ResearchがNYUと共同でVantageを発表しました。クリティカルシンキングや創造性など測定が困難な人間のスキルを生成AIで評価する実験的プラットフォームです。AI評価は人間の専門家と同等の一致度を示しました。

🟢 🏥 実践 2026年4月14日 · 2 分で読めます

AWS：Amazon Novaモデルのファインチューニングに向けたLambdaによる報酬関数の構築方法

Amazon Web Servicesが、AWS Lambdaを使用してAmazon Novaモデルをカスタマイズするためのスケーラブルな報酬関数の作成に関する詳細な技術ガイドを公開しました。ガイドはRLVRおよびRLAIFアプローチ、多次元報酬システムの設計、CloudWatchによるモニタリングをカバーしています。

🟢 🏥 実践 2026年4月14日 · 2 分で読めます

Perplexity API：n8n統合、AWS Marketplaceおよび新しい/v1/modelsエンドポイント

Perplexityは2026年4月にいくつかのAPIアップデートを発表しました。ビジュアルAIワークフロー向けのネイティブn8n統合、AWS Marketplaceでの提供による簡便な調達、および認証不要の新しい/v1/modelsエンドポイントです。

🛡️ セキュリティ (4)

🔴 🛡️ セキュリティ 2026年4月14日 · 2 分で読めます

英国AISI：Claude Mythos Previewが専門家レベルのサイバータスクで73%を達成——ネットワーク攻撃を完遂した初のモデル

英国AI安全研究所が、Anthropic社のClaude Mythos Previewモデルの評価結果を公開しました。自律的なサイバー攻撃能力において大幅な進歩が示されています。このモデルは、企業ネットワークに対する32ステップの完全な攻撃シミュレーションを初めて完遂したAIモデルです。

🟡 🛡️ セキュリティ 2026年4月14日 · 2 分で読めます

ArXiv：アルゴリズムのモノカルチャー——LLMは分岐すべきときに分岐できない

新しい研究により、言語モデルがマルチエージェント協調ゲームにおいて高いベースライン類似性（モノカルチャー）を示し、分岐が有利な場合でも多様な戦略を維持することが困難であることが明らかになりました。複数のAIエージェントを使用するシステムに重要な影響を与えます。

🟡 🛡️ セキュリティ 2026年4月14日 · 2 分で読めます

ArXiv OpenKedge：AIエージェントのすべてのアクションに事前許可を要求する暗号プロトコル

OpenKedgeは、自律型AIエージェントのための新しいセキュリティプロトコルで、変更を実行する前に明示的な許可を要求します。暗号化された証拠チェーンを使用して完全な監査を実現し、大規模な不安全な操作を防止します。

🟡 🛡️ セキュリティ 2026年4月14日 · 2 分で読めます

GitHub：インタラクティブなセキュリティゲームでAIエージェントのハッキングを学ぶ

GitHubがAIエージェントのセキュリティに焦点を当てたSecure Code Gameの第4シーズンを開始しました。プレイヤーは5つの段階的なレベルを通じて、プロンプトインジェクション、メモリポイズニング、ツール悪用などの脆弱性の攻略を学びます。

✨ 注目トピック (1)

🟢 ✨ 注目トピック 2026年4月14日 · 2 分で読めます

ArXiv Camera Artist：映画言語を用いて動画を生成するマルチエージェントAIシステム

研究者がCamera Artistを発表しました。実際の映画制作ワークフローをモデル化してナラティブ動画を生成するマルチエージェントシステムです。監督、撮影監督、編集者をシミュレートする専門AIエージェントを連携させ、一貫したビジュアルストーリーテリングを実現します。

← 前日