24 AI

AI2：AIエージェントは教科書レベルの科学の80%を解けるが、本物の科学的問題では20%にとどまる

Tue, 14 Apr 2026 00:00:00 GMT

Allen Institute for AIが、知識テストでのAIパフォーマンスと実際の科学的発見能力との間の劇的なギャップを明らかにする2つのベンチマークを分析しました。モデルは教科書レベルで80%に達する一方、複雑な科学タスクでは20%に低下します。

Anthropic：LTBTトラストが取締役会で過半数を占める — 元ノバルティスCEOが任命

Tue, 14 Apr 2026 00:00:00 GMT

Anthropicは、Long-Term Benefit Trustを通じてノバルティスCEOのVas Narasimhanを取締役会に任命したと発表しました。LTBTの取締役が過半数を占めることで、同社の安全性ミッションへの監督が強化されます。

ArXiv：アルゴリズムのモノカルチャー——LLMは分岐すべきときに分岐できない

Tue, 14 Apr 2026 00:00:00 GMT

新しい研究により、言語モデルがマルチエージェント協調ゲームにおいて高いベースライン類似性（モノカルチャー）を示し、分岐が有利な場合でも多様な戦略を維持することが困難であることが明らかになりました。複数のAIエージェントを使用するシステムに重要な影響を与えます。

ArXiv Camera Artist：映画言語を用いて動画を生成するマルチエージェントAIシステム

Tue, 14 Apr 2026 00:00:00 GMT

研究者がCamera Artistを発表しました。実際の映画制作ワークフローをモデル化してナラティブ動画を生成するマルチエージェントシステムです。監督、撮影監督、編集者をシミュレートする専門AIエージェントを連携させ、一貫したビジュアルストーリーテリングを実現します。

ArXiv HiL-Bench：AIエージェントは助けを求めるべきタイミングを知っていますか？

Tue, 14 Apr 2026 00:00:00 GMT

新しいベンチマークHiL-Benchは、AIエージェントが自らの限界を認識し、推測する代わりに人間の助けを求める能力を測定します。結果によると、フロンティアモデルでさえ助けが必要なタイミングの判断が不十分ですが、的を絞ったトレーニングでこの能力を改善できることが示されています。

ArXiv OpenKedge：AIエージェントのすべてのアクションに事前許可を要求する暗号プロトコル

Tue, 14 Apr 2026 00:00:00 GMT

OpenKedgeは、自律型AIエージェントのための新しいセキュリティプロトコルで、変更を実行する前に明示的な許可を要求します。暗号化された証拠チェーンを使用して完全な監査を実現し、大規模な不安全な操作を防止します。

ArXiv：Process Reward Agents——リアルタイムフィードバックで再トレーニングなしにAIの医療推論を改善

Tue, 14 Apr 2026 00:00:00 GMT

研究者がProcess Reward Agents（PRA）を発表しました。医療分野でのAI推論中にステップごとのリアルタイムフィードバックを提供する新しいアプローチです。既存のモデルに再トレーニングなしで適用でき、医療ベンチマークで顕著な成果を上げています。

AWS：Amazon Novaモデルのファインチューニングに向けたLambdaによる報酬関数の構築方法

Tue, 14 Apr 2026 00:00:00 GMT

Amazon Web Servicesが、AWS Lambdaを使用してAmazon Novaモデルをカスタマイズするためのスケーラブルな報酬関数の作成に関する詳細な技術ガイドを公開しました。ガイドはRLVRおよびRLAIFアプローチ、多次元報酬システムの設計、CloudWatchによるモニタリングをカバーしています。

GitHub：インタラクティブなセキュリティゲームでAIエージェントのハッキングを学ぶ

Tue, 14 Apr 2026 00:00:00 GMT

GitHubがAIエージェントのセキュリティに焦点を当てたSecure Code Gameの第4シーズンを開始しました。プレイヤーは5つの段階的なレベルを通じて、プロンプトインジェクション、メモリポイズニング、ツール悪用などの脆弱性の攻略を学びます。

Google Chrome：AI Skillsがプロンプトをワンクリックツールに変換

Tue, 14 Apr 2026 00:00:00 GMT

GoogleはChromeにSkills機能を導入しました。AIプロンプトをワンクリックで再利用可能なツールとして保存できます。この機能はGeminiを活用し、Mac、Windows、ChromeOSプラットフォームで動作します。

Google Research：Vantage——AIアバターとの対話でクリティカルシンキングと創造性を評価するAIプラットフォーム

Tue, 14 Apr 2026 00:00:00 GMT

Google ResearchがNYUと共同でVantageを発表しました。クリティカルシンキングや創造性など測定が困難な人間のスキルを生成AIで評価する実験的プラットフォームです。AI評価は人間の専門家と同等の一致度を示しました。

OpenAIとCloudflare：GPT-5.4とCodexがエンタープライズ向け新Agent Cloudプラットフォームを始動

Tue, 14 Apr 2026 00:00:00 GMT

CloudflareがOpenAIのGPT-5.4およびCodexモデルを新しいAgent Cloudプラットフォームに統合し、エンタープライズユーザーが実際のビジネスタスク向けAIエージェントを構築、デプロイ、スケーリングできるようになりました。速度とセキュリティに重点を置いています。

Perplexity API：n8n統合、AWS Marketplaceおよび新しい/v1/modelsエンドポイント

Tue, 14 Apr 2026 00:00:00 GMT

Perplexityは2026年4月にいくつかのAPIアップデートを発表しました。ビジュアルAIワークフロー向けのネイティブn8n統合、AWS Marketplaceでの提供による簡便な調達、および認証不要の新しい/v1/modelsエンドポイントです。

英国AISI：Claude Mythos Previewが専門家レベルのサイバータスクで73%を達成——ネットワーク攻撃を完遂した初のモデル

Tue, 14 Apr 2026 00:00:00 GMT

英国AI安全研究所が、Anthropic社のClaude Mythos Previewモデルの評価結果を公開しました。自律的なサイバー攻撃能力において大幅な進歩が示されています。このモデルは、企業ネットワークに対する32ステップの完全な攻撃シミュレーションを初めて完遂したAIモデルです。

ArXiv HiL-Bench：いつ助けを求めるべきか分かるフロンティアモデルは一つもない

Mon, 13 Apr 2026 00:00:00 GMT

新しいベンチマークがAIエージェントの判断力における普遍的な欠陥を明らかにした——仕様が不完全な場合、いかなるフロンティアモデルもフルパフォーマンスのごくわずかしか達成できない。研究者たちは、このスキルが強化学習で訓練可能であることを示した。

ArXiv PRA：4Bモデルが医療ベンチマークで80.8%を達成——小規模モデルの新SOTA

Mon, 13 Apr 2026 00:00:00 GMT

Process Reward Agentsにより、小規模の凍結モデル（0.5B〜8B）が一切の訓練なしで医療推論を大幅に改善できる——Qwen3-4BがMedQAで80.8%の新たなstate-of-the-artを達成。

ArXiv SAGE：27のLLMをテスト——モデルは意図を理解するが正しく実行しない

Mon, 13 Apr 2026 00:00:00 GMT

カスタマーサービス向けの新ベンチマークが2つの現象を明らかにした：'Execution Gap'（モデルは意図を正しく分類するが正しいアクションを実行しない）と'Empathy Resilience'（モデルは論理的エラーを犯しながら礼儀正しさを維持する）。

ArXiv SPPO：シーケンスレベルPPOが長い推論チェーンにおけるクレジット割り当て問題を解決

Mon, 13 Apr 2026 00:00:00 GMT

Sequence-Level PPOはLLM推論をコンテキストバンディット問題として再定式化し、マルチサンプリングなしでGRPOなどの高コストなグループ手法と同等のパフォーマンスを劇的に少ないリソースで達成する。

Anthropic:Claude 4.5 における感情が報酬ハッキングと迎合的振る舞いに因果的に影響

Sun, 12 Apr 2026 00:00:00 GMT

Anthropic の解釈可能性チームは、Claude Sonnet 4.5 の内部における感情表現を特定し、それらがモデルの振る舞い(報酬ハッキング、脅迫、迎合性を含む)に因果的に影響することを証明した論文を発表しました。

ArXiv:人間と AI の集合体における完全な説明責任の数学的不可能性の証明

Sun, 12 Apr 2026 00:00:00 GMT

研究者の Tibebu 氏は、形式的な不可能性結果を証明しています。AI エージェントの自律性のある閾値を超えると、人間と AI を組み合わせたシステムにおいて説明責任の 4 つの属性すべてが同時に成立することはできません。

ArXiv ACIArena:AI エージェントチェーンに対するプロンプトインジェクション攻撃の初のベンチマーク

Sun, 12 Apr 2026 00:00:00 GMT

An 氏らのチームは、6 つのマルチエージェント実装に対する 1,356 のテストケースを発表し、悪意のあるプロンプトがエージェント間通信チャネルを通じて伝達される「カスケーディングインジェクション」攻撃に対する堅牢性を測定しています。

ArXiv IatroBench:AI の安全メカニズムが非専門家への助けを 13.1 パーセンテージポイント減少

Sun, 12 Apr 2026 00:00:00 GMT

新しい事前登録ベンチマークは、ユーザーがどのように自己紹介するかに応じて AI モデルが情報を差し控える程度を測定します。フロンティアモデルは、非専門家からの質問に対して専門家からの質問よりも質の高いガイダンスを 13.1 パーセンテージポイント少なく提供します。

ArXiv:LLM の助けを借りて Munkres のトポロジー教科書全体を Isabelle/HOL で形式化

Sun, 12 Apr 2026 00:00:00 GMT

Bryant 氏らのチームは、Munkres の教科書『General Topology』全体を Isabelle/HOL で形式的に検証するために LLM 支援パイプラインを使用しました。85,000 行以上の検証済みコードと 806 すべての形式的結果を網羅しています。

ArXiv:訓練なしの脱獄 — 研究者が推論時に AI の安全ガードレールを除去

Sun, 12 Apr 2026 00:00:00 GMT

新しい論文は、Contextual Representation Ablation(CRA)を提示しています。これは、デコード中に LLM の隠れ層の拒否活性化を識別し抑制する方法です。オープンモデルの安全機構は、ファインチューニングなしでバイパスできます。

CNCF の KubeCon EU から:チームの多様な視点を通じたプラットフォームエンジニアリング

Sun, 12 Apr 2026 00:00:00 GMT

VictoriaMetrics の Diana Todea さんは、アムステルダムの KubeCon EU から、チームの多様な視点がプラットフォームエンジニアリング(抽象化設計からチーム保持まで)にどのように影響するかについて書いています。

CNCF:高校生が KubeCon EU で講演 — Kubernetes と vLLM によるハリケーン予測

Sun, 12 Apr 2026 00:00:00 GMT

ノースカロライナ科学数学学校の Avery Yang さんは、アムステルダムで開催された 2026 年 KubeCon EU の最年少講演者の一人です。彼女は Kubernetes クラスタと vLLM を使った推論によるハリケーン予測のポスターを発表しました。

GitHub Copilot CLI:初心者向け公式ガイド — ターミナルからクラウドエージェントへのタスク委任

Sun, 12 Apr 2026 00:00:00 GMT

GitHub は 4 月 10 日、Copilot CLI ツールの公式チュートリアルを公開しました。ガイドは npm によるインストール、GitHub アカウントによる認証、実用的な例(クラウドエージェントへのタスク委任を含む)をカバーしています。

OpenAI:Axios 開発者ツールの侵害 — コード署名証明書をローテーション、ユーザーデータは安全

Sun, 12 Apr 2026 00:00:00 GMT

OpenAI は、開発ツール Axios に対するサプライチェーン攻撃に対する公式対応を発表しました。同社は macOS のコード署名証明書をローテーションし、ユーザーデータが侵害されていないことを確認しました。

Anthropicがポリシーフレームワーク『Trustworthy agents in practice』を発表

Sat, 11 Apr 2026 00:00:00 GMT

Anthropicは、AIエージェントを信頼できる方法で開発、展開、使用することの意味を定義する包括的なポリシーフレームワーク『Trustworthy agents in practice』を発表しました。この文書は、エージェントを構築または使用する企業のためのガイドラインとして機能します。

Apple Machine Learning ResearchがバルセロナでのCHI 2026カンファレンスに参加

Sat, 11 Apr 2026 00:00:00 GMT

Apple Machine Learning Researchは、4月13日から17日までバルセロナで開催されるACM CHI 2026カンファレンスへの参加を発表しました。Appleはヒューマンコンピュータインタラクション分野の新しい研究を発表します。