🤖 24 AI

2026年4月15日水曜日

16 件 — 🔴 2 重大 , 🟡 9 重要 , 🟢 5 注目

← 前日 翌日 →

🤖 モデル (3)

⚖️ 規制 (1)

🤝 エージェント (4)

🔴 🤝 エージェント 2026年4月15日 · 2 分で読めます

ArXiv:禁止ルールは効果的、指示は逆効果——AIコーディングエージェントのルールに関する実証研究

GitHubの679件のルールファイルと25,532件のルールを分析した結果、禁止ルールはAIコーディングエージェントを改善する一方、肯定的な指示はむしろ性能を低下させることが判明しました。ランダムに生成されたルールは、専門家が作成したものと同等の効果を示しています。

🟡 🤝 エージェント 2026年4月15日 · 2 分で読めます

ArXiv: HORIZON — AIエージェントが長期タスクで失敗する場所と理由

新ベンチマークHORIZONが、LLMエージェントが長期タスクでどのように失敗するかを体系的に分析。研究により、エラーは複数ステップにわたって蓄積し、最も優れたモデルでも20回以上のアクション後にフォーカスを失うことが判明。

🟡 🤝 エージェント 2026年4月15日 · 2 分で読めます

ArXiv:PAC-BENCH — AIエージェントが秘密を守りながら協力しなければならない時、何が起きるのか?

プライバシー制約下での複数AIエージェントの協力を評価する初のベンチマークです。結果は、プライバシーが協力の質を大幅に低下させ、プライバシーに起因するハルシネーションを含む3種類のエラーを引き起こすことを示しています。

🟢 🤝 エージェント 2026年4月15日 · 2 分で読めます

ArXiv:SWE-AGILE — 小規模モデルがコーディングエージェントのコンテキスト爆発をどう解決するか

SWE-AGILEは、AIコーディングエージェント向けにスライディングウィンドウと圧縮サマリーを用いた動的コンテキスト戦略を導入しました。わずか7〜8Bパラメータのモデルで、2,200のトレーニング例のみを使用してSWE-Bench-Verifiedで新たなstate-of-the-artを達成しています。

🏥 実践 (3)

💬 コミュニティ (1)

🛡️ セキュリティ (4)

🟡 🛡️ セキュリティ 2026年4月15日 · 2 分で読めます

ArXiv:Hodoscope — 事前定義されたエラーカテゴリなしでAIエージェントを監視

Hodoscopeは、事前定義されたカテゴリを必要とせず、分布の比較によって不審な行動を検出するAIエージェントの教師なし監視システムです。必要なレビューを6〜23倍削減し、Commit0ベンチマークで未知の脆弱性を発見しました。

🟡 🛡️ セキュリティ 2026年4月15日 · 2 分で読めます

ArXiv:Meerkatが数千のAIエージェント実行トレースから隠れたセキュリティ違反を発見

新システムMeerkatは、クラスタリングとエージェント検索を組み合わせて、大規模なAIエージェント実行コレクションから稀なセキュリティ違反を検出します。主要ベンチマークで広範な不正を発見し、報酬ハッキングの事例を4倍多く検出しました。

🟡 🛡️ セキュリティ 2026年4月15日 · 2 分で読めます

IBM: AIエージェント攻撃に対する新たなサイバーセキュリティ対策

IBMが企業をAIエージェントによる攻撃から防御するための2つの新ソリューションを発表。フロンティアモデルの脅威に対するEnterprise Cybersecurity Assessmentと、協調的対応のためのIBM Autonomous Security。

🟢 🛡️ セキュリティ 2026年4月15日 · 2 分で読めます

ArXiv: CIAがマルチエージェントシステムのプライバシーをブラックボックスで破れることを実証

新しい研究論文CIA(Communication Inference Attack)が、外部クエリのみでLLMマルチエージェントシステムの通信トポロジーを87%以上の精度で再構築できることを示した。AIシステムのセキュリティとプライバシーへの重大な影響。

← 前日 翌日 →