Anthropic: Claude Sonnet 4とOpus 4が6月15日に廃止へ
Anthropicがオリジナル版のClaude Sonnet 4およびClaude Opus 4の廃止を発表。両モデルは2026年6月15日にAPIから撤去される。開発チームは速やかに4.6バージョンへの移行が必要。
16 件 — 🔴 2 重大 , 🟡 9 重要 , 🟢 5 注目
Anthropicがオリジナル版のClaude Sonnet 4およびClaude Opus 4の廃止を発表。両モデルは2026年6月15日にAPIから撤去される。開発チームは速やかに4.6バージョンへの移行が必要。
LLM内部メカニズムの因果分析により、有害コンテンツがモデルの後半層で、主にMLPブロックを通じて生成されることが明らかになりました。最終層の少数のニューロンが有害な回答の制御メカニズムとして機能しています。
GoogleがGemini Robotics-ER 1.6を発表。新たな計器読み取り能力と改善された空間・物理理解を搭載。前バージョン1.5は4月30日に廃止される。
GitHubの679件のルールファイルと25,532件のルールを分析した結果、禁止ルールはAIコーディングエージェントを改善する一方、肯定的な指示はむしろ性能を低下させることが判明しました。ランダムに生成されたルールは、専門家が作成したものと同等の効果を示しています。
新ベンチマークHORIZONが、LLMエージェントが長期タスクでどのように失敗するかを体系的に分析。研究により、エラーは複数ステップにわたって蓄積し、最も優れたモデルでも20回以上のアクション後にフォーカスを失うことが判明。
プライバシー制約下での複数AIエージェントの協力を評価する初のベンチマークです。結果は、プライバシーが協力の質を大幅に低下させ、プライバシーに起因するハルシネーションを含む3種類のエラーを引き起こすことを示しています。
SWE-AGILEは、AIコーディングエージェント向けにスライディングウィンドウと圧縮サマリーを用いた動的コンテキスト戦略を導入しました。わずか7〜8Bパラメータのモデルで、2,200のトレーニング例のみを使用してSWE-Bench-Verifiedで新たなstate-of-the-artを達成しています。
GitHubがCodeQLエンジンベースの無料Code Security Risk Assessmentを公開しました。組織ごとに最もアクティブな20リポジトリまでスキャンし、深刻度、言語、ルール別に脆弱性を表示します。Copilot Autofixは2025年に460,258件のセキュリティ警告を修正しました。
GitHubが、ClaudeおよびCodexコーディングエージェントの起動時に複数のAIモデルから選択できる機能を追加。Claude Sonnet/Opus 4.5および4.6、GPT-5.2/5.3/5.4-Codexが利用可能。
HCompanyがHuggingFaceプラットフォームでHoloTabを公開。AIを活用してWebタスクを自動化する無料のChrome拡張機能。主要イノベーションはRoutines——一度操作を記録すれば無限に繰り返し実行可能。
Hodoscopeは、事前定義されたカテゴリを必要とせず、分布の比較によって不審な行動を検出するAIエージェントの教師なし監視システムです。必要なレビューを6〜23倍削減し、Commit0ベンチマークで未知の脆弱性を発見しました。
新システムMeerkatは、クラスタリングとエージェント検索を組み合わせて、大規模なAIエージェント実行コレクションから稀なセキュリティ違反を検出します。主要ベンチマークで広範な不正を発見し、報酬ハッキングの事例を4倍多く検出しました。
IBMが企業をAIエージェントによる攻撃から防御するための2つの新ソリューションを発表。フロンティアモデルの脅威に対するEnterprise Cybersecurity Assessmentと、協調的対応のためのIBM Autonomous Security。
新しい研究論文CIA(Communication Inference Attack)が、外部クエリのみでLLMマルチエージェントシステムの通信トポロジーを87%以上の精度で再構築できることを示した。AIシステムのセキュリティとプライバシーへの重大な影響。