🤖 24 AI

2026年4月18日土曜日

13 件 — 🔴 2 重大 , 🟡 7 重要 , 🟢 4 注目

← 前日 翌日 →

🤖 モデル (4)

🟡 🤖 モデル 2026年4月18日 · 3 分で読めます

AWS Nova蒸留によるビデオセマンティック検索:コスト95%削減、推論速度2倍

AWSはモデル蒸留がどのように大型Nova Premierモデルのインテリジェンスをビデオ検索ルーティング用のより小さなNova Microに転送するかを実証しました。結果は推論コストの95%削減、50%低レイテンシ(1741msに対して833ms)、LLM-as-judge評価で品質を維持(5点中4点)です。トレーニング全体でNova Premierから生成された10,000の合成サンプルを使用しました。

🟡 🤖 モデル 2026年4月18日 · 4 分で読めます

AWS Nova マルチモーダル埋め込みによるビデオ検索:ハイブリッドアプローチでリコール率51%から90%へ

AWS Nova マルチモーダル埋め込みは、テキストに変換せずにビデオの視覚・音声・テキストコンテンツを統一された1024次元ベクトル空間で同時に処理する新しいアーキテクチャです。セマンティック埋め込みとBM25語彙検索の組み合わせによりRecall@5が90%となり、ベースラインのcombinedモード埋め込みの51%と比較して——すべての指標で30〜40ポイント向上しました。

🟡 🤖 モデル 2026年4月18日 · 3 分で読めます

NVIDIA Nemotron OCR v2:毎秒34.7ページ、1モデルで5言語対応、PaddleOCRの28倍速

NVIDIAはHuggingFaceでNemotron OCR v2を公開しました。これは単一のA100 GPUで毎秒34.7ページを処理する多言語OCRモデルです。PaddleOCR v5の28倍速です。モデルは単一のアーキテクチャで英語、中国語、日本語、韓国語、ロシア語をサポートし、言語検出は不要です。1,220万枚の合成画像でトレーニングされ、モデルとデータセットはNVIDIA Open ModelライセンスとCC-BY-4.0で提供されています。

🟢 🤖 モデル 2026年4月18日 · 3 分で読めます

ArXiv AC/DC:モデルとタスクの共進化による専門化LLMの自動発見

AC/DCはICLR 2026で発表された新しいフレームワークで、モデルマージングを通じてLLMモデルを、合成データを通じてタスクを同時に進化させます。発見されたモデル群体はベンチマークを明示的に最適化せずに、手動でキュレーションされたモデルより広い専門知識カバレッジを実証します。モデルはより少ないGPUメモリで大きな同等品を上回り、LLMの継続的開発の新しいパラダイムを代表します。

📦 オープンソース (1)

🤝 エージェント (2)

🟡 🤝 エージェント 2026年4月18日 · 3 分で読めます

LangChain と Cisco が Agentic Engineering を実証:バグ発見時間が 93% 短縮、開発速度が 65% 向上

編集イラスト:ソフトウェア開発における協調動作する AI エージェントの群れ、ネットワークの抽象的な可視化

Agentic Engineering とは、AI エージェントの群れがコードを書くだけでなく、ソフトウェアのライフサイクル全体を担うアプローチです。LangChain と Cisco のエンジニアである Renuka Kumar と Prashanth Ramagopal は、2026 年 4 月 17 日に Leader エージェントと Worker エージェントによる参照アーキテクチャを公開しました。70 名のユーザーと 512 セッションを対象にした Cisco のパイロットでは、バグの根本原因の特定時間が 93% 短縮され、開発ワークフローの実行時間が 65% 削減されました。

🟢 🤝 エージェント 2026年4月18日 · 2 分で読めます

HuggingFace が Ecom-RLVE-Gym を公開:強化学習で EC エージェントを訓練する 8 環境・12 軸カリキュラム

編集イラスト:商品ネットワークと学習パスを持つ EC トレーニングの抽象的な環境

Owlgebra AI チームは 2026 年 4 月 16 日、HuggingFace ブログで Ecom-RLVE-Gym プロジェクトを公開しました。これは EC(電子商取引)向け対話エージェントのための 8 つの検証可能な環境を持つオープンフレームワークで、LLM による評価ではなく算法的な報酬を使用します。200 万件の商品カタログ、Qwen 3 8B モデル、そして 12 軸の適応型カリキュラムを用いてエージェントに段階的に難易度を上げながら学習させることで、複雑な多ステップフローにおける教師あり fine-tuning の限界に対応しています。

🏥 実践 (5)

🔴 🏥 実践 2026年4月18日 · 3 分で読めます

Anthropic Claude Design:Claude Opus 4.7が駆動するビジュアルコラボレーションツール——デザイン、プレゼンテーション、プロトタイプ向け

Claude DesignはAnthropicが開発した新製品で、Claude Opus 4.7をデザイン・プロトタイプ・プレゼンテーション・ワンページャー作成のための協調的なビジュアル制作ツールに変えます。システムはコードベースとデザインファイルからデザインシステムを自動的に読み取り、インラインコメントとスライダー調整をサポートし、実装のためにClaude Codeへ直接ハンドオフできます。2026年4月17日よりPro、Max、Team、Enterpriseプランのユーザー向けにリサーチプレビューとして公開されています。

🟡 🏥 実践 2026年4月18日 · 3 分で読めます

Anthropic:インフラノイズがエージェントベンチマーク結果を最大6ポイント変動させる

AnthropicのリサーチャーたちはRAM設定とCPUヘッドルームがエージェントコーディングベンチマークの結果を6パーセントポイント変動させる可能性を証明しました——これはリーダーボード上位モデル間の差より大きいです。Terminal-Bench 2.0とSWE-benchでテストされました。推奨:eval設定が文書化・整合されるまで、3パーセントポイント未満の優位性は懐疑的に見るべきです。

🟡 🏥 実践 2026年4月18日 · 2 分で読めます

GitHub Copilot CLI が自動モデル選択に対応:有料ユーザーはマルチプライヤーが 10% 割引

編集イラスト:ターミナルから矢印が分岐して自動ルーティングの異なる AI モデルへ向かう様子

GitHub は 2026 年 4 月 17 日、Copilot CLI ツールの AI 自動モデル選択機能がすべての Copilot プランで一般提供(GA)になったと発表しました。システムは管理者のポリシーに応じて、GPT-5.4、GPT-5.3-Codex、Sonnet 4.6、Haiku 4.5 などのモデルへリクエストを動的にルーティングします。有料ユーザーは Auto モードを使うとモデルのマルチプライヤーが 10% 割引になります——1x マルチプライヤーのモデルは 1 プレミアムリクエストではなく 0.9 として計算されます。

🟡 🏥 実践 2026年4月18日 · 4 分で読めます

PyTorchとMeta:40以上の最適化で有効トレーニング時間90%超を達成、MegaCacheがPT2コンパイルを40%短縮

Metaは2025年末に推薦モデルのオフライントレーニングで有効トレーニング時間(ETT)90%超を達成した方法を発表しました。手法にはPyTorchエコシステムの40以上の新たな最適化、PT2コンパイル時間を40%短縮するMegaCache、ジョブあたり30分節約するスタンドアロンモデル発行、非同期チェックポイントが含まれます。改善はPyTorchとTorchRecを通じてオープンソース化されています。

🟢 🏥 実践 2026年4月18日 · 4 分で読めます

AWSがAmazon BedrockにIAMプリンシパルごとの詳細なコスト配分を導入

Amazon Bedrockがこれより推論コストをIAMプリンシパル——APIを呼び出す特定のユーザー、ロール、またはフェデレーティッドアイデンティティ——ごとに追跡できるようになりました。この機能はAWS Cost and Usage Reports(CUR 2.0)およびCost Explorerと追加費用なしで統合されます。直接IAMユーザー、アプリケーションロール、フェデレーティッド認証、LLMゲートウェイプロキシパターンの4つのシナリオをサポートします。すべての商用AWSリージョンで利用可能です。

💬 コミュニティ (1)

← 前日 翌日 →