2026年5月4日月曜日

9 件 — 🟡 6 重要 , 🟢 3 注目

← 前日翌日 →

🤖 モデル (2)

🟢 🤖 モデル 2026年5月4日 · 2 分で読めます

AdaMeZO：GPU メモリにモーメントを保存せずAdam方式でLLMをファインチューニング

AdaMeZOはゼロ次最適化器で、Adamアルゴリズムの利点とMeZOのメモリ効率を組み合わせてLLMをファインチューニングする。前向きパスのみを使用し、MeZOと比較して最大70%のパス数削減を達成しつつ、収束性を改善する。

🟢 🤖 モデル 2026年5月4日 · 2 分で読めます

BWLA：1ビット量子化LLMで3.26倍の高速化と70%の改善を達成（ACL 2026）

BWLAは大型言語モデルの訓練後量子化の新フレームワークで、精度を大幅に損なわずに初めて同時に1ビット重みと低ビット活性化を達成した。Qwen3-32Bモデルでパープレキシティ11.92を実現し、既存手法と比べ推論速度3.26倍を達成した。

🤝 エージェント (4)

🟡 🤝 エージェント 2026年5月4日 · 2 分で読めます

ArXiv AEM：マルチターンRL エージェントの適応的エントロピー変調がSWE-bench Verifiedで+1.4%を達成

AEM（Adaptive Entropy Modulation）は教師なし学習のトレーニング手法で、マルチターン対話全体のエントロピーを動的に変調することで、LLMエージェントの強化学習における探索と活用のバランスを改善する。1.5Bから32Bパラメータのモデルでテストされ、SWE-bench Verifiedベンチマークで最先端ベースラインに統合した際に1.4%の改善を達成する。

🟡 🤝 エージェント 2026年5月4日 · 3 分で読めます

ICML 2026立場論文：30名の著者がエージェントAIのオーケストレーションはベイズ一貫性を持つべきと主張

学術・産業研究機関から30名の研究者がICML 2026に採択された立場論文を発表し、エージェントAIシステムの制御層はベイズ一貫性を維持すべきと主張した。LLMは不確実性下の意思決定に不適切だが、その上のオーケストレーターは校正された信念を維持しユーティリティ対応ポリシーを使用できると論じた。

🟡 🤝 エージェント 2026年5月4日 · 3 分で読めます

ArXivフレームワーク「呼ぶべきか否か」がLLMの外部ツール判断ミスを明らかに

Max Planck Institute for Software Systemsなどの研究者が、LLMエージェントのツール呼び出し決定を3つの次元（必要性、効益、コスト許容性）で評価するフレームワークを発表した。6モデル・3タスクでの実験から、モデルが必要と判断するツールと実際の精度向上に寄与するツールの間に大きなギャップがあることが判明し、本番エージェントのコストと信頼性に直接影響する。

🟢 🤝 エージェント 2026年5月4日 · 3 分で読めます

ArXiv：LLMエージェントのツールの隠れたコスト——「ツール使用税」はツールが役立つ時でも精度を下げる

研究者たちはLLMエージェントでのツール呼び出しが隠れたコスト——いわゆる「ツール使用税」——を引き起こすことを示した。呼び出しフォーマットとプロトコルオーバーヘッドが原因で生じるコストを、因数分解的介入フレームワークで3つのコンポーネントに分離し、モデルを変更せずに損失を部分的に緩和するG-STEPゲートを導入した。

🏥 実践 (1)

🟡 🏥 実践 2026年5月4日 · 2 分で読めます

IBM調査：76%の組織がChief AI Officerを設置、CEOは2030年までにAIが48%の運営決定を自律的に下すと予測

IBM Institute for Business Valueが33カ国2000人のCEO調査結果を発表。Chief AI Officer職が1年で26%から76%の組織に拡大。CEOは2030年までにAIシステムが人間の介入なしに48%の運営決定を下すと予測しており、Cスイート全体の構造が再定義されている。

🛡️ セキュリティ (2)

🟡 🛡️ セキュリティ 2026年5月4日 · 3 分で読めます

ArXiv ARMOR 2025：519の軍事プロンプトで21の商用LLMの安全性を評価する初の軍事ベンチマーク

バージニア工科大学の研究者がARMOR 2025を発表した。戦争法・交戦規則・統合倫理規程に基づきLLMを評価する初の安全性ベンチマークで、519の教義プロンプトを通じて21の商用モデルをテストし、軍事応用における安全性整合の重大な欠陥を明らかにした。

🟡 🛡️ セキュリティ 2026年5月4日 · 3 分で読めます

ICML 2026 Spotlight：Stable-GFlowNetがより安定した多様なLLM自動レッドチーミングを実現

KAISTとNAVER Cloudのチームが、Stable-GFlowNet（S-GFN）を発表した。分配関数Zの推定を排除し、ペア比較で安定学習を実現するLLM自動レッドチーミングの新アプローチ。ICML 2026 Spotlight—採択論文の5%未満—を獲得し、ノイズ報酬でのGFlowNetの慢性的問題である訓練不安定性とモード崩壊を解決する。

← 前日翌日 →