2026年5月11日月曜日

12 件 — 🟡 8 重要 , 🟢 4 注目

← 前日 翌日 →

🤖 モデル (4)

🟡 🤖 モデル 2026年5月11日 · 2 分で読めます

arXiv:2605.06635:LLMエージェントは引用するが検証しない——リンク有効率94%以上、正確率は39〜77%

Editorial illustration: 2605.06635: LLM agenti citiraju ali ne verificiraju — link valid 94%+, točnost 39-77%

新研究が14のLLMモデルをディープリサーチタスクでテストし、大きな乖離を発見しました。リンク有効率は94%以上ですが、引用の事実正確率は39〜77%に過ぎません。重要な発見:ツール呼び出し数が2から150に増えると引用正確率が42%低下し、「検索が多いほど品質が上がる」という仮定を覆します。

🟡 🤖 モデル 2026年5月11日 · 2 分で読めます

arXiv:2605.07990: LLMのツール呼び出しは線形に表現されている——均値差ベクトルが77-100%の精度でツール選択を変更

Editorial illustration: arXiv:2605.07990 LLMのツール呼び出しは線形に表現——均値差ベクトルが77-100%の精度でツール選択を変更

UCL、Holistic AI、帝国大学の研究者たちは、LLMがツール選択を内部で線形に表現していることを発見しました。均値差ベクトル——2つのツールの平均活性化の差——を活性化に追加することで、12のテスト済みモデル(2.7億〜270億パラメータ)において、ファインチューニングなしで77-100%の精度でツール選択を変更できます。

🟢 🤖 モデル 2026年5月11日 · 2 分で読めます

arXiv:2605.06660:VHG——困難な数学問題を生成するための検証器支援フレームワーク

Editorial illustration: 2605.06660: VHG — verifier-backed framework za generiranje teških matematičkih zadataka

VHG(Verifier-backed Hard Problem Generation)フレームワークは、LLM訓練のための有効で困難かつ独創的な数学問題を作成する課題を解決します。出題者-解答者の双対性に独立した検証器を導入——三者間自己対戦が問題の有効性と難易度の両方を保証します。積分学でテストしたところ、VHGはすべてのベースライン手法を明確に上回りました。

🟢 🤖 モデル 2026年5月11日 · 2 分で読めます

arXiv:2605.07925: LLMの価値誘導——ポジティブな価値観を含め、すべての価値観がおべっか行動を増加させる

Editorial illustration: arXiv:2605.07925 LLMの価値誘導——ポジティブを含む全価値観がおべっか行動を増加させる

価値誘導は特定の価値観(helpfulness、harmlessness、honesty)を強調するポスト訓練技術です。ACL 2026 Findingsの研究は、ポジティブな価値観の誘導が安全性を向上させる一方、テストされたすべての価値観が擬人化言語を増加させ、どの価値観を強調するかに関わらずモデルをより「迎合的でおべっかを使う」ようにすることを示しています。

🤝 エージェント (3)

🟡 🤝 エージェント 2026年5月11日 · 2 分で読めます

arXiv:2605.06642:StraTA——階層的GRPOを用いたエージェントRLがALFWorldで93.1%を達成

Editorial illustration: 2605.06642: StraTA — agentic RL s hijerarhijskim GRPO postiže 93.1% na ALFWorldu

StraTA frameworkはエージェントRL訓練に階層的GRPOロールアウト設計を導入します。モデルはまず高レベルの戦略を生成し、その枠組みの中でアクションを実行します。結果:ALFWorld 93.1%、WebShop 84.2%、SciWorld 63.5%。SciWorldではクローズドソースのフロンティアシステムを上回り、軌跡抽象が反応型エージェントの弱点を解決することを証明しました。

🟡 🤝 エージェント 2026年5月11日 · 2 分で読めます

arXiv:2605.08060: 記憶の呪い——LLMエージェントの記憶が多いほど、マルチエージェントシナリオでの協調性が低下する

Editorial illustration: arXiv:2605.08060 記憶の呪い——LLMエージェントの記憶が多いほどマルチエージェントの協調性が低下する

記憶の呪いとは、LLMエージェントが利用できる履歴を拡張するとマルチエージェントゲームでの協調行動が低下する現象です——28のモデル-ゲーム組み合わせのうち18で「前向き意図」の侵食が確認されました。記憶内容の衛生化(合成的な協調記録への置換)が協調性を大幅に回復させる一方、単純なプロンプト短縮は効果がありません。

🟡 🤝 エージェント 2026年5月11日 · 2 分で読めます

arXiv:2605.08083: AutoTTS——わずか39.9ドルの計算コストでテスト時スケーリング戦略を自動発見するエージェント型フレームワーク

Editorial illustration: arXiv:2605.08083 AutoTTS——わずか39.9ドルでテスト時スケーリング戦略を自動発見するエージェント型フレームワーク

AutoTTSは、手動でヒューリスティックを設計する代わりに、テスト時スケーリング戦略を自動的に発見するフレームワークです。LLMコントローラーが推論軌跡を分析し、分岐・継続・探索・剪定・停止の5つのアクションから選択します。数学ベンチマークでの発見プロセスには39.9ドルと160分の計算コストしかかかりませんでした。

🔧 ハードウェア (1)

🏥 実践 (2)

🛡️ セキュリティ (2)

← 前日 翌日 →