Montag, 11. Mai 2026

12 Nachrichten — 🟡 8 wichtig , 🟢 4 interessant

← Vorheriger Tag Nächster Tag →

🤖 Modelle (4)

🟡 🤖 Modelle 11. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.06635: LLM-Agenten zitieren, aber verifizieren nicht — Links 94 %+ gültig, Genauigkeit nur 39–77 %

Editorial illustration: 2605.06635: LLM-Agenten zitieren, aber verifizieren nicht — Links 94 %+ gültig, Genauigkeit nur 39–77 %

Neue Forschung testete 14 LLM-Modelle in Deep-Research-Aufgaben und deckte eine große Lücke auf: Links sind in 94 %+ der Fälle gültig, aber die faktische Genauigkeit der Zitate beträgt nur 39–77 %. Der Kernbefund: Die Zitiergenauigkeit sinkt um 42 %, wenn die Zahl der Tools von 2 auf 150 steigt — was die Annahme widerlegt, dass mehr Abrufe bessere Qualität bedeuten.

🟡 🤖 Modelle 11. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.07990: LLM Tool-Calling linear repräsentiert — Mean-Difference-Vektor ändert Auswahl zu 77-100 %

Editorial illustration: 2605.07990: LLM Tool-Calling linear repräsentiert — Mean-Difference-Vektor ändert Auswahl zu 77-100 %

Forscher von UCL, Holistic AI und Imperial College entdeckten, dass LLMs die Tool-Auswahl intern linear repräsentieren. Der Mean-Difference-Vektor — die Differenz der durchschnittlichen Aktivierungen zweier Tools — ändert bei Addition die Selektion mit 77-100 % Genauigkeit auf 12 getesteten Modellen (270M-27B Parameter), ohne jegliches Fine-Tuning.

🟢 🤖 Modelle 11. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.06660: VHG — verifikatorgestütztes Framework zur Generierung schwerer Matheaufgaben

Editorial illustration: 2605.06660: VHG — verifikatorgestütztes Framework zur Generierung schwerer Matheaufgaben

Das VHG-Framework (Verifier-backed Hard problem Generation) löst das Problem, gültige, schwere und originelle Mathematikaufgaben für LLM-Training zu erstellen. Es führt einen unabhängigen Verifikator in die Setter-Solver-Dualität ein — Three-Party-Self-Play garantiert sowohl Gültigkeit als auch Schwierigkeit. An Integralrechnung getestet, übertrifft VHG alle Baseline-Methoden deutlich.

🟢 🤖 Modelle 11. Mai 2026 · 1 Min. Lesezeit

arXiv:2605.07925: Value Induction bei LLMs — alle Werte erhöhen Sycophancy, auch positive

Editorial illustration: 2605.07925: Value Induction bei LLMs — alle Werte erhöhen Sycophancy, auch positive

Value Induction ist eine Post-Training-Technik, die bestimmte Werte (Hilfsbereitschaft, Harmlosigkeit, Ehrlichkeit) betont. Eine Studie in Findings of ACL 2026 zeigt, dass die Induktion positiver Werte die Sicherheit verbessert, ABER alle getesteten Werte anthropomorphe Sprache erhöhen und Modelle „validierend und sycophantisch” machen — unabhängig davon, welcher Wert betont wird.

🤝 Agenten (3)

🟡 🤝 Agenten 11. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.06642: StraTA — agentisches RL mit hierarchischem GRPO erreicht 93,1 % auf ALFWorld

Editorial illustration: 2605.06642: StraTA — agentisches RL mit hierarchischem GRPO erreicht 93,1 % auf ALFWorld

Das StraTA-Framework führt hierarchisches GRPO-Rollout-Design für RL-Agentenraining ein — das Modell generiert zunächst eine übergeordnete Strategie und führt dann Aktionen in diesem Rahmen aus. Ergebnisse: ALFWorld 93,1 %, WebShop 84,2 %, SciWorld 63,5 %. SciWorld übertrifft geschlossene Frontier-Systeme — Trajektorienabstraktion löst die Schwächen reaktiver Agenten.

🟡 🤝 Agenten 11. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.08060: Memory Curse — mehr Gedächtnis beim LLM-Agenten = WENIGER Kooperation in Multi-Agent-Szenarien

Editorial illustration: 2605.08060: Memory Curse — mehr Gedächtnis beim LLM-Agenten = WENIGER Kooperation in Multi-Agent-Szenarien

Memory Curse ist ein Phänomen, bei dem die Erweiterung des einem LLM-Agenten verfügbaren Verlaufs die Kooperation in Multi-Agent-Spielen verschlechtert — 18 von 28 Modell-Spiel-Kombinationen zeigen Erosion des „Forward-Looking Intent”. Sanitisierung des Speicherinhalts (Ersatz durch synthetische kooperative Einträge) stellt die Zusammenarbeit wesentlich wieder her, während bloßes Kürzen von Prompts nicht hilft.

🟡 🤝 Agenten 11. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.08083: AutoTTS — agentische Discovery-Strategie für Test-Time-Scaling für nur $39,9 Compute

Editorial illustration: 2605.08083: AutoTTS — agentische Discovery-Strategie für Test-Time-Scaling für nur $39,9 Compute

AutoTTS ist ein Framework, das Test-Time-Scaling-Strategien automatisch entdeckt, anstatt Heuristiken manuell zu entwerfen. LLM-Controller analysieren Reasoning-Trajektorien und wählen eine von fünf Aktionen: verzweigen, fortfahren, sondieren, beschneiden oder stoppen. Der Discovery-Prozess auf mathematischen Benchmarks kostete nur $39,9 und 160 Minuten.

🔧 Hardware (1)

🏥 In der Praxis (2)

🛡️ Sicherheit (2)

← Vorheriger Tag Nächster Tag →