Montag, 4. Mai 2026

9 Nachrichten — 🟡 6 wichtig , 🟢 3 interessant

← Vorheriger Tag Nächster Tag →

🤖 Modelle (2)

🤝 Agenten (4)

🟡 🤝 Agenten 4. Mai 2026 · 2 Min. Lesezeit

ArXiv AEM: Adaptive Entropiemodulation für Multi-Turn-RL-Agenten erreicht +1,4 % auf SWE-bench Verified

Editorial illustration: ArXiv AEM: Adaptive Entropiemodulation für Multi-Turn-RL-Agenten erreicht +1,4 % auf SWE-bench Verified

AEM (Adaptive Entropy Modulation) ist eine überwachungsfreie Trainingsmethode, die Entropie über mehrere Gesprächsrunden dynamisch moduliert, um Exploration und Exploitation in RL-trainierten agentischen Sprachmodellen zu balancieren. Getestet an Modellen von 1,5 bis 32 Milliarden Parametern erzielt sie +1,4 % auf SWE-bench Verified.

🟡 🤝 Agenten 4. Mai 2026 · 2 Min. Lesezeit

Position Paper von 30 Autoren auf ICML 2026: Orchestrierung agentischer KI-Systeme muss Bayes-konsistent sein

Editorial illustration: Position Paper von 30 Autoren auf ICML 2026: Orchestrierung agentischer KI-Systeme muss Bayes-konsistent sein

Dreißig Forscher aus akademischen und industriellen Laboren haben ein auf der ICML 2026 akzeptiertes Position Paper veröffentlicht, das fordert, die Kontrollschicht agentischer KI-Systeme müsse Bayessche Konsistenz wahren. Die Autoren vertreten, dass Sprachmodelle für Entscheidungen unter Unsicherheit ungeeignet sind, ein Orchestrator über ihnen jedoch kalibrierte Überzeugungen aufrechterhalten und nutzenorientierte Strategien anwenden kann und muss.

🟡 🤝 Agenten 4. Mai 2026 · 3 Min. Lesezeit

ArXiv-Rahmen 'To Call or Not to Call' zeigt: Sprachmodelle beurteilen falsch, wann sie externe Werkzeuge brauchen

Editorial illustration: ArXiv-Rahmen 'To Call or Not to Call' zeigt: Sprachmodelle beurteilen falsch, wann sie externe Werkzeuge brauchen

Forscher vom Max-Planck-Institut für Softwaresysteme und Mitarbeiter veröffentlichten einen Rahmen, der Werkzeugaufruf-Entscheidungen von Sprachmodell-Agenten über drei Dimensionen bewertet: Notwendigkeit, Nutzen und Kostenakzeptabilität. Experimente mit sechs Modellen und drei Aufgaben zeigen eine erhebliche Lücke zwischen dem, was das Modell glaubt zu brauchen, und dem, was tatsächlich die Genauigkeit steigert.

🟢 🤝 Agenten 4. Mai 2026 · 2 Min. Lesezeit

ArXiv: die versteckten Kosten von Werkzeugen in LLM-Agenten — 'Tool-Use Tax' senkt Genauigkeit selbst wenn Werkzeuge helfen

Editorial illustration: ArXiv: die versteckten Kosten von Werkzeugen in LLM-Agenten — Tool-Use Tax senkt Genauigkeit selbst wenn Werkzeuge helfen

Forscher haben gezeigt, dass das Aufrufen von Werkzeugen in LLM-Agenten versteckte Kosten einführt — die sogenannte 'Tool-Use Tax' — die durch Formatierungsaufwand und Protokoll-Overhead entsteht. Mit einem Faktoriellen Interventionsrahmen isolieren sie drei Kostenkomponenten und führen ein G-STEP-Gate ein, das Verluste ohne Modelländerung teilweise abschwächt.

🏥 In der Praxis (1)

🛡️ Sicherheit (2)

← Vorheriger Tag Nächster Tag →