Dienstag, 19. Mai 2026

17 Nachrichten — 🔴 3 kritisch , 🟡 9 wichtig , 🟢 5 interessant

← Vorheriger Tag Nächster Tag →

🤖 Modelle (3)

🔴 🤖 Modelle 19. Mai 2026 · 3 Min. Lesezeit

arXiv:2605.15514: RoPE kann in langen Kontexten weder Positionen noch Token unterscheiden — theoretischer Beweis einer fundamentalen Einschränkung

Editorial illustration: arXiv 2605.15514 liefert den mathematischen Beweis, dass RoPE in langen Kontexten die Fähigkeit verliert, Positionen und Token zu unterscheiden

arXiv:2605.15514 liefert den mathematischen Beweis, dass Rotary Positional Embeddings (RoPE), der Positionsmechanismus nahezu aller modernen LLMs einschließlich Llama, Mistral, Qwen und GPT-NeoX, in langen Kontexten die Fähigkeit verliert, Positionen und Token zu unterscheiden. Die Autoren fordern grundlegend neue Architekturmechanismen.

🟡 🤖 Modelle 19. Mai 2026 · 2 Min. Lesezeit

Anthropic: Claude-API-Websuchtools liefert jetzt strukturierte Daten aus SEC-Einreichungen

Editorial illustration: Anthropic aktualisierte das Web-Search-Tool der Claude-API, um strukturierte SEC-Daten zurückzugeben

Anthropic hat am 18. Mai 2026 das Web-Search-Tool in der Claude-API aktualisiert, sodass es reichhaltigere und strukturiertere Daten aus SEC-Einreichungen zurückgibt — einschließlich 10-K-, 10-Q- und 8-K-Dokumenten. Das Upgrade erleichtert den Aufbau von Finanzagenten für Ertragsanalysen, Due-Diligence und Recherche mit zitierten Primärquellen.

🟢 🤖 Modelle 19. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.18732: Skalierungsgesetz für Halluzinationen — größeres Modell bedeutet nicht zwingend weniger Fehler

Editorial illustration: Skalierungsgesetz für LLM-Halluzinationen — Sigmoid-Kurve für faktischen Recall

Forscher testeten 38 Modelle an über 8.900 Referenzen und zeigten, dass der faktische Recall von LLMs einer Sigmoid-Kurve folgt: Parameteranzahl und Themenhäufigkeit in den Trainingsdaten erklären 60–94 % der Varianz. Halluzinationen sind nicht zufällig — sie sind vorhersehbar und messbar.

📦 Open Source (2)

⚖️ Regulierung (1)

🤝 Agenten (8)

🔴 🤝 Agenten 19. Mai 2026 · 3 Min. Lesezeit

Anthropic: Übernahme von Stainless integriert MCP-Server-Tooling und SDK-Entwicklung direkt in die Claude-Plattform

Editorial illustration: Anthropic übernahm am 18. Mai 2026 Stainless, ein 2022 gegründetes Unternehmen hinter allen offiziellen Anthropic-SDKs

Anthropic hat am 18. Mai 2026 Stainless übernommen, ein 2022 gegründetes Unternehmen hinter allen offiziellen Anthropic-SDKs und dem MCP-Server-Tooling. Stainless entwickelt SDKs für Hunderte von Unternehmen; die Akquisition zielt auf eine bessere Integration der Claude-Agenten mit externen Daten und Tools ab.

🔴 🤝 Agenten 19. Mai 2026 · 3 Min. Lesezeit

Anthropic: MCP Tunnels, Self-Hosted Sandboxes und automatisches File-Spill für Agenten

Editorial illustration: Anthropic stellt drei wichtige Claude-API-Updates für Agenten-Entwickler vor: MCP Tunnels für private Netzwerke

Anthropic hat drei wichtige Updates für die Claude-API-Plattform eingeführt: MCP Tunnels für die Verbindung mit privaten Netzwerken ohne Internet-Exposition, Self-Hosted Sandboxes als Alternative zur Anthropic-Infrastruktur und automatisches File-Spill für Tool-Outputs über 100K Token.

🟡 🤝 Agenten 19. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.18661: KI für automatisierte Forschung — Roadmap und Anwenderhandbuch

Editorial illustration: arXiv-Paper 2605.18661 von NUS- und NTU-Forschern analysiert Systeme zur autonomen Forschungspaper-Generierung

arXiv-Paper 2605.18661 von Forschern der NUS und NTU analysiert Systeme, die für nur 15 Dollar autonom Forschungsarbeiten generieren. Zentraler Befund: Frontier-LLMs fälschen Ergebnisse und können die Neuartigkeit von Ideen nicht zuverlässig beurteilen. Eine umfassende Roadmap definiert die Grenze zwischen zuverlässiger Assistenz und unsicherer KI-Autonomie.

🟡 🤝 Agenten 19. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.16233: FORGE — KI-Agenten entwickeln gemeinsames Gedächtnis ohne Fine-Tuning

Editorial illustration: arXiv:2605.16233 präsentiert FORGE — KI-Agenten bauen gemeinsames Gedächtnis durch populationsbasiertes Erfahrungsaustausch auf

arXiv:2605.16233 präsentiert FORGE, eine Methode, mit der LLM-Agenten durch populationsbasiertes Erfahrungsaustausch ein gemeinsames Gedächtnis aufbauen — ohne jegliche Aktualisierung der Modellgewichte. Bei der Netzwerkverteidigung CybORG CAGE-2 erzielt FORGE 1,7–7,7× bessere Ergebnisse als die Null-Baseline, besonders bei schwächeren Modellen.

🟡 🤝 Agenten 19. Mai 2026 · 2 Min. Lesezeit

Anthropic Claude Code: v2.1.144 bringt /resume für Background-Sitzungen und Fix für 75-Sekunden-Hang

Editorial illustration: Claude Code CLI v2.1.144 mit /resume-Unterstützung für Background-Sitzungen mit Laufzeitanzeige

Claude Code CLI v2.1.144 führt /resume-Unterstützung für Background-Sitzungen mit Laufzeitanzeige wie „Agent completed · 3h 2m 5s” ein, behebt den 75-Sekunden-Hang bei unerreichbarer API, löst einen MCP-tools/list-Paginierungs-Bug, der Tools lautlos verlor, und liefert zahlreiche Terminal- und MCP-Fixes.

🟡 🤝 Agenten 19. Mai 2026 · 2 Min. Lesezeit

GitHub: Copilot-CLI-Fernsteuerung jetzt allgemein verfügbar auf allen Plattformen

Editorial illustration: GitHub gab die allgemeine Verfügbarkeit der Fernsteuerungsfunktion für GitHub Copilot CLI bekannt

GitHub gab die allgemeine Verfügbarkeit (GA) der Fernsteuerungsfunktion für GitHub Copilot CLI bekannt. Mit dem Befehl /remote on kann ein Entwickler eine aktive Terminalsitzung von einem Mobilgerät, Web, VS Code oder JetBrains IDE aus überwachen und steuern — ohne den Arbeitsfluss zu unterbrechen.

🟢 🤝 Agenten 19. Mai 2026 · 3 Min. Lesezeit

arXiv:2605.18747: Code als operatives Substrat — ein neues KI-Agenten-Paradigma

Editorial illustration: 41 Forscher von UIUC und NVIDIA — Code als Agent Harness, operatives Substrat für KI-Agenten

41 Forscher von UIUC und NVIDIA argumentieren, dass Code nicht nur ein LLM-Output ist, sondern ein Agent Harness — ein operatives Substrat, das Reasoning, Handeln und Verifikation in einem einheitlichen Rahmen für verlässliche KI-Systeme vereint.

🟢 🤝 Agenten 19. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.16238: LLM-geführte Baumsuche übertrifft CDC bei Epidemieprognosen

Editorial illustration: arXiv:2605.16238 stellt ein autonomes System vor, das LLMs und Tree-Search-Algorithmen zur Vorhersage saisonaler Epidemien kombiniert

arXiv:2605.16238 stellt ein autonomes System vor, das LLMs und Tree-Search-Algorithmen zur Vorhersage saisonaler Epidemien kombiniert. In Echtzeit erstellte es durch die Saison 2025–26 Modelle für Influenza, COVID-19 und RSV, die das Gold-Standard-Ensemble des CDC durchgehend erreichten oder übertrafen.

🏥 In der Praxis (1)

🛡️ Sicherheit (2)

← Vorheriger Tag Nächster Tag →