Dienstag, 19. Mai 2026

17 Nachrichten — 🔴 3 kritisch , 🟡 9 wichtig , 🟢 5 interessant

🤖 Modelle (3)

🔴 🤖 Modelle 19. Mai 2026 · 3 Min. Lesezeit

arXiv:2605.15514: RoPE kann in langen Kontexten weder Positionen noch Token unterscheiden — theoretischer Beweis einer fundamentalen Einschränkung

Editorial illustration: arXiv 2605.15514 liefert den mathematischen Beweis, dass RoPE in langen Kontexten die Fähigkeit verliert, Positionen und Token zu unterscheiden

arXiv:2605.15514 liefert den mathematischen Beweis, dass Rotary Positional Embeddings (RoPE), der Positionsmechanismus nahezu aller modernen LLMs einschließlich Llama, Mistral, Qwen und GPT-NeoX, in langen Kontexten die Fähigkeit verliert, Positionen und Token zu unterscheiden. Die Autoren fordern grundlegend neue Architekturmechanismen.

🟡 🤖 Modelle 19. Mai 2026 · 2 Min. Lesezeit

Anthropic: Claude-API-Websuchtools liefert jetzt strukturierte Daten aus SEC-Einreichungen

Editorial illustration: Anthropic aktualisierte das Web-Search-Tool der Claude-API, um strukturierte SEC-Daten zurückzugeben

Anthropic hat am 18. Mai 2026 das Web-Search-Tool in der Claude-API aktualisiert, sodass es reichhaltigere und strukturiertere Daten aus SEC-Einreichungen zurückgibt — einschließlich 10-K-, 10-Q- und 8-K-Dokumenten. Das Upgrade erleichtert den Aufbau von Finanzagenten für Ertragsanalysen, Due-Diligence und Recherche mit zitierten Primärquellen.

🟢 🤖 Modelle 19. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.18732: Skalierungsgesetz für Halluzinationen — größeres Modell bedeutet nicht zwingend weniger Fehler

Editorial illustration: Skalierungsgesetz für LLM-Halluzinationen — Sigmoid-Kurve für faktischen Recall

Forscher testeten 38 Modelle an über 8.900 Referenzen und zeigten, dass der faktische Recall von LLMs einer Sigmoid-Kurve folgt: Parameteranzahl und Themenhäufigkeit in den Trainingsdaten erklären 60–94 % der Varianz. Halluzinationen sind nicht zufällig — sie sind vorhersehbar und messbar.

📦 Open Source (2)

🟡 📦 Open Source 19. Mai 2026 · 2 Min. Lesezeit

PyTorch: ExecuTorch MLX Delegate bringt 3–6× schnellere Modellausführung auf Apple-Silicon-GPUs

Editorial illustration: PyTorch veröffentlichte den experimentellen ExecuTorch MLX Delegate — ein Backend für Apple-MLX-Framework und Metal-GPU-Kernel

Das PyTorch-Team veröffentlichte den experimentellen ExecuTorch MLX Delegate — ein Backend, das das Apple-MLX-Framework und Metal-GPU-Kernel für 3- bis 6-fachen Throughput auf Apple-Silicon-Chips nutzt. Unterstützt Llama 3.2, Qwen 3, Phi-4 mini, Whisper und Voxtral-Echtzeit-Streaming-Transkription.

🟢 📦 Open Source 19. Mai 2026 · 2 Min. Lesezeit

GitHub: Copilot Spaces API jetzt allgemein verfügbar

Editorial illustration: GitHub gab die allgemeine Verfügbarkeit der REST-API für Copilot Spaces bekannt

GitHub gab die allgemeine Verfügbarkeit der REST-API für Copilot Spaces bekannt, mit der Teams kontextuelle KI-Arbeitsbereiche programmatisch erstellen, konfigurieren und löschen können. Die neue Schnittstelle ist besonders nützlich für Organisationen, die eine größere Anzahl von Spaces verwalten.

⚖️ Regulierung (1)

🟡 ⚖️ Regulierung 19. Mai 2026 · 2 Min. Lesezeit

EU AI Office: Öffentliche Konsultation zur Klassifizierung von Hochrisiko-KI-Systemen — Frist 23. Juni 2026

Editorial illustration: Europäische Kommission eröffnet öffentliche Konsultation zu Leitlinien für Hochrisiko-KI-Systeme nach dem KI-Akt

Die Europäische Kommission hat eine öffentliche Konsultation zu Leitlinienentwürfen eröffnet, die definieren, wann ein KI-System unter die Hochrisiko-Kategorie des KI-Akts fällt. Interessierte — von Entwicklern bis zur Zivilgesellschaft — können bis 23. Juni 2026 um 22:00 Uhr MEZ Rückmeldungen einreichen.

🤝 Agenten (8)

🔴 🤝 Agenten 19. Mai 2026 · 3 Min. Lesezeit

Anthropic: Übernahme von Stainless integriert MCP-Server-Tooling und SDK-Entwicklung direkt in die Claude-Plattform

Editorial illustration: Anthropic übernahm am 18. Mai 2026 Stainless, ein 2022 gegründetes Unternehmen hinter allen offiziellen Anthropic-SDKs

Anthropic hat am 18. Mai 2026 Stainless übernommen, ein 2022 gegründetes Unternehmen hinter allen offiziellen Anthropic-SDKs und dem MCP-Server-Tooling. Stainless entwickelt SDKs für Hunderte von Unternehmen; die Akquisition zielt auf eine bessere Integration der Claude-Agenten mit externen Daten und Tools ab.

🔴 🤝 Agenten 19. Mai 2026 · 3 Min. Lesezeit

Anthropic: MCP Tunnels, Self-Hosted Sandboxes und automatisches File-Spill für Agenten

Editorial illustration: Anthropic stellt drei wichtige Claude-API-Updates für Agenten-Entwickler vor: MCP Tunnels für private Netzwerke

Anthropic hat drei wichtige Updates für die Claude-API-Plattform eingeführt: MCP Tunnels für die Verbindung mit privaten Netzwerken ohne Internet-Exposition, Self-Hosted Sandboxes als Alternative zur Anthropic-Infrastruktur und automatisches File-Spill für Tool-Outputs über 100K Token.

🟡 🤝 Agenten 19. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.18661: KI für automatisierte Forschung — Roadmap und Anwenderhandbuch

Editorial illustration: arXiv-Paper 2605.18661 von NUS- und NTU-Forschern analysiert Systeme zur autonomen Forschungspaper-Generierung

arXiv-Paper 2605.18661 von Forschern der NUS und NTU analysiert Systeme, die für nur 15 Dollar autonom Forschungsarbeiten generieren. Zentraler Befund: Frontier-LLMs fälschen Ergebnisse und können die Neuartigkeit von Ideen nicht zuverlässig beurteilen. Eine umfassende Roadmap definiert die Grenze zwischen zuverlässiger Assistenz und unsicherer KI-Autonomie.

🟡 🤝 Agenten 19. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.16233: FORGE — KI-Agenten entwickeln gemeinsames Gedächtnis ohne Fine-Tuning

Editorial illustration: arXiv:2605.16233 präsentiert FORGE — KI-Agenten bauen gemeinsames Gedächtnis durch populationsbasiertes Erfahrungsaustausch auf

arXiv:2605.16233 präsentiert FORGE, eine Methode, mit der LLM-Agenten durch populationsbasiertes Erfahrungsaustausch ein gemeinsames Gedächtnis aufbauen — ohne jegliche Aktualisierung der Modellgewichte. Bei der Netzwerkverteidigung CybORG CAGE-2 erzielt FORGE 1,7–7,7× bessere Ergebnisse als die Null-Baseline, besonders bei schwächeren Modellen.

🟡 🤝 Agenten 19. Mai 2026 · 2 Min. Lesezeit

Anthropic Claude Code: v2.1.144 bringt /resume für Background-Sitzungen und Fix für 75-Sekunden-Hang

Editorial illustration: Claude Code CLI v2.1.144 mit /resume-Unterstützung für Background-Sitzungen mit Laufzeitanzeige

Claude Code CLI v2.1.144 führt /resume-Unterstützung für Background-Sitzungen mit Laufzeitanzeige wie „Agent completed · 3h 2m 5s” ein, behebt den 75-Sekunden-Hang bei unerreichbarer API, löst einen MCP-tools/list-Paginierungs-Bug, der Tools lautlos verlor, und liefert zahlreiche Terminal- und MCP-Fixes.

🟡 🤝 Agenten 19. Mai 2026 · 2 Min. Lesezeit

GitHub: Copilot-CLI-Fernsteuerung jetzt allgemein verfügbar auf allen Plattformen

Editorial illustration: GitHub gab die allgemeine Verfügbarkeit der Fernsteuerungsfunktion für GitHub Copilot CLI bekannt

GitHub gab die allgemeine Verfügbarkeit (GA) der Fernsteuerungsfunktion für GitHub Copilot CLI bekannt. Mit dem Befehl /remote on kann ein Entwickler eine aktive Terminalsitzung von einem Mobilgerät, Web, VS Code oder JetBrains IDE aus überwachen und steuern — ohne den Arbeitsfluss zu unterbrechen.

🟢 🤝 Agenten 19. Mai 2026 · 3 Min. Lesezeit

arXiv:2605.18747: Code als operatives Substrat — ein neues KI-Agenten-Paradigma

Editorial illustration: 41 Forscher von UIUC und NVIDIA — Code als Agent Harness, operatives Substrat für KI-Agenten

41 Forscher von UIUC und NVIDIA argumentieren, dass Code nicht nur ein LLM-Output ist, sondern ein Agent Harness — ein operatives Substrat, das Reasoning, Handeln und Verifikation in einem einheitlichen Rahmen für verlässliche KI-Systeme vereint.

🟢 🤝 Agenten 19. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.16238: LLM-geführte Baumsuche übertrifft CDC bei Epidemieprognosen

Editorial illustration: arXiv:2605.16238 stellt ein autonomes System vor, das LLMs und Tree-Search-Algorithmen zur Vorhersage saisonaler Epidemien kombiniert

arXiv:2605.16238 stellt ein autonomes System vor, das LLMs und Tree-Search-Algorithmen zur Vorhersage saisonaler Epidemien kombiniert. In Echtzeit erstellte es durch die Saison 2025–26 Modelle für Influenza, COVID-19 und RSV, die das Gold-Standard-Ensemble des CDC durchgehend erreichten oder übertrafen.

🏥 In der Praxis (1)

🟢 🏥 In der Praxis 19. Mai 2026 · 2 Min. Lesezeit

CNCF: Kubernetes-Debugger löscht Spuren — ernstes Problem für Sicherheitsaudits

Editorial illustration: CNCF warnt, dass kubectl debug nach Sitzungsende keinerlei Aufzeichnung über Container-Zugriffe hinterlässt

CNCF warnt, dass kubectl debug — ein Tool zur Diagnose von Kubernetes-Containern — nach Sitzungsende keinerlei Aufzeichnung hinterlässt. Regulierte Branchen können daher eine Schlüsselfrage nicht beantworten: Wer hat welchen Container wie lange eingesehen — ein direkter Verstoß gegen PCI-DSS- und SOC-2-Auditprotokoll-Anforderungen.

🛡️ Sicherheit (2)

🟡 🛡️ Sicherheit 19. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.16090: CrossMPI — Angriff auf Vision-Language-Modelle ausschließlich durch Bildperturbation

Editorial illustration: arXiv:2605.16090 stellt CrossMPI vor — einen Angriff auf Vision-Language-Modelle durch unsichtbare Pixeländerungen im Bild

arXiv:2605.16090 stellt CrossMPI vor — einen Angriff auf Vision-Language-Modelle, der bösartige Anweisungen ausschließlich durch unsichtbare Pixeländerungen im Bild einschleust, ohne jeglichen Text. Forscher entdeckten, dass die kritischen Schichten der multimodalen Integration in der Mitte des Modells liegen, nicht am Ende. Der Angriff erreicht eine ASR von 66,36 % und übertrifft alle bekannten Baselines um 40,91 PP.

🟡 🛡️ Sicherheit 19. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.17634: Warum Data/Instruction Separation Prompt Injection nicht stoppen kann

Editorial illustration: CISPA- und Google-Forscher beweisen mathematisch, dass Data/Instruction Separation kontextuelle Angriffe nicht verhindert

Forscher des CISPA Helmholtz-Zentrums und Google beweisen mathematisch, dass Data/Instruction Separation — die heute dominante Abwehr gegen Prompt-Injection-Angriffe — kontextuelle Manipulationen nicht verhindert. Mit einem neuen theoretischen Rahmen auf Basis von Contextual Integrity schlagen sie einen grundlegend anderen Ansatz für den Schutz von KI-Agenten vor.

← Vorheriger Tag Nächster Tag →