Donnerstag, 7. Mai 2026

19 Nachrichten — 🔴 4 kritisch , 🟡 14 wichtig , 🟢 1 interessant

← Vorheriger Tag Nächster Tag →

🤖 Modelle (3)

📦 Open Source (1)

⚖️ Regulierung (1)

🤝 Agenten (5)

🔴 🤝 Agenten 7. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.06651: Google DeepMind stellt KI-Co-Mathematiker mit 48 % auf FrontierMath Tier 4 vor

Editorial illustration: 2605.06651: Google DeepMind stellt KI-Co-Mathematiker mit 48 % auf FrontierMath Tier 4 vor

Das Google-DeepMind-Team veröffentlichte einen Artikel über den KI-Co-Mathematiker, eine interaktive Arbeitsumgebung, in der Agenten mit Mathematikern an offenen Problemen zusammenarbeiten. Das System erreichte 48 % auf dem FrontierMath-Tier-4-Benchmark — ein neuer Rekord unter allen KI-Systemen.

🟡 🤝 Agenten 7. Mai 2026 · 2 Min. Lesezeit

Anthropic: Managed Agents erhalten Multiagenten-Sessions, Outcomes, Webhooks und Vault-Refresh in der öffentlichen Beta

Editorial illustration: Diagramm mehrerer Claude-Agenten, die auf einem Session-Canvas mit Vault- und Webhook-Icons verbunden sind

Claude Managed Agents ist Anthropics verwaltete Plattform für autonome Agenten und erhielt am 6. Mai 2026 vier neue Features in der öffentlichen Beta: Multiagenten-Sessions, den Outcomes-Mechanismus zur Zieldefinition, Webhooks für Session- und Vault-Lifecycle-Ereignisse sowie Hintergrund-Refresh für mcp_oauth-Credentials. Neue Filter für Sessions nach Status und für Events nach Typ und Erstellungszeit wurden ebenfalls hinzugefügt.

🟡 🤝 Agenten 7. Mai 2026 · 2 Min. Lesezeit

GitHub: Validierung agentischen Verhaltens per Dominatoranalyse aus der Compilertheorie erreicht 100 % Genauigkeit vs. 82 % Agenten-Selbstbeurteilung

Editorial illustration: Graphstruktur-Diagramm mit hervorgehobenen Dominatorknoten, die essenzielle Schritte in der Agenten-Ausführung darstellen

GitHub veröffentlicht ein Validierungsframework für nicht-deterministische KI-Agenten, das die Dominatoranalyse aus der Compilertheorie nutzt — aus 2 bis 10 erfolgreichen Ausführungen des Copilot Coding Agent lernt das System, welche Schritte essenziell und welche optional sind, und erreicht 100 % Genauigkeit bei der Unterscheidung von Agenten-Bugs und echten Produkt-Regressionen.

🟡 🤝 Agenten 7. Mai 2026 · 2 Min. Lesezeit

GitHub: Copilot für VS Code erhält Terminal-Zugriff und eigene API-Schlüssel

Editorial-Illustration: Copilot für VS Code erhält Terminal-Zugriff und eigene API-Schlüssel

GitHub Copilot für Visual Studio Code hat im April-Releasezyklus (Versionen 1.116–1.119) semantische Suche über die gesamte Codebasis, agentischen Zugriff auf offene Terminals und die Möglichkeit erhalten, eigene API-Schlüssel für Anthropic, OpenAI und andere Anbieter einzubinden.

🟡 🤝 Agenten 7. Mai 2026 · 2 Min. Lesezeit

vLLM: Mooncake Distributed KV-Cache-Store-Integration liefert 3,8× höheren Durchsatz und 46× niedrigere P50 TTFT für Multi-Turn-Agenten-Workloads

Editorial illustration: Netzwerk von GPU-Knoten, verbunden durch RDMA-Links mit einem zentralen Distributed-KV-Cache-Pool

vLLM integriert Mooncake, einen Open-Source-Distributed-KV-Cache-Store, der wiederholte Präfix-Berechnungen zwischen Agenten-Turns eliminiert — auf realistischen Codex-Traces mit 12 GB200-GPUs steigt der Durchsatz um 3,8×, P50 TTFT sinkt um 46×, End-to-End-Latenz um 8,6×, und die Cache-Hit-Rate springt von 1,7 % auf 92,2 %.

🔧 Hardware (1)

🏥 In der Praxis (4)

🟡 🏥 In der Praxis 7. Mai 2026 · 2 Min. Lesezeit

Anthropic: Claude Code v2.1.132 bringt 25+ Fixes und neue Env-Variablen für Hooks

Editorial-Illustration: Claude Code v2.1.132 bringt 25+ Fixes und neue Umgebungsvariablen für Hooks

Anthropic hat Claude Code v2.1.132 mit 25+ Fehlerbehebungen und zwei neuen Umgebungsvariablen veröffentlicht: CLAUDE_CODE_SESSION_ID für Hook-Integration und CLAUDE_CODE_DISABLE_ALTERNATE_SCREEN für nativen Scrollback. Ein schwerwiegender Bug mit 10 GB+ RSS-Speicherwachstum bei MCP-Servern wurde ebenfalls behoben.

🟡 🏥 In der Praxis 7. Mai 2026 · 2 Min. Lesezeit

Anthropic: Claude Code v2.1.133 bringt worktree.baseRef und Race-Condition-Fix

Editorial illustration: Claude Code v2.1.133 bringt worktree.baseRef und Race-Condition-Fix

Anthropic veröffentlichte Claude Code v2.1.133 mit den neuen Parametern worktree.baseRef, sandbox.bwrapPath/socatPath und der Umgebungsvariable CLAUDE_EFFORT in Hooks. Die Version behebt eine Race Condition in parallelen Sitzungen sowie Probleme mit Windows-Laufwerksstammpfaden. Dritte Veröffentlichung dieser Woche nach v2.1.131 und v2.1.132.

🟡 🏥 In der Praxis 7. Mai 2026 · 2 Min. Lesezeit

GitHub: Optimierung agentischer Workflows erzielt Token-Einsparungen von 19 % bis 62 %

Editorial illustration: Optimierung agentischer Workflows erzielt Token-Einsparungen von 19 % bis 62 %

GitHub hat seine Produktions-Agentenworkflows instrumentiert und drei Hauptquellen für Token-Verschwendung identifiziert: unnötige MCP-Tools, deterministische Datenabrufe und falsch konfigurierte Bash-Regeln. Durch Optimierung wurden Einsparungen von 19 % bis 62 % pro Workflow erzielt.

🟢 🏥 In der Praxis 7. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.04012: SymptomAI in der Fitbit-App übertrifft mit 13.917 Patienten unabhängige Kliniker bei der Differentialdiagnose

Editorial illustration: Nutzer im Gespräch mit dem SymptomAI-Agenten in der Fitbit-App, während ein Hintergrundpanel eine gerankte Diagnoseliste anzeigt

SymptomAI ist ein konversationeller KI-Agent, der in die Fitbit-App integriert und an etwa 13.917 Teilnehmern getestet wurde; in der klinischen Evaluationsgruppe erreichten seine Diagnoseempfehlungen ein Odds Ratio von 2,47 gegenüber unabhängigen Klinikern, die dieselben Gespräche bewerteten. Die Studie ist ein Preprint.

💬 Community (1)

🛡️ Sicherheit (3)

← Vorheriger Tag Nächster Tag →