Donnerstag, 14. Mai 2026

15 Nachrichten — 🟡 10 wichtig , 🟢 5 interessant

← Vorheriger Tag Nächster Tag →

🤖 Modelle (3)

🟡 🤖 Modelle 14. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.13301 SU-01: 30B-Modell erreicht Gold-Medaillen-Niveau bei IMO 2025, USAMO 2026 und IPhO durch dreiphasiges Training

Editorial illustration: Medaillen-Podeste mit mathematischen Formeln und KI-Reasoning-Bäumen.

SU-01 ist eine neue Reasoning-Training-Methodik, die am 14. Mai 2026 auf arXiv veröffentlicht wurde (Yafu Li und 27 Co-Autoren, Korrespondenzautor Runzhe Zhan). Ein 30B-Parameter-A3B-Backbone erreicht Gold-Medaillen-Performance bei der International Mathematical Olympiad 2025, USAMO 2026 und International Physics Olympiad 2024-2025 durch drei sequenzielle Phasen: Reverse-Perplexity-Curriculum-SFT auf 340.000 Trajektorien, zweistufiges RL und Test-Time-Scaling. Reasoning-Ketten erreichen über 100.000 Tokens.

🟢 🤖 Modelle 14. Mai 2026 · 2 Min. Lesezeit

Allen Institute: AIMIP-Benchmark — KI-Klimamodelle 2× besser auf historischen Daten, scheitern aber bei langfristiger Erwärmung

Redaktionelle Illustration: Klimazeitreihen-Graphen mit KI-Modelllinien vs. historische Daten.

AIMIP (KI-Modellvergleichsprojekt) ist ein neuer Community-Benchmark für KI-Wetter- und Klimamodelle, veröffentlicht am 13. Mai 2026 vom Allen Institute zusammen mit NVIDIA, Google Research, University of Washington, University of Maryland und der ArchesWeather-Gruppe. Die Phase-1-Evaluierung von acht KI-Modellsimulationen zeigte eine Halbierung des Fehlers bei historischen Daten — aber auch eine ernste Unfähigkeit zur Generalisierung auf langfristige Erwärmungstrends.

🟢 🤖 Modelle 14. Mai 2026 · 2 Min. Lesezeit

Microsoft Research GridSFM: Foundation-Modell löst AC-Optimalleistungsfluss 100× schneller als DC-Approximation

Redaktionelle Illustration: Stromnetz mit KI-Foundation-Modell und Optimierungsgraph.

GridSFM ist ein neues kleines Foundation-Modell von Microsoft Research für Stromnetze, veröffentlicht am 13. Mai 2026. Es approximiert den AC-Optimalleistungsfluss in Millisekunden für Netze von 500 bis 80.000 Knoten — 100× schneller als DC-Approximation und 1.000× schneller als vollständige AC-Solver. Der mediane Kostengap beträgt 2,23 %, die Machbarkeitserkennung erreicht 94,5 %/96,1 %, und das Modell projiziert potenzielle Einsparungen von 20 Mrd. USD jährlich bei Engpasskosten.

📦 Open Source (2)

🤝 Agenten (4)

🟡 🤝 Agenten 14. Mai 2026 · 2 Min. Lesezeit

Amazon Nova Sonic + WebRTC: Echtzeit-Sprachagenten mit Kinesis Video Streams und asynchronem Tool Calling für RAG/MCP

Redaktionelle Illustration: Sprachagent mit WebRTC-Fluss und Tool-Calling-Pfeilen zu Cloud-Systemen.

Amazon Nova Sonic + WebRTC-Integration ist eine neue AWS-Architektur, veröffentlicht am 13. Mai 2026, für Echtzeit-Sprachagentenanwendungen. Ein Speech-to-Speech-Ereignisprozessor orchestriert Medien- und Textdatenereignisse über Kinesis Video Streams WebRTC-Signaling, während server-seitiges VAD Audio-Tokens reduziert. Nova Sonic unterstützt asynchrones Tool Calling an MCP-Server, Strands-Agenten und RAG-Systeme — IoT- und Connected-Vehicle-Szenarien sind die ersten Demonstrationen.

🟡 🤝 Agenten 14. Mai 2026 · 2 Min. Lesezeit

Anthropic: Claude Code v2.1.141 fügt terminalSequence-Hook, Bedrock-Haiku-Fix und Rewind-Option „Summarize up to here” hinzu

Editorial illustration: Claude Code terminal mit neuen Hook-Icons und Rewind-Steuerelementen.

Claude Code v2.1.141 ist die neue Version des Anthropic-CLI-Agenten, veröffentlicht am 13. Mai 2026. Der dritte Patch dieser Woche ergänzt das terminalSequence-Feld für Hook-JSON-Output, die Umgebungsvariablen CLAUDE_CODE_PLUGIN_PREFER_HTTPS und ANTHROPIC_WORKSPACE_ID, claude agents --cwd Path-Scoping sowie die neue Rewind-Menüoption „Summarize up to here” zur Komprimierung älterer Kontextdaten. Er behebt einen Bedrock/Vertex Haiku-Modell-ID-Race und Daemon-Statusfehler unter Windows.

🟡 🤝 Agenten 14. Mai 2026 · 2 Min. Lesezeit

LangChain: Managed Deep Agents — gehostete Laufzeitumgebung in LangSmith mit Durable Execution und Memory-Schicht

Redaktionelle Illustration: gehostete Agenten-Laufzeitumgebung mit Speicher- und Tool-Schichten in einer Cloud-Umgebung.

Managed Deep Agents ist eine neue gehostete KI-Agenten-Laufzeitumgebung von LangChain, am 13. Mai 2026 in der privaten Beta innerhalb der LangSmith-Plattform veröffentlicht. Der Dienst bietet Durable Execution, persistenten Speicher, integriertes Tooling und umfassende Observability — alle Infrastrukturkomponenten für produktive Deep Agents. Die Agentendefinition verbleibt über AGENTS.md und tools.json im Repository.

🟡 🤝 Agenten 14. Mai 2026 · 2 Min. Lesezeit

OpenAI: Codex-Sandbox für Windows führt kontrollierten Dateisystemzugriff und Netzwerkbeschränkungen für autonome Agenten ein

Redaktionelle Illustration: Codex-Terminal mit Sicherheitsschichten um Dateisystem- und Netzwerkzugriff.

Codex Windows Sandbox ist eine neue OpenAI-Sicherheitsarchitektur, veröffentlicht am 13. Mai 2026, die dem Codex-Agenten eine sichere Ausführung auf Windows ermöglicht. Die Sandbox führt kontrollierten Dateisystemzugriff und Netzwerkbeschränkungen ein, um sichere und effiziente KI-Coding-Agenten zu ermöglichen — Codex wird zum plattformübergreifenden Werkzeug auch für Windows-Entwickler.

🏥 In der Praxis (4)

🟡 🏥 In der Praxis 14. Mai 2026 · 2 Min. Lesezeit

Perplexity: finance_search Agent API Tool liefert OHLCV, Bilanzen, Transkripte und Analystenschätzungen in einem einzigen Aufruf

Editorial illustration: Finanzdaten-Dashboard mit OHLCV-Diagramm und KI-Agenten-Pfeilen.

Perplexity finance_search ist ein neues Agent-API-Tool, das im Mai 2026 veröffentlicht wurde und strukturierte Finanzdaten für börsennotierte Unternehmen zurückgibt — nahezu Echtzeit-Kurse, OHLCV-Bereiche, Pre-Market- und After-Hours-Daten, Gewinn- und Verlustrechnungen, Bilanzen, Cashflow, Earnings-Call-Transkripte, SEC-Einreichungen, Analystenschätzungen und ETF-Bestandteile. Das KI-Modell entscheidet anhand des Prompts, welche Felder abgerufen werden.

🟢 🏥 In der Praxis 14. Mai 2026 · 2 Min. Lesezeit

AWS: Pulse AI + Bedrock Pipeline feinabstimmt Nova Micro für Finanzdokumente — 1.000 Dokumente in 3 Stunden

Redaktionelle Illustration: Finanzdokumente mit automatisierter Extraktionspipeline und strukturierten Daten.

AWS Pulse AI + Amazon Bedrock Finanzdokumentverarbeitung ist ein neuer Enterprise-Pipeline-Blueprint, veröffentlicht am 13. Mai 2026. Er kombiniert Pulse-AI-Extraktion aus komplexen Finanzdokumenten (SEC-Einreichungen, Bilanzen, Prüfmaterialien) mit der Feinabstimmung des Amazon-Nova-Micro-Modells. Ein Batch von 1.000 Dokumenten, der zuvor mehrere Tage erforderte, wurde in unter drei Stunden verarbeitet, und das feinabgestimmte Modell erreichte 100 % Check-Datenextraktion gegenüber 50 % Baseline.

🟢 🏥 In der Praxis 14. Mai 2026 · 2 Min. Lesezeit

CNCF: KubeStellar KI-Agenten erreichen 81 % PR-Akzeptanz durch 91 % Testabdeckung und 63 CI/CD-Workflows

Editorial illustration: Kubernetes-Cluster mit KI-Agenten-Icons und CI/CD-Pipeline-Pfeilen.

KubeStellar KI-Agenten ist eine neue Fallstudie im CNCF-Blog von Andy Anderson, Chief Maintainer der KubeStellar Console, veröffentlicht am 14. Mai 2026. Das Multi-Cluster-Kubernetes-Dashboard erzielte durch zwei parallele KI-Coding-Agenten innerhalb von 82 Tagen eine PR-Akzeptanzrate von 81 %. Infrastruktur: 63 CI/CD-Workflows, 32 nächtliche Test-Suites, 91 % Abdeckung über 12 Shards, Bug-to-Merge ca. 30 Minuten. Anderson definiert fünf Reifegrade für KI-Codebases.

🟢 🏥 In der Praxis 14. Mai 2026 · 2 Min. Lesezeit

GitHub: Copilot Cloud Agent REST API für Fan-Out-Refactoring, Repository-Setup und wöchentliche Release-Vorbereitung

Redaktionelle Illustration: GitHub-Actions-Workflow mit autonomen Agentensymbolen und REST-API-Endpunkt.

Die GitHub Copilot Cloud Agent REST API ist ein neuer Entwickler-Endpunkt, am 13. Mai 2026 in der öffentlichen Vorschau veröffentlicht, der die programmatische Auslösung autonomer Copilot-Aufgaben ermöglicht. Drei Hauptanwendungsfälle: Code-Refactoring-/Migrations-Fan-Out über viele Repositorys, Ein-Klick-Repository-Initialisierung aus einem Entwicklerportal und automatisierte wöchentliche Release-Vorbereitung. Verfügbar für Copilot Business und Enterprise-Abonnenten.

🛡️ Sicherheit (2)

← Vorheriger Tag Nächster Tag →