Mittwoch, 20. Mai 2026

18 Nachrichten — 🔴 2 kritisch , 🟡 10 wichtig , 🟢 6 interessant

← Vorheriger Tag Nächster Tag →

🤖 Modelle (4)

🔴 🤖 Modelle 20. Mai 2026 · 3 Min. Lesezeit

Google: Gemini 3.5 Flash und Pro — die bisher schnellsten Frontier-Modelle

Editorial illustration: Google hat auf Google I/O 2026 Gemini 3.5 Flash und Pro vorgestellt

Google hat auf dem Google I/O 2026 Gemini 3.5 Flash und Pro vorgestellt — Frontier-Modelle, die 4× schneller als die Konkurrenz sind, mit besonderem Fokus auf agentische Aufgaben, die neue Antigravity-2.0-Plattform für Entwickler und Gemini Spark, einen persönlichen KI-Agenten rund um die Uhr.

🔴 🤖 Modelle 20. Mai 2026 · 3 Min. Lesezeit

Google: Gemini Omni Flash bringt native Videogenerierung aus gemischten Eingaben

Editorial illustration: Google hat auf I/O 2026 Gemini Omni Flash vorgestellt — neues multimodales Modell

Google hat auf dem I/O 2026 Gemini Omni Flash vorgestellt — ein neues multimodales Modell, das Video aus einer Kombination von Bildern, Audio, Video und Text generiert und bearbeitet. Ab sofort auf YouTube Shorts verfügbar, mit obligatorischem SynthID-Wasserzeichen auf jedem generierten Clip.

🟡 🤖 Modelle 20. Mai 2026 · 2 Min. Lesezeit

Google: ERA — KI-System, das das Schreiben wissenschaftlicher Software automatisiert

Editorial illustration:

Google hat in Nature ERA (Empirical Research Assistance) veröffentlicht — ein Gemini-gestütztes System, das per Tree-Search Tausende von Berechnungsansätzen bewertet und das Schreiben von Expertensoftware automatisiert. Die Plattform Computational Discovery steht Forschern bereits zur Verfügung.

🟢 🤖 Modelle 20. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.19660: OScaR — INT2-Quantisierung des KV-Cache ermöglicht 3× schnelleres Decoding

Editorial illustration: Forschende veröffentlichen OScaR, eine Methode zur Lösung des KV-Cache-Quantisierungsproblems in großen Sprachmodellen

Forschende haben OScaR veröffentlicht — eine Methode, die das grundlegende Problem der KV-Cache-Quantisierung in großen Sprachmodellen löst. Mit INT2-Präzision (nur 2 Bit pro Wert) erzielt sie nahezu verlustfreie Genauigkeit, 3× schnelleres Decoding, 5,3× weniger Speicher und 4,1× höheren Durchsatz gegenüber BF16 FlashDecoding-v2.

📦 Open Source (1)

⚖️ Regulierung (3)

🤝 Agenten (7)

🟡 🤝 Agenten 20. Mai 2026 · 2 Min. Lesezeit

Anthropic Claude Code: Skripting laufender Sitzungen und Sicherheitsfixes in v2.1.145

Editorial illustration:

Anthropic Claude Code v2.1.145 bringt JSON-Ausgabe laufender Sitzungen für das Skripting, erweiterte OTEL-Trace-Attribute zur Agenten-Verfolgung sowie Korrekturen einer Sicherheitslücke bei der Genehmigung von Bash-Befehlen.

🟡 🤝 Agenten 20. Mai 2026 · 2 Min. Lesezeit

Anthropic: Claude für 276.000 KPMG-Mitarbeiter in 138 Ländern

Editorial illustration: Anthropic und KPMG haben eine strategische globale Allianz geschlossen

Anthropic und KPMG haben eine strategische globale Allianz geschlossen, durch die Claude Zugang zu allen Mitarbeitern einer der vier größten Wirtschaftsprüfungsgesellschaften der Welt erhält. Claude wird in KPMGs Digital Gateway integriert; KPMG wird Anthropics bevorzugter Partner für den Private-Equity-Sektor.

🟡 🤝 Agenten 20. Mai 2026 · 2 Min. Lesezeit

AWS: Drei Architekturmuster für skalierbare Sprachagenten mit Amazon Nova Sonic

Editorial illustration:

AWS hat einen detaillierten Leitfaden für skalierbare Sprachagenten mit Amazon Nova Sonic und AgentCore Gateway veröffentlicht. Drei klare Muster — direkte Tools, Sub-Agenten und Session-Segmentierung — bieten unterschiedliche Kompromisse zwischen Latenz und Komplexität.

🟡 🤝 Agenten 20. Mai 2026 · 2 Min. Lesezeit

GitHub Copilot erhält Gemini 3.5 Flash: Geschwindigkeit und Qualität für den Alltag

Editorial illustration: Googles Gemini 3.5 Flash wird für alle GitHub-Copilot-Pläne allgemein verfügbar

Googles Gemini 3.5 Flash ist nun für alle GitHub-Copilot-Pläne allgemein verfügbar. Das Modell verspricht nahezu Pro-Niveau-Qualität bei Flash-Tier-Geschwindigkeit und niedrigeren Kosten — mit Schwerpunkt auf agentischen Workflows und mehreren IDE-Umgebungen.

🟢 🤝 Agenten 20. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.18703: EnvFactory – RL-Training von Tool-Use-Agenten mit 5× weniger Umgebungen

Editorial illustration:

EnvFactory ist ein neues Framework zur automatischen Synthese ausführbarer Trainingsumgebungen für Tool-Use-KI-Agenten. Mit nur 85 verifizierten Umgebungen in 7 Domänen erzielt es +15 % auf BFCLv3 und +8,6 % auf MCP-Atlas — rund 5× effizienter als vergleichbare Ansätze.

🟢 🤝 Agenten 20. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.18565: LongMINT — warum KI-Agenten alles vergessen, was man ihnen sagt

Editorial illustration:

Forscher der University of North Carolina haben LongMINT veröffentlicht — den ersten Benchmark, der systematisch misst, wie schlecht KI-Agenten in langen, dynamischen Szenarien mit Gedächtnis umgehen. Die durchschnittliche Genauigkeit beträgt nur 27,9 % — in vielen Fällen schlechter als Zufallsraten.

🟢 🤝 Agenten 20. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.20173: 6 Architekturmuster für LLM-Agenten in der Produktion

Editorial illustration: Neues arXiv-Paper führt die stochastic-deterministic boundary als Designprinzip für LLM-Agenten in der Produktion ein

Ein neues arXiv-Paper führt die stochastic-deterministic boundary als grundlegendes Designprinzip für produktive LLM-Agenten ein und definiert 6 kombinierbare Runtime-Muster — von hierarchischer Delegation bis Human-in-the-Loop — die nach drei Architekturaspekten ausgewählt werden: Koordination, Zustand und Kontrolle.

🛡️ Sicherheit (3)

← Vorheriger Tag Nächster Tag →