Mittwoch, 20. Mai 2026

18 Nachrichten — 🔴 2 kritisch , 🟡 10 wichtig , 🟢 6 interessant

🤖 Modelle (4)

🔴 🤖 Modelle 20. Mai 2026 · 3 Min. Lesezeit

Google: Gemini 3.5 Flash und Pro — die bisher schnellsten Frontier-Modelle

Editorial illustration: Google hat auf Google I/O 2026 Gemini 3.5 Flash und Pro vorgestellt

Google hat auf dem Google I/O 2026 Gemini 3.5 Flash und Pro vorgestellt — Frontier-Modelle, die 4× schneller als die Konkurrenz sind, mit besonderem Fokus auf agentische Aufgaben, die neue Antigravity-2.0-Plattform für Entwickler und Gemini Spark, einen persönlichen KI-Agenten rund um die Uhr.

🔴 🤖 Modelle 20. Mai 2026 · 3 Min. Lesezeit

Google: Gemini Omni Flash bringt native Videogenerierung aus gemischten Eingaben

Editorial illustration: Google hat auf I/O 2026 Gemini Omni Flash vorgestellt — neues multimodales Modell

Google hat auf dem I/O 2026 Gemini Omni Flash vorgestellt — ein neues multimodales Modell, das Video aus einer Kombination von Bildern, Audio, Video und Text generiert und bearbeitet. Ab sofort auf YouTube Shorts verfügbar, mit obligatorischem SynthID-Wasserzeichen auf jedem generierten Clip.

🟡 🤖 Modelle 20. Mai 2026 · 2 Min. Lesezeit

Google: ERA — KI-System, das das Schreiben wissenschaftlicher Software automatisiert

Google hat in Nature ERA (Empirical Research Assistance) veröffentlicht — ein Gemini-gestütztes System, das per Tree-Search Tausende von Berechnungsansätzen bewertet und das Schreiben von Expertensoftware automatisiert. Die Plattform Computational Discovery steht Forschern bereits zur Verfügung.

🟢 🤖 Modelle 20. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.19660: OScaR — INT2-Quantisierung des KV-Cache ermöglicht 3× schnelleres Decoding

Editorial illustration: Forschende veröffentlichen OScaR, eine Methode zur Lösung des KV-Cache-Quantisierungsproblems in großen Sprachmodellen

Forschende haben OScaR veröffentlicht — eine Methode, die das grundlegende Problem der KV-Cache-Quantisierung in großen Sprachmodellen löst. Mit INT2-Präzision (nur 2 Bit pro Wert) erzielt sie nahezu verlustfreie Genauigkeit, 3× schnelleres Decoding, 5,3× weniger Speicher und 4,1× höheren Durchsatz gegenüber BF16 FlashDecoding-v2.

📦 Open Source (1)

🟢 📦 Open Source 20. Mai 2026 · 2 Min. Lesezeit

LangChain: Der Agent, der Agenten repariert — wie LangSmith Engine entwickelt wurde

LangChain hat eine detaillierte technische Übersicht des LangSmith Engine veröffentlicht — eines autonomen Agenten, der Fehler in Produktions-KI-Agenten analysiert und konkrete Korrekturen vorschlägt. Er komprimiert Tausende von Traces, klassifiziert sie mit einem Screener-Sub-Agenten und generiert validierte Evaluatoren für das Issue Board.

⚖️ Regulierung (3)

🟡 ⚖️ Regulierung 20. Mai 2026 · 2 Min. Lesezeit

Google DeepMind und Singapur: Nationale KI-Partnerschaft in Gesundheit, Bildung und Umwelt

Editorial illustration: Google DeepMind unterzeichnet nationale KI-Partnerschaft mit der singapurischen Regierung

Google DeepMind hat eine nationale KI-Partnerschaft mit der singapurischen Regierung unterzeichnet, die Gesundheit, Bildung und Nachhaltigkeit abdeckt. Bis 2040 könnte KI der singapurischen Wirtschaft durch beschleunigten F&E-Zyklus zusätzliche 2,5 Milliarden Dollar bringen.

🟡 ⚖️ Regulierung 20. Mai 2026 · 2 Min. Lesezeit

OpenAI: Neue Phase des KI-Bildungsprogramms für Länder

Editorial illustration: OpenAI tritt in die zweite Phase der Initiative „Education for Countries" ein

OpenAI tritt in die zweite Phase der Initiative „Education for Countries" ein — weitet Partnerschaften mit Regierungen aus, führt das OpenAI-Luminaries-Programm für Lehrkräfte ein und bietet Zertifikate über die OpenAI Academy an. Ziel ist die systematische Integration von KI-Werkzeugen in nationale Bildungssysteme mit messbaren Ergebnissen.

🟢 ⚖️ Regulierung 20. Mai 2026 · 2 Min. Lesezeit

OECD: EU setzt KI in strategisch wichtigen Sektoren ein — was bedeutet das für Bürger?

OECD.AI und das EU-KI-Büro haben einen Analysebericht veröffentlicht, der dokumentiert, wie Europa KI in vier strategischen Sektoren einsetzt — Landwirtschaft, Gesundheit, Industrie und Mobilität — mit konkreten aktiven Projekten und identifizierten Hindernissen.

🤝 Agenten (7)

🟡 🤝 Agenten 20. Mai 2026 · 2 Min. Lesezeit

Anthropic Claude Code: Skripting laufender Sitzungen und Sicherheitsfixes in v2.1.145

Anthropic Claude Code v2.1.145 bringt JSON-Ausgabe laufender Sitzungen für das Skripting, erweiterte OTEL-Trace-Attribute zur Agenten-Verfolgung sowie Korrekturen einer Sicherheitslücke bei der Genehmigung von Bash-Befehlen.

🟡 🤝 Agenten 20. Mai 2026 · 2 Min. Lesezeit

Anthropic: Claude für 276.000 KPMG-Mitarbeiter in 138 Ländern

Editorial illustration: Anthropic und KPMG haben eine strategische globale Allianz geschlossen

Anthropic und KPMG haben eine strategische globale Allianz geschlossen, durch die Claude Zugang zu allen Mitarbeitern einer der vier größten Wirtschaftsprüfungsgesellschaften der Welt erhält. Claude wird in KPMGs Digital Gateway integriert; KPMG wird Anthropics bevorzugter Partner für den Private-Equity-Sektor.

🟡 🤝 Agenten 20. Mai 2026 · 2 Min. Lesezeit

AWS: Drei Architekturmuster für skalierbare Sprachagenten mit Amazon Nova Sonic

AWS hat einen detaillierten Leitfaden für skalierbare Sprachagenten mit Amazon Nova Sonic und AgentCore Gateway veröffentlicht. Drei klare Muster — direkte Tools, Sub-Agenten und Session-Segmentierung — bieten unterschiedliche Kompromisse zwischen Latenz und Komplexität.

🟡 🤝 Agenten 20. Mai 2026 · 2 Min. Lesezeit

GitHub Copilot erhält Gemini 3.5 Flash: Geschwindigkeit und Qualität für den Alltag

Editorial illustration: Googles Gemini 3.5 Flash wird für alle GitHub-Copilot-Pläne allgemein verfügbar

Googles Gemini 3.5 Flash ist nun für alle GitHub-Copilot-Pläne allgemein verfügbar. Das Modell verspricht nahezu Pro-Niveau-Qualität bei Flash-Tier-Geschwindigkeit und niedrigeren Kosten — mit Schwerpunkt auf agentischen Workflows und mehreren IDE-Umgebungen.

🟢 🤝 Agenten 20. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.18703: EnvFactory – RL-Training von Tool-Use-Agenten mit 5× weniger Umgebungen

EnvFactory ist ein neues Framework zur automatischen Synthese ausführbarer Trainingsumgebungen für Tool-Use-KI-Agenten. Mit nur 85 verifizierten Umgebungen in 7 Domänen erzielt es +15 % auf BFCLv3 und +8,6 % auf MCP-Atlas — rund 5× effizienter als vergleichbare Ansätze.

🟢 🤝 Agenten 20. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.18565: LongMINT — warum KI-Agenten alles vergessen, was man ihnen sagt

Forscher der University of North Carolina haben LongMINT veröffentlicht — den ersten Benchmark, der systematisch misst, wie schlecht KI-Agenten in langen, dynamischen Szenarien mit Gedächtnis umgehen. Die durchschnittliche Genauigkeit beträgt nur 27,9 % — in vielen Fällen schlechter als Zufallsraten.

🟢 🤝 Agenten 20. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.20173: 6 Architekturmuster für LLM-Agenten in der Produktion

Editorial illustration: Neues arXiv-Paper führt die stochastic-deterministic boundary als Designprinzip für LLM-Agenten in der Produktion ein

Ein neues arXiv-Paper führt die stochastic-deterministic boundary als grundlegendes Designprinzip für produktive LLM-Agenten ein und definiert 6 kombinierbare Runtime-Muster — von hierarchischer Delegation bis Human-in-the-Loop — die nach drei Architekturaspekten ausgewählt werden: Koordination, Zustand und Kontrolle.

🛡️ Sicherheit (3)

🟡 🛡️ Sicherheit 20. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.18414: Prompts schützen nicht — MCP-Proxy mit ABAC erreicht 0 % unerlaubte Tool-Aufrufe

Neue Forschung belegt, dass Prompt-basierte Einschränkungen unerlaubte Tool-Aufrufe nur um 11–18 % reduzieren, während ein architekturaler MCP-Proxy mit ABAC vollständigen Schutz bei unter 50 ms Latenz bietet.

🟡 🛡️ Sicherheit 20. Mai 2026 · 2 Min. Lesezeit

CNCF: Prempti bringt Policy-Enforcement und Sichtbarkeit für KI-Coding-Agenten

Editorial illustration: Das CNCF-Falco-Team veröffentlicht Prempti — experimentelles Projekt für Runtime-Security bei KI-Coding-Agenten

Das CNCF-Falco-Team hat Prempti veröffentlicht — ein experimentelles Projekt, das Falcos Runtime-Security-Modell auf KI-Coding-Agenten ausweitet. Das System fängt Tool-Calls vor der Ausführung ab und wendet Policy-Regeln an, sodass Teams die Aktionen von Agenten wie Claude Code kontrollieren können.

🟡 🛡️ Sicherheit 20. Mai 2026 · 2 Min. Lesezeit

IBM: Project Glasswing bringt das fortschrittlichste KI-Sicherheitsportfolio für Enterprise

IBM hat das fortschrittlichste KI-gestützte Sicherheitsportfolio für Enterprise-Kunden vorgestellt, gestärkt durch die Arbeit an Project Glasswing — einer Industriekoalition, die KI-Angriffe autonom erkennt und darauf reagiert.

← Vorheriger Tag Nächster Tag →