Freitag, 22. Mai 2026

12 Nachrichten — 🔴 2 kritisch , 🟡 8 wichtig , 🟢 2 interessant

🤖 Modelle (2)

🟡 🤖 Modelle 22. Mai 2026 · 3 Min. Lesezeit

arXiv:2605.21006: Off-the-shelf-Persona-Vektoren erreichen 68-98 % der Wirksamkeit von gezieltem Sycophancy-Steering in LLM-Modellen

Editorial illustration: arXiv:2605.21006 — Off-the-shelf-Persona-Vektoren erreichen 68-98 % der Wirksamkeit von gezieltem Sycophancy-Steering in LLM-Modellen

Forscher veröffentlichten am 21. Mai 2026 auf arXiv den Artikel 'Playing Devil's Advocate', der zeigt, dass bestehende Persona-Vektoren aus Roleplay-Aufgaben Sycophancy (die Neigung des Modells, dem Nutzer auch bei Fehlern zuzustimmen) auf 68-98 % der Wirksamkeit des spezialisierten Contrastive Activation Addition (CAA)-Ansatzes reduzieren können — ohne Training auf sycophancy-spezifischen Daten. Geometrische Analyse zeigt, dass Sycophancy eine Eigenschaft auf Persona-Ebene ist und kein einzelner steuerbarer Richtungsvektor im Aktivierungsraum.

🟢 🤖 Modelle 22. Mai 2026 · 3 Min. Lesezeit

Black Forest Labs: FLUX Erase übertrifft GPT Image-2 (68,5 %) und Finegrain (63,2 %) bei der promptlosen Objektentfernung

Editorial illustration: FLUX Erase übertrifft GPT Image-2 (68,5 %) und Finegrain (63,2 %) bei der promptlosen Objektentfernung

Black Forest Labs lancierte am 21. Mai 2026 FLUX Erase — ein Inpainting-Tool, das mit einer binären Maske Objekte, Schatten, Wasserzeichen und Texte aus Bildern entfernt und den Hintergrund ohne Textprompt rekonstruiert. Ein Benchmark auf 198 Testbildern zeigt Überlegenheit gegenüber GPT Image-2 (68,5 %) und Finegrain Eraser Standard (63,2 %). Das Tool ist über die BFL API und eine öffentliche Demo auf flux-tools.bfl.ai/erase verfügbar — Black Forest Labs positioniert sich als Spezialist für professionelle Creative-Workflow-Tools.

⚖️ Regulierung (1)

🔴 ⚖️ Regulierung 22. Mai 2026 · 3 Min. Lesezeit

UK AI Safety Institute: Aufsicht über fortgeschrittene KI-Systeme wird schwieriger — 20+ Degradierungspfade identifiziert

Editorial illustration: Aufsicht über fortgeschrittene KI-Systeme wird schwieriger — 20+ Degradierungspfade identifiziert

UK AI Safety Institute (AISI) veröffentlichte am 21. Mai 2026 einen Bericht zur Zukunft der Aufsicht über fortgeschrittene KI-Systeme, gestützt auf 25 Experteninterviews aus Industrie, Regierung und Wissenschaft. Kernbefund: Die bestehende Aufsicht gründet auf Fundamenten, die voraussichtlich erodieren werden. Mehr als 20 verschiedene Degradierungspfade für Aufsichtsmechanismen wurden identifiziert — mit besonderem Fokus auf latentes Reasoning, Capability Masking, externe KI-Aktionen und KI-zu-KI-Kommunikation.

🤝 Agenten (5)

🔴 🤝 Agenten 22. Mai 2026 · 3 Min. Lesezeit

Microsoft Research: MagenticLite + Fara1.5 (4B/9B/27B) — agentische KI für kleine Modelle erreicht SOTA

Editorial illustration: MagenticLite + Fara1.5 (4B/9B/27B) — agentische KI für kleine Modelle erreicht SOTA

Microsoft Research veröffentlichte am 21. Mai 2026 ein Trio für agentische KI mit kleinen Modellen: MagenticLite (eine Browser- und Filesystem-UI-Anwendung), MagenticBrain (ein 14B-Orchestrierungsmodell, fine-tuned aus Qwen 3 14B) und Fara1.5 (ein Computer-Use-Modell in 4B-, 9B- und 27B-Varianten). Fara1.5-27B erreicht über 90 % des SOTA auf dem Online-Mind2Web-Benchmark (300 Web-Aufgaben) — fast doppelt so gut wie das frühere Fara-7B. Ziel ist zu zeigen, dass agentische KI keine riesigen Modelle braucht, sondern gut co-designte Tools und einen Harness.

🟡 🤝 Agenten 22. Mai 2026 · 3 Min. Lesezeit

AWS: Nova Act erhält HIPAA-Eligibility — agentische ePHI-Automatisierung für Gesundheits-Workflows

Editorial illustration: Nova Act erhält HIPAA-Eligibility — agentische ePHI-Automatisierung für Gesundheits-Workflows

AWS gab am 21. Mai 2026 bekannt, dass Amazon Nova Act, der agentische KI-Dienst zur Automatisierung von Browser- und UI-Workflows, den formalen HIPAA-eligible-Status erhalten hat. Gesundheitsorganisationen können Nova Act nun für die Verarbeitung geschützter Gesundheitsinformationen (ePHI) nutzen — für Prior Authorization, Versicherungsverifizierung und die Einreichung von Überweisungen über Anbieter-Webportale. Der Dienst integriert sich in Amazon Bedrock AgentCore und das Strand Agents-Framework, erfordert einen unterzeichneten BAA-Vertrag und AWS KMS-Verschlüsselung und ist derzeit nur in der Region US East (N. Virginia) verfügbar.

🟡 🤝 Agenten 22. Mai 2026 · 2 Min. Lesezeit

Anthropic: Claude Code v2.1.147 führt Workflow-Tool für deterministisches Multi-Agent-Orchestrierung ein

Editorial illustration: Claude Code v2.1.147 führt Workflow-Tool für deterministisches Multi-Agent-Orchestrierung ein

Anthropic veröffentlichte Claude Code v2.1.147 am 21. Mai 2026 um 20:39 UTC — eine neue CLI-Version mit dem Workflow-Tool, dem ersten deterministischen Multi-Agent-Orchestrierungsmechanismus im Claude-Code-Ökosystem. Das Tool ist standardmäßig deaktiviert und wird über die Umgebungsvariable CLAUDE_CODE_WORKFLOWS=1 aktiviert. Dieselbe Version benennt den bestehenden /simplify-Befehl in /code-review um (mit Aufwandsstufen high/medium/low) und fügt Sandbox-Hardening gegen Prototype-Pollution- und Thenable-basierte Escape-Angriffe hinzu.

🟡 🤝 Agenten 22. Mai 2026 · 3 Min. Lesezeit

LangChain: Von Token-Streams zu Agent-Streams — typisierte Kanäle ersetzen klassisches Streaming für Multi-Agent-UIs

Editorial illustration: Von Token-Streams zu Agent-Streams — typisierte Kanäle ersetzen klassisches Streaming für Multi-Agent-UIs

LangChain veröffentlichte am 21. Mai 2026 einen Beitrag der Autoren Christian Bromann und Nick Hollon, der eine paradigmatische Evolution von Token-Streams zu strukturierten Agent-Streams beschreibt. Moderne KI-Agenten planen Aufgaben, delegieren an Sub-Agenten, rufen Tools auf und pausieren für menschliche Überprüfung — klassisches Token-Streaming reicht zur Darstellung dieser Arbeit nicht aus. LangChain schlägt typisierte Kanäle vor, die Nachrichten, Tool-Aufrufe, Zustandsänderungen, Sub-Agenten-Aktivität und benutzerdefinierte Ereignisse übertragen. Anwendungen abonnieren nur relevante Ereignistypen für eine effiziente UI bei langläufigen Workloads.

🟡 🤝 Agenten 22. Mai 2026 · 3 Min. Lesezeit

OpenAI: Codex-Skalierung auf Enterprise — 4 Millionen wöchentlich aktive Nutzer und das Codex Labs-Programm

Editorial illustration: Codex-Skalierung auf Enterprise — 4 Millionen wöchentlich aktive Nutzer und das Codex Labs-Programm

OpenAI gab am 21. Mai 2026 die Enterprise-Skalierung der Codex-Plattform bekannt — des agentischen Coding-Tools, das 4 Millionen wöchentlich aktive Nutzer erreicht hat. Angekündigt wurden das neue Codex Labs-Programm und Partnerschaften mit großen Beratungsunternehmen, die großen Unternehmen bei der Implementierung und Skalierung von Codex helfen sollen. Die Nachricht markiert einen formalen Enterprise-Go-to-Market-Schritt, der Codex als direkten Konkurrenten zu GitHub Copilot im mittleren und oberen Marktsegment positioniert.

🏥 In der Praxis (2)

🟡 🏥 In der Praxis 22. Mai 2026 · 3 Min. Lesezeit

arXiv:2605.21427: PALS — energiebewusstes LLM-Serving für MoE-Modelle erreicht +26,3 % Energieeffizienz und 4-7× weniger QoS-Verstöße

Editorial illustration: arXiv:2605.21427 — PALS erreicht +26,3 % Energieeffizienz und 4-7× weniger QoS-Verstöße im MoE-LLM-Serving

Forscher veröffentlichten am 21. Mai 2026 PALS auf dem arXiv-Preprint-Server — ein Laufzeitsystem, das GPU-Leistungssteuerung direkt in das LLM-Serving für Mixture-of-Experts-Modelle integriert. PALS nutzt leichtgewichtige Offline-Power-Performance-Modelle und einen Feedback-Controller, der Konfigurationen dynamisch auf Durchsatzziele optimiert. Erreicht werden 26,3 % bessere Energieeffizienz und 4-7× weniger QoS-Verstöße unter Leistungsbeschränkungen — Integration in vLLM ohne API-Änderungen oder Modell-Retraining. PALS adressiert den wachsenden operativen Engpass von Rechenzentren: GPU-Cluster-Energieverbrauch als dominante Wachstumsschranke.

🟢 🏥 In der Praxis 22. Mai 2026 · 3 Min. Lesezeit

CNCF: NetEase Games erreicht 30-Sekunden-LLM-Cold-Start auf Kubernetes über Fluid-Prefetching-Schichten

Editorial illustration: NetEase Games erreicht 30-Sekunden-LLM-Cold-Start auf Kubernetes über Fluid-Prefetching-Schichten

CNCF veröffentlichte am 21. Mai 2026 eine Fallstudie von NetEase Games (Autoren Haifeng Liao und Xiang Zhang), die beschreibt, wie Ladezeiten für 70B-Klasse-LLM-Modelle mithilfe des CNCF-inkubierten Fluid-Projekts von 42 Minuten (direkter S3-Zugriff) auf unter 30 Sekunden reduziert wurden. Kern der Lösung ist eine Fluid-Prefetching-Schicht, die Modelle zwischen Teams teilt statt sie mehrfach zu cachen, kombiniert mit Pre-Warming-Scheduling zur Eliminierung von Cold Starts. Eine technische Fallstudie für alle, die serverless LLM-Inferenz auf Kubernetes mit großen Modellen betreiben.

🛡️ Sicherheit (2)

🟡 🛡️ Sicherheit 22. Mai 2026 · 3 Min. Lesezeit

Microsoft Research: Vega — ZK-Proofs für digitale Identität, 92ms Generierung und 70 % schnellere wiederholte Nachweise

Editorial illustration: Vega — ZK-Proofs für digitale Identität, 92ms Generierung und 70 % schnellere wiederholte Nachweise

Microsoft Research stellte am 21. Mai 2026 Vega vor — ein Zero-Knowledge-Proof-System, das Fakten aus amtlichen Dokumenten (Alter, Status, Qualifikationen) beweist, ohne das Dokument selbst preiszugeben. Die Proof-Generierung dauert 92ms auf Standardgeräten, die Proof-Größe beträgt 108KB, die Verifikation 23ms. Kerninnovation ist Fold-and-Reuse Proving, das jeden weiteren Nachweis derselben Credential um bis zu 70 % beschleunigt, sowie ein Lookup-centric Circuit Design, das das vollständige Parsen des CBOR-Dokuments vermeidet. Vega ist besonders relevant für KI-Agenten, die Identität im Namen von Nutzern nachweisen müssen, ohne sensible Daten zu speichern.

🟡 🛡️ Sicherheit 22. Mai 2026 · 3 Min. Lesezeit

OECD AI: Kollektive KI-Sicherheit erfordert G7-Koordinierung — Prompt Injection, Agentensicherheit und Model Poisoning als Prioritäten

Editorial illustration: Kollektive KI-Sicherheit erfordert G7-Koordinierung — Prompt Injection, Agentensicherheit und Model Poisoning als Prioritäten

OECD AI veröffentlichte am 21. Mai 2026 einen Policy-Bericht der Autoren de Rivoire, de Leusse, Seger und Butts, der argumentiert, dass KI-Sicherheit internationale Koordinierung erfordert, da sie den Rahmen klassischer Cybersicherheit übersteigt. Drei Prioritätsbereiche wurden identifiziert: Abwehr von Prompt-Injection-Angriffen mit wiederverwendbaren Angriffsmethoden, Sicherheit von KI-Agenten mit autonomem Zugriff auf Tools und Speicher sowie Verhinderung von Model Poisoning, bei dem eine kleine Anzahl kontaminierter Dokumente Modelle verschiedener Größen kompromittieren kann. Der Bericht empfiehlt Koordinierung über G7- und OECD-GPAI-Mechanismen mit aktiver öffentlich-privater Zusammenarbeit.

← Vorheriger Tag Nächster Tag →