Dienstag, 14. April 2026

14 Nachrichten — 🔴 2 kritisch , 🟡 9 wichtig , 🟢 3 interessant

🤖 Modelle (1)

🟡 🤖 Modelle 14. April 2026 · 2 Min. Lesezeit

ArXiv: Process Reward Agents — Echtzeit-Feedback verbessert KI-Schlussfolgerungen in der Medizin ohne Retraining

Forscher haben Process Reward Agents (PRA) vorgestellt, einen neuen Ansatz, der waehrend des KI-Schlussfolgerungsprozesses in medizinischen Domaenen schrittweises Feedback liefert. Das System funktioniert mit bestehenden Modellen ohne Retraining und erzielt bedeutende Ergebnisse auf medizinischen Benchmarks.

⚖️ Regulierung (1)

🟡 ⚖️ Regulierung 14. April 2026 · 2 Min. Lesezeit

Anthropic: LTBT Trust haelt nun die Mehrheit im Verwaltungsrat — ehemaliger Novartis-CEO ernannt

Anthropic hat die Ernennung von Vas Narasimhan, CEO von Novartis, in den Verwaltungsrat ueber den Long-Term Benefit Trust bekannt gegeben. Die LTBT-Direktoren bilden nun die Mehrheit im Verwaltungsrat, wodurch die Aufsicht ueber die Sicherheitsmission des Unternehmens gestaerkt wird.

🤝 Agenten (3)

🔴 🤝 Agenten 14. April 2026 · 1 Min. Lesezeit

OpenAI und Cloudflare: GPT-5.4 und Codex treiben neue Agent-Cloud-Plattform fuer Unternehmen an

Cloudflare hat OpenAIs GPT-5.4- und Codex-Modelle in seine neue Agent-Cloud-Plattform integriert und ermoeglicht es Unternehmenskunden, KI-Agenten fuer reale Geschaeftsaufgaben mit Schwerpunkt auf Geschwindigkeit und Sicherheit zu erstellen, bereitzustellen und zu skalieren.

🟡 🤝 Agenten 14. April 2026 · 2 Min. Lesezeit

AI2: KI-Agenten loesen 80 % der Schulwissenschaft, aber nur 20 % echter wissenschaftlicher Probleme

Das Allen Institute for AI analysiert zwei Benchmarks, die eine dramatische Kluft zwischen KI-Leistung bei Wissenstests und der Faehigkeit zu echten wissenschaftlichen Entdeckungen aufzeigen. Waehrend Modelle auf Schulniveau 80 % erreichen, fallen sie bei komplexen wissenschaftlichen Aufgaben auf 20 %.

🟡 🤝 Agenten 14. April 2026 · 2 Min. Lesezeit

ArXiv HiL-Bench: Wissen KI-Agenten, wann sie einen Menschen um Hilfe bitten sollten?

Der neue Benchmark HiL-Bench misst die Faehigkeit von KI-Agenten, ihre eigenen Grenzen zu erkennen und um menschliche Hilfe zu bitten, anstatt zu raten. Die Ergebnisse zeigen, dass selbst Frontier-Modelle schlecht einschaetzen, wann sie Hilfe benoetigen, aber gezieltes Training diese Faehigkeit verbessern kann.

🏥 In der Praxis (4)

🟡 🏥 In der Praxis 14. April 2026 · 2 Min. Lesezeit

Google Chrome: KI-Skills verwandeln Prompts in Ein-Klick-Werkzeuge

Google hat die Skills-Funktion in Chrome gestartet, die es Nutzern ermoeglicht, KI-Prompts als wiederverwendbare Ein-Klick-Werkzeuge zu speichern. Die Funktion nutzt Gemini und funktioniert auf Mac-, Windows- und ChromeOS-Plattformen.

🟡 🏥 In der Praxis 14. April 2026 · 2 Min. Lesezeit

Google Research: Vantage — KI-Plattform, die kritisches Denken und Kreativitaet durch Gespraeche mit Avataren bewertet

Google Research stellt in Zusammenarbeit mit der NYU Vantage vor, eine experimentelle Plattform, die generative KI zur Bewertung schwer messbarer menschlicher Faehigkeiten wie kritisches Denken und Kreativitaet einsetzt. Die KI-Bewertung zeigte eine Uebereinstimmung mit menschlichen Experten, die mit der Uebereinstimmung zwischen Experten vergleichbar ist.

🟢 🏥 In der Praxis 14. April 2026 · 1 Min. Lesezeit

AWS: Wie Sie Reward-Funktionen mit Lambda fuer das Fine-Tuning von Amazon-Nova-Modellen erstellen

Amazon Web Services hat einen detaillierten technischen Leitfaden zur Erstellung skalierbarer Reward-Funktionen mit AWS Lambda fuer die Anpassung von Amazon-Nova-Modellen veroeffentlicht. Der Leitfaden behandelt RLVR- und RLAIF-Ansaetze, das Design mehrdimensionaler Belohnungssysteme und Monitoring ueber CloudWatch.

🟢 🏥 In der Praxis 14. April 2026 · 1 Min. Lesezeit

Perplexity API: n8n-Integration, AWS Marketplace und neuer /v1/models-Endpoint

Perplexity hat im April 2026 mehrere API-Updates angekuendigt: eine native n8n-Integration fuer visuelle KI-Workflows, Verfuegbarkeit auf dem AWS Marketplace fuer vereinfachte Beschaffung sowie einen neuen /v1/models-Endpoint ohne Authentifizierung.

🛡️ Sicherheit (4)

🔴 🛡️ Sicherheit 14. April 2026 · 2 Min. Lesezeit

UK AISI: Claude Mythos Preview erreicht 73 % bei Experten-Cyber-Aufgaben — erstes Modell, das einen vollstaendigen Netzwerkangriff abschliesst

Das britische KI-Sicherheitsinstitut hat eine Evaluierung von Anthropics Claude Mythos Preview Modell veroeffentlicht, die bedeutende Fortschritte bei autonomen Cyber-Faehigkeiten zeigt. Das Modell ist das erste, das eine vollstaendige 32-Schritte-Simulation eines Angriffs auf ein Unternehmensnetzwerk erfolgreich abgeschlossen hat.

🟡 🛡️ Sicherheit 14. April 2026 · 2 Min. Lesezeit

ArXiv: Algorithmische Monokultur — LLMs koennen nicht divergieren, wenn sie es sollten

Neue Forschung zeigt, dass Sprachmodelle in Multi-Agenten-Koordinationsspielen eine hohe Basisaehnlichkeit (Monokultur) aufweisen und Schwierigkeiten haben, diverse Strategien aufrechtzuerhalten, selbst wenn Divergenz vorteilhaft waere. Dies hat Auswirkungen auf Systeme, die mehrere KI-Agenten verwenden.

🟡 🛡️ Sicherheit 14. April 2026 · 2 Min. Lesezeit

ArXiv OpenKedge: Kryptographisches Protokoll, das vor jeder KI-Agentenaktion eine Genehmigung verlangt

OpenKedge ist ein neues Sicherheitsprotokoll fuer autonome KI-Agenten, das vor der Ausfuehrung von Aenderungen eine explizite Genehmigung verlangt. Es verwendet kryptographische Beweisketten fuer vollstaendige Auditierbarkeit und verhindert unsichere Operationen im grossen Massstab.

🟡 🛡️ Sicherheit 14. April 2026 · 2 Min. Lesezeit

GitHub: Lernen Sie, KI-Agenten durch ein interaktives Sicherheitsspiel zu hacken

GitHub hat die vierte Staffel des Secure Code Game gestartet, die sich auf die Sicherheit von KI-Agenten konzentriert. Spieler lernen, Schwachstellen wie Prompt Injection, Memory Poisoning und Werkzeugmissbrauch ueber 5 aufeinander aufbauende Stufen auszunutzen.

✨ Interessantes (1)

🟢 ✨ Interessantes 14. April 2026 · 2 Min. Lesezeit

ArXiv Camera Artist: Multi-Agenten-KI-System, das Video mit filmischer Sprache generiert

Forscher haben Camera Artist vorgestellt, ein Multi-Agenten-System, das reale Filmproduktions-Workflows fuer die Generierung narrativer Videos modelliert. Das System koordiniert spezialisierte KI-Agenten, die die Rollen von Regisseur, Kameramann und Editor fuer kohaerentes visuelles Storytelling simulieren.

← Vorheriger Tag