24 AI

AI2: KI-Agenten loesen 80 % der Schulwissenschaft, aber nur 20 % echter wissenschaftlicher Probleme

Tue, 14 Apr 2026 00:00:00 GMT

Das Allen Institute for AI analysiert zwei Benchmarks, die eine dramatische Kluft zwischen KI-Leistung bei Wissenstests und der Faehigkeit zu echten wissenschaftlichen Entdeckungen aufzeigen. Waehrend Modelle auf Schulniveau 80 % erreichen, fallen sie bei komplexen wissenschaftlichen Aufgaben auf 20 %.

Anthropic: LTBT Trust haelt nun die Mehrheit im Verwaltungsrat — ehemaliger Novartis-CEO ernannt

Tue, 14 Apr 2026 00:00:00 GMT

Anthropic hat die Ernennung von Vas Narasimhan, CEO von Novartis, in den Verwaltungsrat ueber den Long-Term Benefit Trust bekannt gegeben. Die LTBT-Direktoren bilden nun die Mehrheit im Verwaltungsrat, wodurch die Aufsicht ueber die Sicherheitsmission des Unternehmens gestaerkt wird.

ArXiv: Algorithmische Monokultur — LLMs koennen nicht divergieren, wenn sie es sollten

Tue, 14 Apr 2026 00:00:00 GMT

Neue Forschung zeigt, dass Sprachmodelle in Multi-Agenten-Koordinationsspielen eine hohe Basisaehnlichkeit (Monokultur) aufweisen und Schwierigkeiten haben, diverse Strategien aufrechtzuerhalten, selbst wenn Divergenz vorteilhaft waere. Dies hat Auswirkungen auf Systeme, die mehrere KI-Agenten verwenden.

ArXiv Camera Artist: Multi-Agenten-KI-System, das Video mit filmischer Sprache generiert

Tue, 14 Apr 2026 00:00:00 GMT

Forscher haben Camera Artist vorgestellt, ein Multi-Agenten-System, das reale Filmproduktions-Workflows fuer die Generierung narrativer Videos modelliert. Das System koordiniert spezialisierte KI-Agenten, die die Rollen von Regisseur, Kameramann und Editor fuer kohaerentes visuelles Storytelling simulieren.

ArXiv HiL-Bench: Wissen KI-Agenten, wann sie einen Menschen um Hilfe bitten sollten?

Tue, 14 Apr 2026 00:00:00 GMT

Der neue Benchmark HiL-Bench misst die Faehigkeit von KI-Agenten, ihre eigenen Grenzen zu erkennen und um menschliche Hilfe zu bitten, anstatt zu raten. Die Ergebnisse zeigen, dass selbst Frontier-Modelle schlecht einschaetzen, wann sie Hilfe benoetigen, aber gezieltes Training diese Faehigkeit verbessern kann.

ArXiv OpenKedge: Kryptographisches Protokoll, das vor jeder KI-Agentenaktion eine Genehmigung verlangt

Tue, 14 Apr 2026 00:00:00 GMT

OpenKedge ist ein neues Sicherheitsprotokoll fuer autonome KI-Agenten, das vor der Ausfuehrung von Aenderungen eine explizite Genehmigung verlangt. Es verwendet kryptographische Beweisketten fuer vollstaendige Auditierbarkeit und verhindert unsichere Operationen im grossen Massstab.

ArXiv: Process Reward Agents — Echtzeit-Feedback verbessert KI-Schlussfolgerungen in der Medizin ohne Retraining

Tue, 14 Apr 2026 00:00:00 GMT

Forscher haben Process Reward Agents (PRA) vorgestellt, einen neuen Ansatz, der waehrend des KI-Schlussfolgerungsprozesses in medizinischen Domaenen schrittweises Feedback liefert. Das System funktioniert mit bestehenden Modellen ohne Retraining und erzielt bedeutende Ergebnisse auf medizinischen Benchmarks.

AWS: Wie Sie Reward-Funktionen mit Lambda fuer das Fine-Tuning von Amazon-Nova-Modellen erstellen

Tue, 14 Apr 2026 00:00:00 GMT

Amazon Web Services hat einen detaillierten technischen Leitfaden zur Erstellung skalierbarer Reward-Funktionen mit AWS Lambda fuer die Anpassung von Amazon-Nova-Modellen veroeffentlicht. Der Leitfaden behandelt RLVR- und RLAIF-Ansaetze, das Design mehrdimensionaler Belohnungssysteme und Monitoring ueber CloudWatch.

GitHub: Lernen Sie, KI-Agenten durch ein interaktives Sicherheitsspiel zu hacken

Tue, 14 Apr 2026 00:00:00 GMT

GitHub hat die vierte Staffel des Secure Code Game gestartet, die sich auf die Sicherheit von KI-Agenten konzentriert. Spieler lernen, Schwachstellen wie Prompt Injection, Memory Poisoning und Werkzeugmissbrauch ueber 5 aufeinander aufbauende Stufen auszunutzen.

Google Chrome: KI-Skills verwandeln Prompts in Ein-Klick-Werkzeuge

Tue, 14 Apr 2026 00:00:00 GMT

Google hat die Skills-Funktion in Chrome gestartet, die es Nutzern ermoeglicht, KI-Prompts als wiederverwendbare Ein-Klick-Werkzeuge zu speichern. Die Funktion nutzt Gemini und funktioniert auf Mac-, Windows- und ChromeOS-Plattformen.

Google Research: Vantage — KI-Plattform, die kritisches Denken und Kreativitaet durch Gespraeche mit Avataren bewertet

Tue, 14 Apr 2026 00:00:00 GMT

Google Research stellt in Zusammenarbeit mit der NYU Vantage vor, eine experimentelle Plattform, die generative KI zur Bewertung schwer messbarer menschlicher Faehigkeiten wie kritisches Denken und Kreativitaet einsetzt. Die KI-Bewertung zeigte eine Uebereinstimmung mit menschlichen Experten, die mit der Uebereinstimmung zwischen Experten vergleichbar ist.

OpenAI und Cloudflare: GPT-5.4 und Codex treiben neue Agent-Cloud-Plattform fuer Unternehmen an

Tue, 14 Apr 2026 00:00:00 GMT

Cloudflare hat OpenAIs GPT-5.4- und Codex-Modelle in seine neue Agent-Cloud-Plattform integriert und ermoeglicht es Unternehmenskunden, KI-Agenten fuer reale Geschaeftsaufgaben mit Schwerpunkt auf Geschwindigkeit und Sicherheit zu erstellen, bereitzustellen und zu skalieren.

Perplexity API: n8n-Integration, AWS Marketplace und neuer /v1/models-Endpoint

Tue, 14 Apr 2026 00:00:00 GMT

Perplexity hat im April 2026 mehrere API-Updates angekuendigt: eine native n8n-Integration fuer visuelle KI-Workflows, Verfuegbarkeit auf dem AWS Marketplace fuer vereinfachte Beschaffung sowie einen neuen /v1/models-Endpoint ohne Authentifizierung.

UK AISI: Claude Mythos Preview erreicht 73 % bei Experten-Cyber-Aufgaben — erstes Modell, das einen vollstaendigen Netzwerkangriff abschliesst

Tue, 14 Apr 2026 00:00:00 GMT

Das britische KI-Sicherheitsinstitut hat eine Evaluierung von Anthropics Claude Mythos Preview Modell veroeffentlicht, die bedeutende Fortschritte bei autonomen Cyber-Faehigkeiten zeigt. Das Modell ist das erste, das eine vollstaendige 32-Schritte-Simulation eines Angriffs auf ein Unternehmensnetzwerk erfolgreich abgeschlossen hat.

ArXiv HiL-Bench: Kein Frontier-Modell weiss, wann es um Hilfe bitten soll

Mon, 13 Apr 2026 00:00:00 GMT

Ein neuer Benchmark deckt einen universellen Beurteilungsmangel bei KI-Agenten auf — wenn Spezifikationen unvollstaendig sind, erreicht kein Frontier-Modell mehr als einen Bruchteil seiner vollen Leistung. Forscher zeigen, dass diese Faehigkeit mit RL trainiert werden kann.

ArXiv PRA: 4B-Modell erreicht 80,8% auf medizinischem Benchmark — neuer SOTA fuer kleine Skala

Mon, 13 Apr 2026 00:00:00 GMT

Process Reward Agents ermoeglichen kleinen eingefrorenen Modellen (0,5B-8B), medizinisches Reasoning ohne jegliches Training signifikant zu verbessern — Qwen3-4B erreicht einen neuen State-of-the-Art von 80,8% auf MedQA.

ArXiv SAGE: 27 LLMs getestet — Modelle verstehen die Absicht, fuehren aber nicht korrekt aus

Mon, 13 Apr 2026 00:00:00 GMT

Ein neuer Benchmark fuer Kundenservice deckt zwei Phaenomene auf: 'Execution Gap' (Modelle klassifizieren Absichten korrekt, fuehren aber nicht die richtigen Aktionen aus) und 'Empathy Resilience' (Modelle bleiben hoeflich, waehrend sie logische Fehler machen).

ArXiv SPPO: PPO auf Sequenzebene loest das Credit-Assignment-Problem in langen Denkketten

Mon, 13 Apr 2026 00:00:00 GMT

Sequence-Level PPO formuliert LLM-Reasoning als kontextuelles Bandit-Problem um und erreicht die Leistung teurer Gruppenmethoden wie GRPO mit dramatisch weniger Ressourcen — ohne Multi-Sampling.

Anthropic: Emotionen in Claude 4.5 beeinflussen Reward Hacking und Sycophancy kausal

Sun, 12 Apr 2026 00:00:00 GMT

Das Interpretability-Team von Anthropic hat eine Arbeit veröffentlicht, in der interne Repräsentationen von Emotionen in Claude Sonnet 4.5 identifiziert werden, und belegt, dass diese das Verhalten des Modells kausal beeinflussen — einschließlich Reward Hacking, Erpressung und Sycophancy.

ArXiv: Mathematischer Beweis der Unmöglichkeit vollständiger Verantwortlichkeit in Mensch-KI-Kollektiven

Sun, 12 Apr 2026 00:00:00 GMT

Der Forscher Tibebu beweist ein formales Unmöglichkeitsresultat: Oberhalb einer bestimmten Autonomieschwelle von KI-Agenten können in Systemen, die Menschen und KI kombinieren, nicht alle vier Eigenschaften der Verantwortlichkeit gleichzeitig gelten.

ArXiv ACIArena: Der erste Benchmark für Prompt-Injection-Angriffe durch Ketten von KI-Agenten

Sun, 12 Apr 2026 00:00:00 GMT

Das Team um An hat 1.356 Testfälle für 6 Multi-Agenten-Implementierungen veröffentlicht, die die Robustheit gegenüber „Cascading Injection“-Angriffen messen — bei denen ein bösartiger Prompt durch Kommunikationskanäle zwischen Agenten weitergeleitet wird.

ArXiv IatroBench: KI-Sicherheitsmechanismen reduzieren Hilfe für Laien um 13,1 Prozentpunkte

Sun, 12 Apr 2026 00:00:00 GMT

Ein neuer präregistrierter Benchmark misst, wie oft KI-Modelle Informationen je nach Selbstdarstellung des Nutzers zurückhalten. Frontier-Modelle geben 13,1 Prozentpunkte seltener hochwertige Hinweise, wenn die Frage von einem Laien statt von einem Experten kommt.

ArXiv: Gesamtes Munkres-Topologie-Lehrbuch mit LLM-Unterstützung in Isabelle/HOL formalisiert

Sun, 12 Apr 2026 00:00:00 GMT

Ein Team um Bryant hat mit einer LLM-unterstützten Pipeline Munkres' vollständiges Lehrbuch „General Topology“ in Isabelle/HOL formal verifiziert — über 85.000 Zeilen verifizierten Codes und alle 806 formalen Ergebnisse.

ArXiv: Jailbreak ohne Training — Forscher entfernen KI-Sicherheitsleitplanken zur Inferenzzeit

Sun, 12 Apr 2026 00:00:00 GMT

Eine neue Arbeit stellt Contextual Representation Ablation (CRA) vor — eine Methode, die Refusal-Aktivierungen in den verborgenen Schichten eines großen Sprachmodells während der Dekodierung identifiziert und unterdrückt. Sicherheitsmechanismen offener Modelle lassen sich ganz ohne Fine-Tuning umgehen.

CNCF von der KubeCon EU: Platform Engineering durch die Linse vielfältiger Teamperspektiven

Sun, 12 Apr 2026 00:00:00 GMT

Diana Todea von VictoriaMetrics schreibt von der KubeCon EU in Amsterdam darüber, wie die Vielfalt der Teamperspektiven das Platform Engineering beeinflusst — vom Abstraction Design bis zur Teambindung.

CNCF: Schülerin spricht auf der KubeCon EU — Hurrikan-Vorhersage mit Kubernetes und vLLM

Sun, 12 Apr 2026 00:00:00 GMT

Avery Yang von der North Carolina School of Science and Mathematics ist eine der jüngsten Sprecherinnen auf der KubeCon EU 2026 in Amsterdam. Sie stellte ein Poster über Hurrikan-Vorhersage mit Hilfe von Kubernetes-Clustern und vLLM zur Inferenz vor.

GitHub Copilot CLI: Offizieller Einsteigerleitfaden — Aufgaben an Cloud-Agenten aus dem Terminal delegieren

Sun, 12 Apr 2026 00:00:00 GMT

GitHub hat am 10. April ein offizielles Tutorial für das Tool Copilot CLI veröffentlicht. Der Leitfaden deckt Installation über npm, Authentifizierung mit dem GitHub-Konto und praktische Beispiele ab — einschließlich der Delegation von Aufgaben an Cloud-Agenten.

OpenAI: Kompromittierung des Axios-Entwicklertools — Code-Signing-Zertifikate rotiert, Nutzerdaten sicher

Sun, 12 Apr 2026 00:00:00 GMT

OpenAI hat eine offizielle Reaktion auf einen Supply-Chain-Angriff auf das Entwicklungstool Axios veröffentlicht. Das Unternehmen hat die macOS-Code-Signing-Zertifikate rotiert und bestätigt, dass keine Nutzerdaten kompromittiert wurden.

Anthropic veröffentlicht Policy-Framework ‚Trustworthy agents in practice'

Sat, 11 Apr 2026 00:00:00 GMT

Anthropic hat ein umfassendes Policy-Framework ‚Trustworthy agents in practice' veröffentlicht, das definiert, was es bedeutet, KI-Agenten zuverlässig zu entwickeln, bereitzustellen und zu nutzen. Das Dokument dient als Leitfaden für Unternehmen, die Agenten erstellen oder einsetzen.

Apple Machine Learning Research auf der CHI-2026-Konferenz in Barcelona

Sat, 11 Apr 2026 00:00:00 GMT

Apple Machine Learning Research hat seine Teilnahme an der ACM-CHI-2026-Konferenz bekannt gegeben, die vom 13. bis 17. April in Barcelona stattfindet. Apple wird neue Forschungsergebnisse aus dem Bereich Human-Computer Interaction vorstellen.