Mittwoch, 22. April 2026

16 Nachrichten — 🔴 3 kritisch , 🟡 7 wichtig , 🟢 6 interessant

🤖 Modelle (2)

🟢 🤖 Modelle 22. April 2026 · 2 Min. Lesezeit

MathNet: 30.676 Olympiade-Aufgaben aus 47 Ländern, SOTA-Modelle liegen noch zurück

Redaktionelle Illustration: Verbundene Knoten mit mathematischen Symbolen und Globusfragmenten aus 47 Ländern

Ein MIT-Team veröffentlichte MathNet, einen multimodalen Benchmark mit 30.676 olympiadischen Mathematikaufgaben aus 47 Ländern und 17 Sprachen. Gemini-3.1-Pro erreicht 78,4%, GPT-5 69,3%, und Embedding-Modelle haben erhebliche Schwierigkeiten, mathematisch äquivalente Probleme zu finden.

🟢 🤖 Modelle 22. April 2026 · 2 Min. Lesezeit

xAI Speech-to-Text-API verlässt Beta: allgemeine Verfügbarkeit für 25 Sprachen

Redaktionelle Illustration: Mikrofon und Audiowellenströme werden durch die Grok-API in Transkripte in 25 Sprachen umgewandelt

xAI hat bekannt gegeben, dass seine Speech-to-Text-API (STT) von der Beta-Phase in die allgemeine Verfügbarkeit übergeht. Der Dienst unterstützt 25 Sprachen, bietet Batch- und Streaming-Modus und ist ohne Warteliste verfügbar — womit der Sprach-Stack neben dem bereits allgemein verfügbaren Grok Voice Agent vervollständigt wird.

📦 Open Source (1)

🟢 📦 Open Source 22. April 2026 · 2 Min. Lesezeit

WorldDB: Memory-Engine, der Vektordatenbank und Weltgraph für KI-Agenten vereint

Redaktionelle Illustration: Vektordatenbank und Knotengraph durch Ontologie verbunden im Agenten-Gedächtnis

WorldDB ist eine neue Memory-Engine für KI-Agenten, die eine Vektordatenbank mit einem Graphen verschachtelter Welten und einer Ontologie kombiniert. Sie gleicht Wissen beim Schreiben ab und verhindert Widersprüche im Agenten-Gedächtnis — mit 96,40 % Genauigkeit auf dem LongMemEval-s-Benchmark.

⚖️ Regulierung (1)

🟡 ⚖️ Regulierung 22. April 2026 · 3 Min. Lesezeit

EU eröffnet Ausschreibung für KI-Desinformation und Deepfake-Einflusskampagnen

Redaktionelle Illustration: Waage der Gerechtigkeit mit gebrochenem Bildschirm und Roboterarm, EU-Kampf gegen KI-Desinformation

Die Europäische Kommission hat die Ausschreibung DIGITAL-2026-BESTUSE-AWARENESS im Wert von 6 Millionen Euro eröffnet, um einen gemeinsamen Forschungsrahmen gegen manipulative KI-Inhalte aufzubauen. Die Ausschreibung setzt den im November 2025 angekündigten Europäischen Demokratischen Schild um und nimmt Anträge bis 1. Oktober 2026 entgegen.

🤝 Agenten (5)

🔴 🤝 Agenten 22. April 2026 · 4 Min. Lesezeit

Google ReasoningBank: Agenten lernen aus Erfahrung ohne Retraining, +8,3% Erfolg auf WebArena

Redaktionelle Illustration: Roboter in einem Labyrinth mit beleuchteten Knoten, die gelerntes Wissen darstellen

Google hat ReasoningBank vorgestellt, ein Speicher-Framework, das KI-Agenten ermöglicht, aus eigenen Erfolgen und Misserfolgen zu lernen, ohne das Sprachmodell neu zu trainieren. Auf dem WebArena-Benchmark wurde eine 8,3% höhere Erfolgsrate erzielt, auf SWE-Bench-Verified 4,6% mit etwa 3 Schritten weniger pro Aufgabe.

🔴 🤝 Agenten 22. April 2026 · 4 Min. Lesezeit

OpenAI skaliert Codex für Unternehmen: Codex Labs-Programm und 4 Millionen wöchentliche Nutzer

Redaktionelle Illustration: Futuristische Stadtsilhouette mit KI-Entität, Unternehmenshochhäusern und Code-Bildschirmen

OpenAI hat das Codex Labs-Programm und strategische Partnerschaften mit Accenture, Deloitte und KPMG gestartet, um den Codex-Agenten in große Unternehmen weltweit zu bringen. Das Tool hat 4 Millionen wöchentliche aktive Nutzer erreicht, bietet Zertifizierungen für Berater sowie Enterprise-Pakete mit verbrauchsbasiertem Abrechnungsmodell.

🟡 🤝 Agenten 22. April 2026 · 2 Min. Lesezeit

Agent-World: skalierbare Umgebungssynthese für die Evolution von KI-Agenten — Renmin University

Redaktionelle Illustration: Dynamische Umgebungen mit Landschaften und Städten, automatisch für das Training von KI-Agenten generiert

Agent-World ist ein neues Forschungsrahmenwerk der chinesischen Renmin University, das automatisch Tausende von vielfältigen Umgebungen für das Training von KI-Agenten generiert. Es ersetzt manuell erstellte Benchmarks durch dynamische Szenarien und ermöglicht evolutionäres Lernen durch Koevolution von Agent und Umgebung.

🟡 🤝 Agenten 22. April 2026 · 3 Min. Lesezeit

Gemini Deep Research erhält MCP-Integration, kollaborative Planung und zwei neue Versionen

Redaktionelle Illustration: Roboter-Silhouette mit modularen Servern und Datenströmen für den Deep Research-Agenten

Google hat zwei neue Deep Research-Agenten-Versionen in der Gemini API gestartet — deep-research-preview-04-2026 und deep-research-max-preview-04-2026 — mit MCP-Server-Integration, kollaborativer Planung, Visualisierungen und Streaming-Antworten. Der Schritt positioniert Gemini als ernsthaften Konkurrenten zu ChatGPT Deep Research und Perplexity Deep Research.

🟡 🤝 Agenten 22. April 2026 · 3 Min. Lesezeit

Multi-Agent-Systems-Survey: von klassischen Paradigmen zur Zukunft großer Sprachmodelle

Redaktionelle Illustration: Vernetzte KI-Agenten in Kommunikation überbrücken das klassische Paradigma mit der modernen LLM-Ära

Ein neuer arXiv-Survey verbindet umfassend die klassische Multi-Agent-Systems-Literatur mit dem modernen LLM-Agenten-Stack. Die Arbeit identifiziert einen Paradigmenwechsel in Koordination, Kommunikationsprotokollen und emergentем Verhalten — vom Austausch niedrigstufiger Zustände zum semantischen Reasoning.

🔧 Hardware (1)

🔴 🔧 Hardware 22. April 2026 · 3 Min. Lesezeit

Google stellt 8. TPU-Generation vor: zwei spezialisierte Varianten für die Ära der agentischen KI

Redaktionelle Illustration: Zwei spezialisierte TPU-Chips der 8. Generation für Training und Inferenz agentischer KI-Workloads

Auf der Cloud Next '26 stellte Google die achte Generation seiner TPU-Chips in zwei spezialisierten Varianten vor — TPU 8t für das Modelltraining und TPU 8i für agentische Inferenz. Es ist die erste Generation, die gezielt für autonome KI-Agenten und mehrstufiges Reasoning entwickelt wurde.

🏥 In der Praxis (3)

🟡 🏥 In der Praxis 22. April 2026 · 3 Min. Lesezeit

Claude Cowork kommt zu Amazon Bedrock — KI für ganze Organisationen

Redaktionelle Illustration: Claude Cowork-Anwendung auf dem Desktop in einer AWS Bedrock-Umgebung für Enterprise-Teams

AWS und Anthropic ermöglichen die Ausführung der Claude Cowork Desktop-Anwendung innerhalb von AWS-Konten über Amazon Bedrock. Daten bleiben unter der Kontrolle des Nutzers, Modelle werden nicht darauf trainiert, und die Integration mit IAM und CloudTrail bietet Enterprise-grade Auditing. Die Abrechnung erfolgt über bestehende AWS-Verträge.

🟢 🏥 In der Praxis 22. April 2026 · 2 Min. Lesezeit

HolmesGPT und CNCF-Tools diagnostizieren Kubernetes-Alerts automatisch für 0,04 Dollar

Redaktionelle Illustration: Kubernetes-Übersichtskonsole mit Alarmen und Roboterarm für automatische Diagnose

Das STCLab SRE-Team nutzt HolmesGPT mit dem ReAct-Muster und CNCF-Tools für die automatische Diagnose von Kubernetes-Alerts. Die Kosten betragen 0,04 Dollar pro Untersuchung, rund 40% der Alerts werden autonom gelöst, und die wichtigste Lektion: Qualitäts-Runbooks sind wichtiger als die Modellwahl.

🟢 🏥 In der Praxis 22. April 2026 · 2 Min. Lesezeit

On-Device-Psychiatrie-KI: Gemma, Phi und Qwen arbeiten ohne Cloud-Datenübertragung

Redaktionelle Illustration: Mobilgerät mit psychiatrischer KI-Anwendung und lokalen neuronalen Netzen

Forscher unter der Leitung von Eranga Bandara veröffentlichten eine mobile Anwendung, die Gemma, Phi-3.5-mini und Qwen2 lokal für DSM-5-konforme psychiatrische Bewertungen orchestriert. Das System sendet keine Daten in die Cloud und zielt auf sensible Kontexte wie Militär, Strafvollzug und Ferngesundheitsversorgung.

🛡️ Sicherheit (3)

🟡 🛡️ Sicherheit 22. April 2026 · 3 Min. Lesezeit

DESPITE-Benchmark: LLMs planen gut für Roboter, aber nicht sicher

Redaktionelle Illustration: Roboter plant einen Weg durch ein Labyrinth mit einem fragilen digitalen Sicherheitsschild

Der neue DESPITE-Benchmark evaluierte 23 Sprachmodelle auf 12.279 Roboter-Planungsaufgaben. Ergebnis: Der beste Planer scheitert in nur 0,4% der Fälle, produziert aber in 28,3% gefährliche Pläne. Planung und Sicherheit sind orthogonale Fähigkeiten — das Skalieren von Modellen behebt keine Sicherheitsmängel.

🟡 🛡️ Sicherheit 22. April 2026 · 3 Min. Lesezeit

HuggingFace-Manifest: Open Source als Grundlage der KI-Cybersicherheit

Redaktionelle Illustration: Gebrochener digitaler Schutzschild mit Open-Source-Bausteinen als Fundament der KI-Sicherheit

HuggingFace hat ein Manifest veröffentlicht, in dem Margaret Mitchell, Yacine Jernite, Clem Delangue und 17 Mitautoren argumentieren, dass geschlossene KI-Systeme eine einzige Fehlerquelle in der Cybersicherheit darstellen. Der Text antwortet auf Anthropics Mythos und fordert semi-autonome Agenten mit auditierbaren Protokollen und menschlicher Aufsicht.

🟢 🛡️ Sicherheit 22. April 2026 · 2 Min. Lesezeit

GitHub CodeQL erhält deklarative Sanitizer und Validatoren — ohne QL-Code

Redaktionelle Illustration: Digitale Festung mit Schlössern für 8 Programmiersprachen schützt Code vor Schwachstellen

GitHub hat in CodeQL 2.25.2 die deklarative Definition von Sanitizern und Validatoren über YAML ermöglicht, ohne QL-Code schreiben zu müssen. Acht Sprachen werden unterstützt (C/C++, C#, Go, Java/Kotlin, JS/TS, Python, Ruby, Rust), was statische Sicherheitsanalyse für Teams ohne QL-Experten demokratisiert.

← Vorheriger Tag Nächster Tag →