🏥 In der Praxis

100 Nachrichten

🟡 🏥 In der Praxis 23. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.22681: CUSP-Benchmark zeigt, dass Frontier-Modelle wissenschaftliche Durchbrüche nicht zuverlässig vorhersagen können

Editorial-Illustration: wissenschaftliche Kurve mit Durchbruchspunkt und KI-System verfehlt Vorhersage

Der CUSP-Benchmark testet die Fähigkeit von KI-Modellen, wissenschaftliche Durchbrüche aus einer Datenbank mit 4.700 Ereignissen vorherzusagen. Frontier-Modelle (GPT-5, Claude Opus 4.7, Gemini 3 Pro) identifizieren plausible Forschungsrichtungen, schätzen Ergebnisse und Timing jedoch systematisch mit übermäßiger Sicherheit falsch ein. Zusätzlicher Pre-Cutoff-Kontext hilft nicht — die Einschränkung ist struktureller Natur.

🟡 🏥 In der Praxis 23. Mai 2026 · 2 Min. Lesezeit

GitHub: Gartner Magic Quadrant 2026 — GitHub Copilot zum dritten Mal Leader bei Enterprise AI Coding Agents

Editorial-Illustration: Quadrantenmatrix mit GitHub Copilot positioniert im Leader-Sektor

Gartner positionierte GitHub in seinem Magic-Quadrant-Bericht 2026 für Enterprise AI Coding Agents als Leader — zum dritten Mal in Folge seit Bestehen der Kategorie. GitHub Copilot wird derzeit von 140.000 Organisationen weltweit genutzt; die Bewertung betonte agentische Workflows, die den gesamten SDLC von Code über Review bis Sicherheit und Governance abdecken.

🟢 🏥 In der Praxis 23. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.22337: Meta-Soft führt KV-Cache-Komprimierung mit komponierbaren Meta-Token und lernbaren orthogonalen Basen ein

Editorial-Illustration: Meta-Token komprimieren Attention-Cache in eine orthogonale Basisstruktur

Forscher präsentierten Meta-Soft, eine neue Methode zur dynamischen KV-Cache-Komprimierung bei LLM-Inferenz. Der Ansatz nutzt eine lernbare orthogonale Basismatrix und ein Selector-Netzwerk, die Soft-Meta-Token synthetisieren — eine komprimierte Darstellung wichtiger Informationen aus langen Prompts. Ein Attention-Flow-Mechanismus verteilt semantische Informationen gelöschter Token auf beibehaltene um und übertrifft bestehende Eviction-Methoden.

🟢 🏥 In der Praxis 23. Mai 2026 · 4 Min. Lesezeit

arXiv:2605.22664: WorkstreamBench testet KI-Agenten auf End-to-End-Tabellenkalkulationsaufgaben im Finanzbereich — und Frontier-Modelle scheitern

Redaktionelle Illustration: Excel-Tabellenkalkulation mit Formeln und KI-Agent, der diese analysiert

WorkstreamBench ist ein neuer Benchmark mit zehn Autoren unter der Leitung von Thomson Yen, der KI-Agenten auf realen Excel- und Tabellenkalkulationsaufgaben im Finanzbereich testet — Rechnungen, Berichte, Kostenanalyse. GPT-4o, Claude und Gemini werden verglichen, und keines besteht den vollständigen Aufgabensatz zuverlässig — ein Hinweis auf strukturelle Mängel in der aktuellen Agenten-Infrastruktur für das Enterprise-Finanzwesen.

🟢 🏥 In der Praxis 23. Mai 2026 · 2 Min. Lesezeit

Anthropic Claude Code v2.1.150 — interner Infrastruktur-Patch ohne nutzerseitige Änderungen

Redaktionelle Illustration: Claude Code Terminal mit Versionsnummerierung und internen Zahnrädern

Anthropic hat am Samstag um 04:03 UTC Claude Code CLI Version v2.1.150 veröffentlicht — nur einen Tag nach v2.1.149. Das Release enthält ausschließlich interne Infrastrukturverbesserungen ohne nutzerseitige Änderungen. Verfügbar für Darwin, Linux und Windows auf ARM64- und x64-Architekturen sowie als Linux-musl-Build.

🟡 🏥 In der Praxis 22. Mai 2026 · 3 Min. Lesezeit

arXiv:2605.21427: PALS — energiebewusstes LLM-Serving für MoE-Modelle erreicht +26,3 % Energieeffizienz und 4-7× weniger QoS-Verstöße

Editorial illustration: arXiv:2605.21427 — PALS erreicht +26,3 % Energieeffizienz und 4-7× weniger QoS-Verstöße im MoE-LLM-Serving

Forscher veröffentlichten am 21. Mai 2026 PALS auf dem arXiv-Preprint-Server — ein Laufzeitsystem, das GPU-Leistungssteuerung direkt in das LLM-Serving für Mixture-of-Experts-Modelle integriert. PALS nutzt leichtgewichtige Offline-Power-Performance-Modelle und einen Feedback-Controller, der Konfigurationen dynamisch auf Durchsatzziele optimiert. Erreicht werden 26,3 % bessere Energieeffizienz und 4-7× weniger QoS-Verstöße unter Leistungsbeschränkungen — Integration in vLLM ohne API-Änderungen oder Modell-Retraining. PALS adressiert den wachsenden operativen Engpass von Rechenzentren: GPU-Cluster-Energieverbrauch als dominante Wachstumsschranke.

🟢 🏥 In der Praxis 22. Mai 2026 · 3 Min. Lesezeit

CNCF: NetEase Games erreicht 30-Sekunden-LLM-Cold-Start auf Kubernetes über Fluid-Prefetching-Schichten

Editorial illustration: NetEase Games erreicht 30-Sekunden-LLM-Cold-Start auf Kubernetes über Fluid-Prefetching-Schichten

CNCF veröffentlichte am 21. Mai 2026 eine Fallstudie von NetEase Games (Autoren Haifeng Liao und Xiang Zhang), die beschreibt, wie Ladezeiten für 70B-Klasse-LLM-Modelle mithilfe des CNCF-inkubierten Fluid-Projekts von 42 Minuten (direkter S3-Zugriff) auf unter 30 Sekunden reduziert wurden. Kern der Lösung ist eine Fluid-Prefetching-Schicht, die Modelle zwischen Teams teilt statt sie mehrfach zu cachen, kombiniert mit Pre-Warming-Scheduling zur Eliminierung von Cold Starts. Eine technische Fallstudie für alle, die serverless LLM-Inferenz auf Kubernetes mit großen Modellen betreiben.

🟡 🏥 In der Praxis 21. Mai 2026 · 2 Min. Lesezeit

AWS: SageMaker AI erhält OpenAI-kompatible API-Endpunkte

Redaktionelle Illustration: AWS SageMaker AI OpenAI-kompatible API-Endpunkte als Drop-in-Ersatz auf eigener GPU-Infrastruktur

AWS kündigte am 20. Mai 2026 an, dass Amazon SageMaker AI nun einen OpenAI-kompatiblen API auf seinen Echtzeit-Inferenz-Endpunkten bereitstellt — ein Drop-in-Ersatz für das OpenAI SDK, LangChain und Strands Agents, der nur eine URL-Änderung erfordert. Endpunkte stellen den /openai/v1-Pfad mit Chat Completions und Streaming bereit; die Authentifizierung nutzt zeitlich begrenzte Bearer-Token aus AWS-Credentials.

🟡 🏥 In der Praxis 21. Mai 2026 · 2 Min. Lesezeit

Google DeepMind: WeatherNext sagte Hurrikan Melissa als Kategorie 5 fünf Tage voraus

Redaktionelle Illustration: Google DeepMind WeatherNext erste 5-Tage-Kategorie-5-Prognose für Hurrikan Melissa

Google DeepMind gab am 19. Mai 2026 bekannt, dass sein WeatherNext-Modell Hurrikan Melissa fünf Tage im Voraus mit 80 Prozent Zuverlässigkeit als Kategorie 5 korrekt vorhersagte — ein Novum in der modernen Meteorologie. Das Modell nutzt ein Ensemble aus 50 parallelen Szenarien und wurde vom US-amerikanischen National Hurricane Center als bestes Modell der Hurrikansaison 2025 gewertet.

🟢 🏥 In der Praxis 19. Mai 2026 · 2 Min. Lesezeit

CNCF: Kubernetes-Debugger löscht Spuren — ernstes Problem für Sicherheitsaudits

Editorial illustration: CNCF warnt, dass kubectl debug nach Sitzungsende keinerlei Aufzeichnung über Container-Zugriffe hinterlässt

CNCF warnt, dass kubectl debug — ein Tool zur Diagnose von Kubernetes-Containern — nach Sitzungsende keinerlei Aufzeichnung hinterlässt. Regulierte Branchen können daher eine Schlüsselfrage nicht beantworten: Wer hat welchen Container wie lange eingesehen — ein direkter Verstoß gegen PCI-DSS- und SOC-2-Auditprotokoll-Anforderungen.

🟡 🏥 In der Praxis 16. Mai 2026 · 2 Min. Lesezeit

GitHub: Copilot Memory merkt sich Commit-Stil, PR-Struktur und Kommunikationspräferenzen über alle Repositories hinweg

Redaktionelle Illustration: Copilot-Interface mit Memory-Symbolen, die Repositories miteinander verbinden.

GitHub Copilot Memory User Preferences ist eine neue Personalisierungsfunktion, veröffentlicht am 15. Mai 2026, die es Copilot ermöglicht, Nutzerpräferenzen über das gesamte Repository-Ökosystem hinweg zu speichern. Copilot Memory erfasst Commit-Message-Stil, Pull-Request-Struktur und Kommunikationspräferenzen (formaler vs. informeller Ton, Detailgrad) — und wendet diese konsistent in jedem Repository an, an dem der Nutzer arbeitet. Die Funktion ist Teil einer umfassenderen Copilot-Personalisierungsschicht, die mit den adaptiven Features von Cursor und Codeium konkurriert.

🟡 🏥 In der Praxis 16. Mai 2026 · 3 Min. Lesezeit

OpenAI: ChatGPT Personal Finance — Pro-Abonnenten in den USA verbinden Finanzkonten sicher für KI-gestützte Einblicke

Redaktionelle Illustration: Finanz-Dashboard mit KI-Gesprächsansicht und Bankintegrationssymbolen.

ChatGPT Personal Finance ist ein neues OpenAI-Feature, das am 15. Mai 2026 angekündigt wurde und Pro-Abonnenten in den USA ermöglicht, Finanzkonten sicher zu verbinden, um KI-gestützte Einblicke zu erhalten, die im finanziellen Kontext, den Zielen und Prioritäten des Nutzers verankert sind. Die Funktion erweitert ChatGPT vom allgemeinen Chat-Werkzeug zu einem personalisierten Finanzassistenten und steht in direktem Wettbewerb mit Google Finance und dem finance_search-Werkzeug von Perplexity (angekündigt am 13.5.).

🟡 🏥 In der Praxis 16. Mai 2026 · 3 Min. Lesezeit

OpenAI + Databricks: GPT-5.5 in Enterprise-Agent-Workflows integriert nach neuen OfficeQA-Pro-Benchmark-Rekorden

Redaktionelle Illustration: Databricks- und OpenAI-Logos mit GPT-5.5-Symbol und Enterprise-Agent-Workflow-Darstellung.

Die OpenAI-Databricks-Integration ist eine neue Enterprise-Agent-Partnerschaft, die am 15. Mai 2026 angekündigt wurde und das GPT-5.5-Modell in die Databricks-Plattform für den Aufbau von Agent-Workflows bringt. Die Ankündigung markiert den ersten expliziten Einsatz von GPT-5.5 über einen Partnerkanal — das Modell hat Rekorde auf den OfficeQA-Pro-Benchmarks aufgestellt und ist nun Enterprise-Kunden über die Databricks-Mosaic-KI-Laufzeitumgebung zugänglich. Alle Anthropic-Claude-Alternativen, Google Gemini und Mistral-Wettbewerber erhalten einen ernsthaften Herausforderer im Databricks-Ökosystem.

🟢 🏥 In der Praxis 16. Mai 2026 · 3 Min. Lesezeit

AWS: Amazon Quick — dokumentbasierte Zugriffskontrolle für S3-Knowledge-Bases mit Deny-by-Default und ALLOW/DENY-Regeln

Redaktionelle Illustration: Dokumentenbasis mit ACL-Schicht und Benutzeridentitätsprüfung vor dem Zugriff.

Die dokumentbasierte Zugriffskontrolle für Amazon Quick ist ein neuer Enterprise-RAG-Sicherheitsmechanismus, veröffentlicht am 15. Mai 2026 von Josh DeMuth. Sie ermöglicht Dokument-Level-ACLs für S3-Knowledge-Bases innerhalb von Amazon Quick über zwei Konfigurationsmethoden: eine globale ACL-Datei (zentralisiertes JSON für stabile Strukturen) und dokumentbasierte Metadatendateien. Das System verwendet Deny-by-Default und unterstützt ALLOW/DENY-Regeln auf Benutzer- und Gruppenebene, wobei DENY stets gewinnt.

🟡 🏥 In der Praxis 15. Mai 2026 · 2 Min. Lesezeit

Amazon Lex: Assisted NLU LLM-Modus erreicht 92 % Intent-Genauigkeit und 84 % Slot-Auflösung ohne Aufpreis

Redaktionelle Illustration: Chatbot-Intent-Flow mit ML- und LLM-Komponenten.

Amazon Lex Assisted NLU ist ein neuer LLM-gestützter Modus für Chatbots, der am 14. Mai 2026 angekündigt wurde und die traditionelle Lex-NLU mit großen Sprachmodellen aufwertet. Er erreicht durchschnittlich 92 % Intent-Klassifizierungsgenauigkeit und 84 % Slot-Auflösungsgenauigkeit sowie 11-15 % Verbesserung der Intent-Klassifizierung und 23,5 % weniger Fallback-Antworten in realen Einsatzszenarien. Verfügbar in zwei Modi — Primary (jede Eingabe) und Fallback (nur bei niedrigem Vertrauen) — im Standard-Lex-Preis enthalten.

🟢 🏥 In der Praxis 15. Mai 2026 · 2 Min. Lesezeit

GitHub Copilot Cloud Agent: Automatische Modellauswahl wählt das Modell automatisch mit 10 % Rabatt auf den Token-Multiplikator

Redaktionelle Illustration: KI-Agent mit rotierenden Modell-Symbolen und Rabattprozentsatz.

Die automatische Modellauswahl des GitHub Copilot Cloud Agent ist eine neue Funktion, die am 14. Mai 2026 angekündigt wurde und automatisch das optimale Modell für eine Aufgabe basierend auf System-Health- und Modell-Performance-Signalen auswählt. Nutzer des Auto-Modus erhalten 10 % Rabatt auf den Standard-Token-Multiplikator und sind von wöchentlichen Rate-Limits ausgenommen. Die Funktion eliminiert die manuelle Modellauswahl und adressiert das zunehmend verbreitete Frustrationsmuster von Enterprise-Nutzern, die vor Wochenende ihr Limit erreichen.

🟢 🏥 In der Praxis 15. Mai 2026 · 2 Min. Lesezeit

IBM Consulting: Forward Deployed Units — 6-köpfige KI+Human-Pods leisten die Arbeit von 30-köpfigen Teams bei Riyadh Air, Nestlé, Heineken

Redaktionelle Illustration: Consulting-Pod mit 6 Mitgliedern — Menschen und KI-Agenten gemeinsam im Arbeitsbereich.

IBM Forward Deployed Units (FDUs) ist ein neues Enterprise-Consulting-Modell, das am 14. Mai 2026 von Mohamad Ali (Senior VP, IBM Consulting) angekündigt wurde. Sechsköpfige Pods — erfahrene Berater, Ingenieure und KI-Agenten — ersetzen klassische 30-köpfige Beratungsteams. Das Modell führt kontinuierliches Engagement anstelle von Einzel-Projektlogik ein. Live-Deployments bei Riyadh Air, Nestlé, Heineken und Pearson.

🟢 🏥 In der Praxis 15. Mai 2026 · 3 Min. Lesezeit

OpenAI: Sea Limited (Garena, Shopee) setzt Codex in Ingenieurteams in Asien ein — KI-nativer Entwicklungs-Case-Study

Editorial illustration: Asiatisches Ingenieurteam mit Codex CLI auf mehreren Monitoren.

OpenAI Sea Codex Case Study ist ein neuer Enterprise-Deployment-Artikel, veröffentlicht am 14. Mai 2026, in dem der CPO von Sea Limited — Muttergesellschaft der Marken Garena und Shopee — die Strategie für den Roll-out des OpenAI-Codex-Coding-Agenten in Ingenieurteams in Asien erläutert. Sea betrachtet Codex als Werkzeug für KI-natives Software-Development — eine grundlegende Workflow-Änderung, kein bloßer Entwicklerbeschleuniger für bestehende Praktiken.

🟡 🏥 In der Praxis 14. Mai 2026 · 2 Min. Lesezeit

Perplexity: finance_search Agent API Tool liefert OHLCV, Bilanzen, Transkripte und Analystenschätzungen in einem einzigen Aufruf

Editorial illustration: Finanzdaten-Dashboard mit OHLCV-Diagramm und KI-Agenten-Pfeilen.

Perplexity finance_search ist ein neues Agent-API-Tool, das im Mai 2026 veröffentlicht wurde und strukturierte Finanzdaten für börsennotierte Unternehmen zurückgibt — nahezu Echtzeit-Kurse, OHLCV-Bereiche, Pre-Market- und After-Hours-Daten, Gewinn- und Verlustrechnungen, Bilanzen, Cashflow, Earnings-Call-Transkripte, SEC-Einreichungen, Analystenschätzungen und ETF-Bestandteile. Das KI-Modell entscheidet anhand des Prompts, welche Felder abgerufen werden.

🟢 🏥 In der Praxis 14. Mai 2026 · 2 Min. Lesezeit

AWS: Pulse AI + Bedrock Pipeline feinabstimmt Nova Micro für Finanzdokumente — 1.000 Dokumente in 3 Stunden

Redaktionelle Illustration: Finanzdokumente mit automatisierter Extraktionspipeline und strukturierten Daten.

AWS Pulse AI + Amazon Bedrock Finanzdokumentverarbeitung ist ein neuer Enterprise-Pipeline-Blueprint, veröffentlicht am 13. Mai 2026. Er kombiniert Pulse-AI-Extraktion aus komplexen Finanzdokumenten (SEC-Einreichungen, Bilanzen, Prüfmaterialien) mit der Feinabstimmung des Amazon-Nova-Micro-Modells. Ein Batch von 1.000 Dokumenten, der zuvor mehrere Tage erforderte, wurde in unter drei Stunden verarbeitet, und das feinabgestimmte Modell erreichte 100 % Check-Datenextraktion gegenüber 50 % Baseline.

🟢 🏥 In der Praxis 14. Mai 2026 · 2 Min. Lesezeit

CNCF: KubeStellar KI-Agenten erreichen 81 % PR-Akzeptanz durch 91 % Testabdeckung und 63 CI/CD-Workflows

Editorial illustration: Kubernetes-Cluster mit KI-Agenten-Icons und CI/CD-Pipeline-Pfeilen.

KubeStellar KI-Agenten ist eine neue Fallstudie im CNCF-Blog von Andy Anderson, Chief Maintainer der KubeStellar Console, veröffentlicht am 14. Mai 2026. Das Multi-Cluster-Kubernetes-Dashboard erzielte durch zwei parallele KI-Coding-Agenten innerhalb von 82 Tagen eine PR-Akzeptanzrate von 81 %. Infrastruktur: 63 CI/CD-Workflows, 32 nächtliche Test-Suites, 91 % Abdeckung über 12 Shards, Bug-to-Merge ca. 30 Minuten. Anderson definiert fünf Reifegrade für KI-Codebases.

🟢 🏥 In der Praxis 14. Mai 2026 · 2 Min. Lesezeit

GitHub: Copilot Cloud Agent REST API für Fan-Out-Refactoring, Repository-Setup und wöchentliche Release-Vorbereitung

Redaktionelle Illustration: GitHub-Actions-Workflow mit autonomen Agentensymbolen und REST-API-Endpunkt.

Die GitHub Copilot Cloud Agent REST API ist ein neuer Entwickler-Endpunkt, am 13. Mai 2026 in der öffentlichen Vorschau veröffentlicht, der die programmatische Auslösung autonomer Copilot-Aufgaben ermöglicht. Drei Hauptanwendungsfälle: Code-Refactoring-/Migrations-Fan-Out über viele Repositorys, Ein-Klick-Repository-Initialisierung aus einem Entwicklerportal und automatisierte wöchentliche Release-Vorbereitung. Verfügbar für Copilot Business und Enterprise-Abonnenten.

🟡 🏥 In der Praxis 13. Mai 2026 · 2 Min. Lesezeit

GitHub: Copilot Pro $10, Pro+ $39 und neuer Max-Plan $100 mit Flex-Credit-Modell

Redaktionelle Illustration: Abonnementstruktur mit Base- und Flex-Credit-Icons im Entwickler-Interface.

GitHub Copilot Flex Allotments + Max-Plan ist die neue Preisstruktur für GitHub Copilot, angekündigt am 12. Mai 2026 mit Wirkung ab 1. Juni 2026. Der Pro-Tier kostet $10/Monat mit $15 Gesamt-Usage-Credits, Pro+ $39 mit $70 Credits, der neue Max-Plan $100 mit $200 Credits. Code-Completions und Next-Edit-Suggestions bleiben auf allen bezahlten Tarifen unbegrenzt.

🟡 🏥 In der Praxis 13. Mai 2026 · 2 Min. Lesezeit

Perplexity: April-2026-Changelog fügt Claude Opus 4.7, GPT-5.5 und Grok 4.20 Reasoning zur Agent-API hinzu

Editorial illustration: API-Endpunkte mit Modell-Icons und Sicherheitsschlüsseln in einem Entwickler-Panel.

Der Perplexity-April-2026-Changelog ist ein neues Paket von Agent-API-Aktualisierungen, das die Modelle Claude Opus 4.7, GPT-5.5 und Grok 4.20 Reasoning, native n8n-Integration, Verfügbarkeit auf dem AWS Marketplace als SaaS, ein One-Time-API-Key-Reveal-Sicherheitsmodell und einen neuen /v1/models-Endpunkt im OpenAI-kompatiblen Format hinzufügt.

🟡 🏥 In der Praxis 12. Mai 2026 · 2 Min. Lesezeit

Anthropic: Claude Code v2.1.139 — Agent View zeigt alle Sitzungen + /goal-Befehl für autonomen Abschluss

Editorial illustration: Claude Code v2.1.139 — Agent View zeigt alle Sitzungen + /goal-Befehl für autonomen Abschluss

Claude Code v2.1.139 ist eine Veröffentlichung von Anthropics CLI-Agent, die Agent View im Research-Preview-Status einführt — eine einheitliche Liste aller Sitzungen (aktiv, blockiert, abgeschlossen) — sowie den /goal-Befehl, der Claude über mehrere Züge arbeiten lässt, bis eine gesetzte Bedingung erfüllt ist, mit einem Panel für verstrichene Zeit, Schrittanzahl und Token-Verbrauch.

🟡 🏥 In der Praxis 12. Mai 2026 · 3 Min. Lesezeit

IBM: Red Hat AI Inference und OpenShift Virtualization Service als verwaltete Produkte auf IBM Cloud angekündigt

Editorial illustration: enterprise cloud infrastructure with red and blue glow, abstract servers running inference workloads, hybrid VM and container orchestration.

IBM hat heute den Red Hat AI Inference Service und den Red Hat OpenShift Virtualization Service als verwaltete Enterprise-Produkte auf IBM Cloud angekündigt. Ersterer bietet eine optimierte Serving-Umgebung für Open-Source-LLMs (Granite, Llama, Mistral) mit automatischer Skalierung und SLA-Garantien; letzterer ermöglicht den Betrieb von VMs und Containern in derselben OpenShift-Steuerungsebene. Ziel: den Betriebsaufwand für Enterprise-Teams zu reduzieren, die Open-Source-KI ohne eigene Kubernetes-Infrastruktur nutzen möchten.

🟡 🏥 In der Praxis 12. Mai 2026 · 3 Min. Lesezeit

OpenAI: DeployCo — neue eigenständige Organisation für Enterprise-KI-Deployment zusammen mit Q1-2026-Ergebnissen angekündigt

Editorial illustration: enterprise consulting handshake with abstract AI infrastructure pipelines, deployment lifecycle visualization.

OpenAI hat am Dienstag DeployCo (The Deployment Company) gestartet — eine eigenständige Organisation, die Unternehmen beim Aufbau und der Skalierung von KI-Anwendungen in der Produktion unterstützt. Ziel ist die Trennung von Foundation-Model-F&E und Enterprise-Deployment-Consulting, das bisher im selben OpenAI-Team operierte und operative Spannungen erzeugte. DeployCo bietet verwaltetes Deployment, individuelle Evaluierung, Post-Launch-Monitoring und branchenspezifisches Fine-Tuning.

🟡 🏥 In der Praxis 11. Mai 2026 · 2 Min. Lesezeit

OpenAI: Leitfaden zur Skalierung von KI-Implementierungen in Unternehmen

Editorial illustration: Leitfaden zur Skalierung von KI-Implementierungen in Unternehmen

OpenAI veröffentlichte den Enterprise-Leitfaden „How enterprises are scaling AI”, der den Weg von ersten Experimenten zu dauerhaftem Geschäftsnutzen beschreibt. Der Leitfaden konzentriert sich auf vier Grundpfeiler: organisatorisches Vertrauen, Governance-Rahmen, Workflow-Design und Qualitätssicherung beim Skalieren.

🟢 🏥 In der Praxis 11. Mai 2026 · 2 Min. Lesezeit

Google: KI-gestützte Finance-Plattform expandiert nach Europa — Aktien-Zusammenfassungen, Portfolio-Analyse, KI-Assistent

Editorial illustration: KI-gestützte Finance-Plattform expandiert nach Europa — Aktien-Zusammenfassungen, Portfolio-Analyse, KI-Assistent

Google Finance ist eine KI-gestützte Plattform, die diese Woche mit vollständiger Unterstützung lokaler Sprachen auf den europäischen Markt expandiert. Sie bringt KI-Recherche zu Aktien und Markttrends, erweiterte Visualisierungen, Echtzeit-Abdeckung von Kryptowährungen und Rohstoffen, Live-Transkripte von Unternehmens-Earnings-Calls sowie global verfügbare Deep Search für komplexe Finanzfragen.

🟡 🏥 In der Praxis 9. Mai 2026 · 2 Min. Lesezeit

Anthropic: Claude Code v2.1.136 bringt 54 Fixes, MCP-OAuth-Fix und Hard-Deny-Regel

Redaktionelle Illustration: Claude-Code-Terminal mit Hinweis auf MCP-OAuth-Fix und Hard-Deny-Regel

Anthropic veröffentlichte Claude Code v2.1.136 mit 54 Änderungen. Neu: die Regel settings.autoMode.hard_deny zum bedingungslosen Blockieren von Aktionen im Auto-Modus, ein Fix für den MCP-OAuth-Race-Condition, der tägliche Neuanmeldungen erzwang, sowie ein Fix für API-Fehler 400 bei erweitertem Denken.

🟢 🏥 In der Praxis 9. Mai 2026 · 2 Min. Lesezeit

AWS: Halliburtons KI-Assistent für Seismik verkürzt Workflow-Erstellung um über 95 Prozent

Redaktionelle Illustration: Seismischer Workflow aus natürlicher Sprache über Amazon Bedrock generiert

Halliburton und AWS entwickelten einen KI-Assistenten für Seismic Engine, der natürliche Sprache in seismische Workflows umwandelt. Der Assistent nutzt Amazon Bedrock und Claude-Modelle, erreicht 84–97 % Erfolgsrate und reduziert die Erstellungszeit von 2–20 Minuten auf 5,9–16,6 Sekunden.

🟡 🏥 In der Praxis 8. Mai 2026 · 2 Min. Lesezeit

GitHub: Fünf Risiken und ein 10-Minuten-Rahmen für die Überprüfung von KI-Pull-Requests

Editorial illustration: Fünf Risiken und ein 10-Minuten-Rahmen für die Überprüfung von KI-Pull-Requests

GitHub hat einen praktischen Leitfaden zur Überprüfung von KI-generiertem Code veröffentlicht, der fünf kritische Risiken und einen strukturierten 10-Minuten-Code-Review-Rahmen definiert. Mehr als jeder fünfte Pull-Request auf der Plattform umfasst heute einen Agenten.

🟡 🏥 In der Praxis 7. Mai 2026 · 2 Min. Lesezeit

Anthropic: Claude Code v2.1.132 bringt 25+ Fixes und neue Env-Variablen für Hooks

Editorial-Illustration: Claude Code v2.1.132 bringt 25+ Fixes und neue Umgebungsvariablen für Hooks

Anthropic hat Claude Code v2.1.132 mit 25+ Fehlerbehebungen und zwei neuen Umgebungsvariablen veröffentlicht: CLAUDE_CODE_SESSION_ID für Hook-Integration und CLAUDE_CODE_DISABLE_ALTERNATE_SCREEN für nativen Scrollback. Ein schwerwiegender Bug mit 10 GB+ RSS-Speicherwachstum bei MCP-Servern wurde ebenfalls behoben.

🟡 🏥 In der Praxis 7. Mai 2026 · 2 Min. Lesezeit

Anthropic: Claude Code v2.1.133 bringt worktree.baseRef und Race-Condition-Fix

Editorial illustration: Claude Code v2.1.133 bringt worktree.baseRef und Race-Condition-Fix

Anthropic veröffentlichte Claude Code v2.1.133 mit den neuen Parametern worktree.baseRef, sandbox.bwrapPath/socatPath und der Umgebungsvariable CLAUDE_EFFORT in Hooks. Die Version behebt eine Race Condition in parallelen Sitzungen sowie Probleme mit Windows-Laufwerksstammpfaden. Dritte Veröffentlichung dieser Woche nach v2.1.131 und v2.1.132.

🟡 🏥 In der Praxis 7. Mai 2026 · 2 Min. Lesezeit

GitHub: Optimierung agentischer Workflows erzielt Token-Einsparungen von 19 % bis 62 %

Editorial illustration: Optimierung agentischer Workflows erzielt Token-Einsparungen von 19 % bis 62 %

GitHub hat seine Produktions-Agentenworkflows instrumentiert und drei Hauptquellen für Token-Verschwendung identifiziert: unnötige MCP-Tools, deterministische Datenabrufe und falsch konfigurierte Bash-Regeln. Durch Optimierung wurden Einsparungen von 19 % bis 62 % pro Workflow erzielt.

🟢 🏥 In der Praxis 7. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.04012: SymptomAI in der Fitbit-App übertrifft mit 13.917 Patienten unabhängige Kliniker bei der Differentialdiagnose

Editorial illustration: Nutzer im Gespräch mit dem SymptomAI-Agenten in der Fitbit-App, während ein Hintergrundpanel eine gerankte Diagnoseliste anzeigt

SymptomAI ist ein konversationeller KI-Agent, der in die Fitbit-App integriert und an etwa 13.917 Teilnehmern getestet wurde; in der klinischen Evaluationsgruppe erreichten seine Diagnoseempfehlungen ein Odds Ratio von 2,47 gegenüber unabhängigen Klinikern, die dieselben Gespräche bewerteten. Die Studie ist ein Preprint.

🟡 🏥 In der Praxis 6. Mai 2026 · 2 Min. Lesezeit

IBM: Enterprise Advantage erhält Context Studio — Providence Health reduziert Manager-Einstellungszeit um 90 %

Editorial illustration: IBM Enterprise Advantage Context Studio für KI-Agenten auf Basis von Organisationsdaten

IBM hat die Enterprise-Advantage-Plattform um den Context Studio erweitert — ein Werkzeug zum Aufbau von KI-Agenten auf Basis unternehmenseigener Daten unter Wahrung digitaler Souveränität. Providence Health reduzierte die Manager-Zeit für Einstellungsentscheidungen um 90 %, IBM prognostiziert Kostensenkungen von über 25 % innerhalb von 18 Monaten.

🟢 🏥 In der Praxis 6. Mai 2026 · 2 Min. Lesezeit

Anthropic: Claude Code v2.1.131 — Windows-VS-Code-Aktivierung und Mantle-x-api-key-Hotfix

Editorial illustration: Claude Code v2.1.131 Hotfix für Windows VS Code und Mantle-Authentifizierung

Anthropic veröffentlichte Claude Code v2.1.131, ein Hotfix-Release, das zwei Fehler behebt: einen Absturz der VS-Code-Erweiterungsaktivierung unter Windows durch einen hartcodierten Build-Pfad und den fehlenden x-api-key-Header gegenüber Mantle-Inferenz-Endpunkten. Binärdateien wurden für alle gängigen Plattformen veröffentlicht.

🟡 🏥 In der Praxis 5. Mai 2026 · 2 Min. Lesezeit

arXiv:2605.02740: ReClaim — Foundation-Modell auf 200 Millionen Patientenakten erreicht durchschnittlichen AUC-Wert von 75,6 % bei über 1000 medizinischen Aufgaben

Editorial illustration: Entwickler-Workspace mit Code-Bildschirmen, Stethoskop und medizinischen Diagrammen

Ein neuer arXiv-Preprint stellt ReClaim vor — ein Foundation-Modell mit 1,7 Milliarden Parametern, trainiert auf 43,8 Milliarden medizinischen Ereignissen aus 200 Millionen Patientenakten. Bei mehr als 1000 diagnostischen Aufgaben erreicht es einen durchschnittlichen AUC-Wert von 75,6 % und übertrifft damit deutlich LightGBM (66,3 %) sowie das spezialisierte Delphi-Modell (69,4 %). Eröffnet eine neue Klasse von Foundation-Modellen, die auf administrativen Gesundheitsdaten trainiert sind.

🟡 🏥 In der Praxis 5. Mai 2026 · 3 Min. Lesezeit

Anthropic Claude Code v2.1.128: 30+ Korrekturen, .zip-Plugin-Unterstützung und ~3× niedrigere cache_creation-Kosten für Sub-Agenten

Editorial-Illustration: Entwickler-Workspace mit Monitoren, einem .zip-Archiv und einem Plugin-Installations-Fortschrittsbalken

Claude Code v2.1.128 (veröffentlicht am 4. Mai 2026) bringt 30+ Verbesserungen: Anzeige der Tool-Anzahl im /mcp-Panel mit Markierung von Servern ohne Tools, Unterstützung für .zip-Plugin-Archive in --plugin-dir, Behebung des EnterWorktree-Fehlers, der lokale nicht gepushte Commits verlor, ~3× niedrigere cache_creation-Kosten für Sub-Agenten und Behebung von Abstürzen beim Piping von Eingaben über 10 MB.

🟡 🏥 In der Praxis 4. Mai 2026 · 3 Min. Lesezeit

IBM-Studie: 76 % der Unternehmen haben einen Chief AI Officer, CEOs erwarten 48 % autonome KI-Entscheidungen bis 2030

Das IBM Institute for Business Value veröffentlichte eine Studie über 2.000 Vorstandsvorsitzende aus 33 Ländern, die zeigt, dass die Rolle des Chief AI Officers innerhalb eines Jahres von 26 % auf 76 % der Organisationen ausgeweitet wurde. CEOs erwarten, dass KI-Systeme bis 2030 48 % der operativen Entscheidungen ohne menschliche Intervention treffen werden, was die gesamte C-Suite-Struktur neu definiert.

🔴 🏥 In der Praxis 1. Mai 2026 · 3 Min. Lesezeit

DeepMind KI-Co-Clinician: In blinder Evaluierung von 98 Primärversorgungsanfragen bevorzugten Ärzte das System gegenüber führenden Tools, null kritische Fehler in 97/98 Fällen

Redaktionelle Illustration: KI-Agent, der einem Arzt mit einem Patienten in einer klinischen Szene mit medizinischen Geräten assistiert

Google DeepMind gab am 30. April 2026 die KI-Co-Clinician-Forschungsinitiative bekannt — ein Triadic-Care-Modell, bei dem ein KI-Agent Patienten unter klinischer Aufsicht eines Arztes unterstützt. In blinden Head-to-Head-Evaluierungen von 98 realistischen Primärversorgungsanfragen bevorzugten Ärzte die Antworten des Co-Clinicians konsistent gegenüber zwei führenden Tools zur Evidenzsynthese, und das System verzeichnete null kritische Fehler in 97 von 98 Fällen.

🟡 🏥 In der Praxis 1. Mai 2026 · 2 Min. Lesezeit

Amazon Nova 2 Lite mit Reinforcement Fine-Tuning erreicht 4,33/5,0 und übertrifft Claude Sonnet 4.5 bei der automatisierten Prüfung von Rechtsverträgen

Redaktionelle Illustration: KI-Richter auf einem Podium bewertet einen Rechtsvertrag, während ein Roboterarm Klauseln markiert

Reinforcement Fine-Tuning (RFT) ist eine Trainingsmethode, bei der ein Sprachmodell als Richter (LLM-as-Judge) fungiert und Rückmeldungen gibt, anstatt teure manuelle Beschriftung zu erfordern. Amazon Nova 2 Lite erzielte damit einen Gesamtscore von 4,33/5,0 und eine perfekte JSON-Validierung von 1,00 und übertraf Claude Sonnet 4.5 sowie Claude Haiku 4.5 bei der automatisierten Prüfung von Rechtsverträgen.

🟢 🏥 In der Praxis 1. Mai 2026 · 2 Min. Lesezeit

IBM Research und Dallara: KI-Surrogatmodell GIST bewertet die Aerodynamik eines Rennwagens in 10 Sekunden statt in stundenlangen klassischen CFD-Simulationen

Redaktionelle Illustration: Rennwagen mit einem Pfeil, der eine schnelle Strömungssimulation um den Hecktunnel-Diffusor darstellt

GIST (Gauge-Invariant Spectral Transformer) ist ein KI-Surrogatmodell auf Basis graphischer neuronaler Operatoren, das IBM Research und Dallara, der italienische Rennwagenhersteller, gemeinsam entwickelt haben. Die aerodynamische Bewertung des Hecktunnel-Diffusors eines LMP2-Fahrzeugs wird damit von mehreren Stunden klassischer CFD-Simulation auf etwa 10 Sekunden verkürzt, und die Arbeit wurde beim AI & PDE Workshop auf der ICLR 2026 vorgestellt.

🟡 🏥 In der Praxis 30. April 2026 · 2 Min. Lesezeit

Anthropic Claude for Creative Work: Konnektoren für Blender, 50+ Adobe-Creative-Cloud-Tools, Autodesk Fusion, Ableton, SketchUp und Splice

Redaktionelle Illustration: KI-Assistent, der 3D-Modellierung, Audioproduktion und Grafikdesign verbindet

Anthropic kündigte am 28. April 2026 Claude-Konnektoren für professionelle Kreativsoftware in Zusammenarbeit mit Blender, Autodesk Fusion, Adobe (50+ Creative-Cloud-Tools), Ableton, Splice, Affinity und Canva, Resolume Arena und SketchUp an. Claude kann Python-Skripte für Blender schreiben, Resolume in Echtzeit für VJs steuern, Batch-Asset-Verarbeitung in Affinity automatisieren und den Splice-Beispielkatalog durchsuchen. Anthropic trat zudem dem Blender Development Fund als Patron bei; drei akademische Institutionen – RISD, Ringling College und Goldsmiths – starten Kurse, in denen Studierende das Arbeiten mit Claude erlernen.

🟡 🏥 In der Praxis 30. April 2026 · 2 Min. Lesezeit

Google ERA: KI-System für wissenschaftliche Forschung erreicht CDC-Spitzenplatz bei Hospitalisierungsprognosen, löst ein offenes kosmologisches Problem und verfolgt CO2 im 10-Minuten-Takt

Redaktionelle Illustration: Wissenschaftliche Werkzeuge und ein KI-Netz, verbunden in einer sternförmigen Konstellation verschiedener Domänen

Am 29. April 2026 stellte Google Research ERA (Empirical Research Assistance) vor — ein internes KI-System, das LLMs mit Rechentools kombiniert, um wissenschaftliche Forschung zu beschleunigen. Vier konkrete Ergebnisse aus unterschiedlichen Bereichen: Spitzenplatz auf der CDC-Rangliste für COVID/Grippe/RSV-Hospitalisierungsprognosen, sechs neue Lösungen für Gravitationsstrahlung kosmischer Strings, ein neuronales Netz zur Verfolgung des atmosphärischen CO2 alle 10 Minuten sowie interpretierbare neuronale Schaltkreise beim Zebrafisch.

🟡 🏥 In der Praxis 30. April 2026 · 3 Min. Lesezeit

EvalEval Coalition: KI-Evaluierung wird zum neuen Compute-Engpass — GAIA-Einzellauf 2.829 $, HAL-Leaderboard 40.000 $, akademische Auditoren stoßen an eine Budgetgrenze vor einer technischen

Redaktionelle Illustration: Eine Waage, die zu den Evaluierungskosten gegenüber den Trainingskosten kippt

Die EvalEval Coalition (Avijit Ghosh, Yifan Mai, Georgia Channing, Leshem Choshen) veröffentlichte am 29. April 2026 eine Analyse im HuggingFace-Blog, die zeigt, wie die Kosten für die Evaluierung von KI-Modellen explodiert sind. Ein einzelner GAIA-Lauf kostet 2.829 $, das HAL-Leaderboard 40.000 $ (k=8 Zuverlässigkeit 320.000 $), PaperBench rund 9.500 $ pro Agent. Statische Benchmarks komprimieren 100–200×, agentische nur 2–3,5× — eine Accountability-Barriere für unabhängige Auditoren.

🟡 🏥 In der Praxis 29. April 2026 · 2 Min. Lesezeit

Anthropic Claude for Creative Work: Konnektoren für 60+ Kreativwerkzeuge, neues Produkt Claude Design und Partnerschaften mit RISD, Ringling und Goldsmiths

Redaktionelle Illustration: Claude-Konnektoren verzweigen sich in einen Stack von Kreativwerkzeugen aus Design, Video und 3D-Produktion

Anthropic hat Claude for Creative Work vorgestellt — ein Paket von Konnektoren, das Claude mit Adobe Photoshop, Premiere, 50+ Creative-Cloud-Werkzeugen, Blender, Autodesk Fusion, Ableton Live und Push, der Resolume-Serie, SketchUp, Splice und Affinity by Canva verbindet. Lanciert wurde auch das neue Produkt Claude Design aus Anthropic Labs zur Visualisierung von Ideen für Software-Oberflächen mit Canva-Export. Parallel dazu bringen akademische Partnerschaften mit RISD, dem Ringling College und der Goldsmiths University of London Claude in die Lehrpläne für Creative Computing.

🟡 🏥 In der Praxis 29. April 2026 · 2 Min. Lesezeit

IBM lanciert Bob: KI-Entwicklungspartner für den gesamten SDLC mit über 80.000 internen Nutzern und 45 % durchschnittlichem Produktivitätszuwachs

Redaktionelle Illustration: Zahnräder des Software-Entwicklungs-Lebenszyklus mit Assistenz-Emblem im Zentrum

Am 28. April 2026 lancierte IBM „Bob”, einen KI-Partner für den gesamten Software-Entwicklungs-Lebenszyklus: Planung, Design, Codierung, Test, Deployment, Betrieb und Modernisierung. Bob orchestriert die Modelle Anthropic Claude, Mistral und IBM Granite, wird bereits intern von über 80.000 IBM-Mitarbeitern mit einem durchschnittlichen Produktivitätszuwachs von 45 % genutzt und ist als SaaS mit einer kostenlosen 30-Tage-Testphase auf bob.ibm.com verfügbar.

🟡 🏥 In der Praxis 29. April 2026 · 1 Min. Lesezeit

OpenAI kommt auf AWS: GPT-Modelle, Codex und Managed Agents jetzt für Enterprise-Nutzer innerhalb der AWS-Umgebung verfügbar

OpenAI gab am 28. April 2026 bekannt, dass GPT-Modelle, Codex und Managed Agents nun auf AWS verfügbar sind und Enterprise-Nutzern ermöglichen, sichere KI-Systeme innerhalb ihrer AWS-Umgebungen zu entwickeln. Die Ankündigung fällt auf denselben Tag wie der geänderte OpenAI × Microsoft-Partnerschaftsvertrag. Es handelt sich um die erste OpenAI-Distribution außerhalb des Microsoft-Azure-Ökosystems.

Vollständiges Archiv ansehen →