Anthropic: 10 Millionen CAD für kanadische KI und Daten zur Claude-Nutzung in Kanada

Redaktionelle Illustration: Karte Kanadas mit Markierungen von Universitätszentren und einem Wachstumsdiagramm der KI-Adoption

Anthropic investiert 10 Millionen kanadische Dollar (CAD) in 8 kanadische Institutionen mit Schwerpunkt auf KI-Sicherheit, Gesundheitswesen und Sprachen mit wenigen Ressourcen. Ein gleichzeitig veröffentlichter Economic Index zeigt, dass Kanada 2,6 % des globalen Claude.ai-Traffics ausmacht, bei einer Pro-Kopf-Adoption, die 4,4-mal höher ist als erwartet.

🟡 🤖 Modelle

Anthropic: Claude for Teachers — kostenloser Claude für US-amerikanische K-12-Lehrkräfte

Redaktionelle Illustration: Eine Lehrerin nutzt einen KI-Assistenten auf einem Tablet im Klassenraum vor der Tafel

Anthropic hat eine kostenlose Version von Claude für verifizierte K-12-Lehrkräfte in den USA gestartet, die bis Juni 2027 verfügbar ist. Das Programm umfasst eine Bibliothek mit Unterrichtsfähigkeiten, einen Lehrplan abgestimmt auf die Bildungsstandards aller 50 Bundesstaaten und Integrationen mit 9 Bildungstools.

🟡 🤖 Modelle

arXiv:2607.11598: Interaktion als „dritte Achse" des Test-Time-Compute beseitigt bis zu 74 % der Fehler

Diagramm der drei Achsen des Test-Time-Compute: längeres Denken, Best-of-N-Sampling und Interaktion mit Tools

Test-Time-Compute ist die zusätzliche Rechenkapazität, die ein Modell während der Inferenz aufwendet, um eine bessere Antwort zu erzeugen. Bojie Li und Noah Shi definieren die Interaktion mit externen Tools als dritte Achse des Test-Time-Compute — neben längerem Denken und Best-of-N-Sampling. Ein Proposer-Reviewer-System erreicht eine 100-%-Pass-Rate, während Selbstdenken und Best-of-N ein Plateau erreichen.

Neuestes aus der KI-Welt 14. Juli 2026

🟡 🤝 Agenten 14. Juli 2026 · 2 Min. Lesezeit

arXiv:2607.11185: SCALECUA skaliert Computer-Use-Agenten mit RL — 68,7 % auf OSWorld

Redaktionelle Illustration: KI-Agent navigiert eine grafische Computeroberfläche mit einer Reinforcement-Learning-Belohnungs-Bestrafungs-Schleife

SCALECUA ist ein neues Framework von Tsinghua/THUDM-Forschenden, das Computer-Use-Agenten mittels Online-Reinforcement-Learning skaliert und einen neuen SOTA-Wert von 68,7 % auf dem OSWorld-Benchmark sowie 54,0 % auf ScienceBoard erzielt.

🟡 🏥 In der Praxis 14. Juli 2026 · 2 Min. Lesezeit

Anthropic: Claude Code v2.1.208 und v2.1.209 — Screen-Reader, Vim-Remaps und Wrapper-Unterstützung

Redaktionelle Illustration: Terminal mit Claude-Code-Oberfläche, Barrierefreiheits-Symbol und Vim-Tastenkürzel

Claude Code v2.1.208 bringt drei neue Funktionen: einen opt-in Screen-Reader-Modus für Barrierefreiheit, Vim-Insert-Mode-Tastenkürzel-Remapping und einen Corporate-Process-Wrapper für alle selbst gestarteten Prozesse. Hotfix v2.1.209 behob sofort einen Fehler, der Dialoge in Hintergrund-Agent-Sitzungen blockierte.

🟡 🛡️ Sicherheit 14. Juli 2026 · 2 Min. Lesezeit

GitHub: KI-Sicherheitserkennung bei Pull Requests und /security-review in der Copilot-App

Redaktionelle Illustration: GitHub-Pull-Request-Oberfläche mit hervorgehobenen KI-Sicherheitswarnungen und Copilot-Chat-Fenster mit dem Befehl /security-review

GitHub hat KI-generierte Sicherheitserkennungen direkt bei Pull Requests in Code Scanning eingeführt, zusammen mit dem neuen Befehl /security-review in der Copilot-App, der Code auf Injection, XSS, Path-Traversal und schwache Kryptografie analysiert.

🟡 🔧 Hardware 14. Juli 2026 · 2 Min. Lesezeit

NVIDIA: Leistung pro Watt als Schlüsselmetrik — Blackwell GB300 bis zu 25× effizienter als Hopper

Redaktionelle Illustration: NVIDIA-Blackwell-GB300-NVL72-Chip mit grafischer Effizienzdarstellung im Vergleich zur Vorgängergeneration Hopper

NVIDIA Blackwell GB300 NVL72 ist beim Modell DeepSeek V4 Pro bis zu 25× effizienter als Hopper gemessen an der Leistung pro Watt, und rein softwareseitige Optimierungen innerhalb eines Monats brachten bis zu 5× Verbesserung.

🟢 📦 Open Source 14. Juli 2026 · 2 Min. Lesezeit

AMD: LogsLop — Open-Source-Tool komprimiert große Log-Dateien auf 11 % und spart 78 % der Token

Terminal-Ansicht des LogsLop-Tools, das eine Log-Datei komprimiert und die reduzierte Zeilenanzahl anzeigt

AMD hat LogsLop veröffentlicht, ein Open-Source-Python-CLI-Tool, das große Log-Dateien durch Normalisierung und Clustering komprimiert. Bei 73 echten Log-Dateien reduziert es die Zeilenanzahl auf 11 % und die Bytes auf 7,5 %, und mit Llama 3.3 70B werden 78 % weniger Token benötigt.

🟢 🤝 Agenten 14. Juli 2026 · 2 Min. Lesezeit

arXiv:2607.10891: SETA — über 4.500 RL-Umgebungen verbessern Terminal-Agenten-Ergebnisse

Diagramm des SETA-Systems zur Generierung von RL-Umgebungen mit SETA-Synth- und SETA-Evol-Komponenten für das Training von Terminal-Agenten

Ein Terminal-Agent ist ein KI-Agent, der Aufgaben über Befehle im Terminal oder der Shell löst. SETA (Shen et al., Oxford, KAUST) generiert über 4.500 verifizierbare RL-Umgebungen für das Training von Terminal-Agenten. DeepSeek-V4-Flash verbessert pass@1 von 40 % auf 43 % und pass@5 von 54 % auf 58 % auf Terminal-Bench 2.0.

🟢 🏥 In der Praxis 14. Juli 2026 · 2 Min. Lesezeit

arXiv:2607.11307: ToMap — Multi-Agenten-Beweisautoformalisierung +19 % über SOTA

Diagramm der ToMap-Pipeline mit drei Agenten: Decomposer, Formalizer und Prover für mathematische Beweisautoformalisierung

Autoformalisierung ist die automatische Übersetzung von Mathematik in natürlicher Sprache in maschinell überprüfbare formale Form. Die ToMap-Pipeline von Tian-Shuo Liu und Mitarbeitenden erzielt 19,0 % Verbesserung gegenüber der bisherigen SOTA-Methode auf dem ProofFlowBench-Datensatz. Die Schlüsselinnovation ist die Konzentration von Test-Time-Compute auf den Decomposer als Engpass statt gleichmäßiger Verteilung.

🟢 🤝 Agenten 14. Juli 2026 · 2 Min. Lesezeit

AWS: Strands Agents und Bedrock für Multi-Agenten-B2B-Käufersuche

Diagramm der Swarm- und Graph-Orchestrierungsmuster für B2B-Käufersuche mit Amazon Bedrock

Multi-Agenten-Orchestrierung ist die Koordination mehrerer spezialisierter KI-Agenten für eine gemeinsame Aufgabe. Thrad.ai implementierte ein System zur Findung von B2B-Käufern über 6 Quellen mit Amazon Bedrock und dem Strands-Agents-SDK. Das Swarm-Muster erzielt E-Mail-Qualität von 8,2/10, das Graph-Muster ist 25 % günstiger und 28 % schneller.

🟢 📦 Open Source 14. Juli 2026 · 2 Min. Lesezeit

CNCF: Ist der Kubernetes-Pod die richtige Einheit für KI-Agenten?

Diagramm einer Kubernetes-WorkerPool-Architektur mit mehreren suspendierten KI-Agenten auf einem einzelnen Worker

Lin Sun von Solo.io hinterfragt, ob der Kubernetes-Pod die richtige Abstraktion für das Deployment von KI-Agenten ist. Agenten sind ephemer — sie aktivieren sich kurz, und ein dedizierter ruhender Pod verschwendet Ressourcen. Er schlägt ein neues „Agent-Substrate"-Modell mit Actors und WorkerPools vor.

🟢 💬 Community 14. Juli 2026 · 2 Min. Lesezeit

Google DeepMind: ATL Saathi — Gemini-Tool für indische Lehrkräfte zielt auf 11 Millionen Schülerinnen und Schüler

Eine Lehrkraft in einer indischen Schule nutzt die ATL-Saathi-Applikation auf einem Tablet in einem STEM-Labor

Google DeepMind und die Atal Innovation Mission haben ATL Saathi gestartet — eine von Gemini angetriebene Web-Applikation, die Lehrkräfte in indischen STEM-Schullabors unterstützt. Sie wird in 100 Schulen erprobt und zielt auf mehr als 11 Millionen Schülerinnen und Schüler, mit Unterstützung für 8 Sprachen und 12 Unterrichtsmodule.

Vorherige Ausgabe 13. Juli 2026

Alle Nachrichten vom 13. Juli 2026 →

🟡 🤝 Agenten 13. Juli 2026 · 2 Min. Lesezeit

Allen Institute: Was der Bau des Shippy-Agenten über zuverlässige KI-Agenten gelehrt hat

Redaktionelle Illustration: Architekturdiagramm des Soul-Skills-Config-KI-Agenten mit nutzerbasierter Kubernetes-Isolierung

Das Allen Institute for AI veröffentlichte eine detaillierte Analyse der Architektur des maritimen Agenten Shippy, der 70+ Länder auf Basis von Claude Opus 4.6 betreut. Kernbotschaft: Zuverlässigkeit hängt weniger von der Modellstärke ab als von deterministischen Werkzeugen, isolierter Infrastruktur und an realen Workflows ausgerichteten Evaluierungen.

🟡 🔧 Hardware 13. Juli 2026 · 2 Min. Lesezeit

AMD: GEAK-Agent optimierte DeepSeek-V4-MLA-Kernel auf MI355 automatisch mit bis zu 9× Beschleunigung

Redaktionelle Illustration: Diagramm des AMD-MI355-GPU-Beschleunigers mit dem GEAK-Agenten, der optimierten Triton-Kernel-Code generiert

AMDs GEAK-Agent für automatisierte GPU-Kernel-Optimierung migrierte den DeepSeek-V4-MLA-Kernel von PyTorch nach Triton für MI355-Beschleuniger. Die Ergebnisse zeigen bis zu 9,13× Prefill-Beschleunigung, 4,94× geometrisches Mittel beim Decode und 2,10× höheren End-to-End-Durchsatz im SGLang-Framework.

🟡 🤖 Modelle 13. Juli 2026 · 2 Min. Lesezeit

Anthropic: Claudes Werte variieren je nach Modell und Sprache

Redaktionelle Illustration: grafische Darstellung der vier Werteachsen von Claudes Modellen, aufgeteilt nach Sprachen

Anthropic analysierte 309.815 anonymisierte Claude.ai-Gespräche und fand statistisch signifikante Unterschiede in den geäußerten Werten zwischen den Modellen Sonnet 4.6, Opus 4.6 und Opus 4.7 sowie zwischen 20 analysierten Sprachen — Hindi zeigt die höchste Wärme, Russisch und Englisch die höchste Strenge.

🟡 🤖 Modelle 13. Juli 2026 · 2 Min. Lesezeit

arXiv:2607.09375: Li Auto stellt Mach-Mind-4-Flash vor — 35B MoE mit 3B aktiven Parametern

Li Auto, ein chinesischer Automobilhersteller, hat das eigene Foundation-Modell Mach-Mind-4-Flash veröffentlicht. Es handelt sich um ein 35-Milliarden-Parameter-MoE-Modell, das pro Eingabe nur 3 Milliarden Parameter aktiviert, und über eine dreistufige Trainings-Pipeline Leistungen der 100B+-Klasse bei deutlich niedrigeren Inferenzkosten erzielt.

🟡 🤝 Agenten 13. Juli 2026 · 2 Min. Lesezeit

arXiv:2607.09493: Geteiltes selektives persistentes Gedächtnis für Agenten — 96 % Erfolg bei 97× geringeren Token-Kosten

Redaktionelle Illustration: Diagramm mit steigender Agenten-Erfolgsrate durch selektives Gedächtnis und sinkender Linie bei vollständiger Historie

Ein neues Architekturframework für agentische LLM-Systeme führt selektives persistentes Gedächtnis ein, das vier Kategorien wiederverwendbaren Kontexts beibehält und flüchtige Denkspuren verwirft. Das Ergebnis: 96 % Aufgabenabschlussrate und 97× geringere Token-Kosten pro Aufruf.

🟡 📦 Open Source 13. Juli 2026 · 2 Min. Lesezeit

arXiv:2607.09424: Soofi S — Souveränes Open-Source-Modell für Deutsch und Englisch, trainiert auf Telekom-Cloud

Redaktionelle Illustration: offenes Sprachmodell Soofi S mit Deutsche-Telekom-Cloud-Infrastruktur und EU-Flagge

Soofi S ist ein 30B-MoE-Hybrid-Mamba-Transformer-Modell mit 3B aktiven Parametern, das auf rund 27 Billionen Token vortrainiert wurde — mit verstärkten deutschen Sprachdaten. Ausschließlich auf Deutsche-Telekom-Cloud-Infrastruktur trainiert, übertrifft es alle europäischen souveränen Alternativen und führt den Code-Benchmark unter 17 offenen Modellen an.

Ältere Nachrichten

Samstag, 11. Juli 2026

6 Nachrichten →

🟡 💬 Community 11. Juli 2026 · 2 Min. Lesezeit

arXiv:2607.07779: Terence Tao als Mitautor einer Studie über die Grenzen großer Sprachmodelle in der Frontier-Mathematik

Redaktionelle Illustration: Tafel mit formalen Beweisen, durch die ein neuronales Netz verläuft

'From Solvers to Research' ist ein arXiv-Paper, mitgeschrieben von Fields-Medaillen-Träger Terence Tao, das untersucht, ob LLM-Agenten durch Auto-Formalisierung und Beweissynthese forschungsrelevante Mathematik betreiben können. Die Arbeit identifiziert systematische Schwächen bestehender Beweissynthese-Systeme und kartiert die Grenze zwischen Aufgabenlösung und echter Forschung.

🟡 🛡️ Sicherheit 11. Juli 2026 · 2 Min. Lesezeit

arXiv:2607.08395: Token-Flow Firewall — Runtime-Überwachung schützt langlebige KI-Agenten und senkt Angriffserfolgsrate auf 12,5 %

Redaktionelle Illustration: eine Firewall filtert einen Wortstrom zu einem arbeitenden KI-Agenten

Token-Flow Firewall ist ein auf arXiv vorgestellter Abwehrmechanismus, der Token-Flüsse in natürlicher Sprache bei persistenten KI-Agenten in Echtzeit überwacht. In Tests gegen Prompt-Injection und andere adversarielle Angriffe senkt er die Angriffserfolgsrate auf 12,5 % und bietet eine Runtime-Schutzschicht als Ergänzung zum Modell-Training.

🟡 🏥 In der Praxis 11. Juli 2026 · 2 Min. Lesezeit

Anthropic: Claude Code v2.1.207 aktiviert Auto-Modus auf allen Enterprise-Clouds, wechselt Standardmodell zu Opus 4.8 und schließt Shell-Injection-Lücke

Redaktionelle Illustration: Terminal mit automatischer Modellauswahl über drei Cloud-Anbieter-Logos

Claude Code v2.1.207 ist ein neues Release des Anthropic-CLI-Tools, das den 'Auto-Modus' ohne Opt-in-Variable automatisch auf Amazon Bedrock, Google Vertex AI und Microsoft Foundry verfügbar macht. Das Release schließt eine Shell-Injection-Sicherheitslücke in der Hook-Konfiguration und wechselt das Standardmodell auf Claude Opus 4.8 für Bedrock, Vertex und die Claude-Plattform auf AWS.

🟢 🤝 Agenten 11. Juli 2026 · 2 Min. Lesezeit

arXiv:2607.08093: CausalDS — neues Benchmark misst kausales Schlussfolgern von KI-Agenten in Data-Science-Aufgaben

Redaktionelle Illustration: ein Agent trennt zwei verflochtene Kurven mit den Bezeichnungen Ursache und Korrelation

CausalDS ist ein auf arXiv vorgestelltes Benchmark, das testet, ob KI-Agenten in Data-Science-Workflows Kausalität von Korrelation unterscheiden können. Es schließt eine Lücke in der Evaluation autonomer Analyse-Agenten, bei denen Standardtests Ausführungsgenauigkeit messen, nicht jedoch die Fähigkeit zu korrektem Kausalschlussfolgern.

Freitag, 10. Juli 2026

12 Nachrichten →

🟡 🛡️ Sicherheit 10. Juli 2026 · 2 Min. Lesezeit

arXiv:2607.08173: 'Overthinking' — Verstärktes Schlussfolgern zwingt Reasoning-Modelle zur Preisgabe gelernter Geheimnisse, neuer Extraktionsangriff auf der ICML 2026

Redaktionelle Illustration: Ein Gehirn aus Gedankenschleifen, aus dem gesperrte Dokumente durch einen Riss auslaufen

Overthinking ist ein auf der ICML 2026 akzeptiertes Paper, das zeigt, dass die Verstärkung des Reasoning-Gewichts in großen Sprachmodellen verborgene gelernte Informationen extrahieren kann, die das Modell normalerweise nicht preisgibt. Der Befund eröffnet eine neue Klasse von Extraktionsangriffen auf Reasoning-Modelle wie o1, DeepSeek R1 und Claude mit erweitertem Denken.

🟡 🤖 Modelle 10. Juli 2026 · 2 Min. Lesezeit

arXiv:2607.08733: „Super-Gewichte” erklären das Scheitern selektiven Fine-Tunings — Beitrag auf COLM 2026 angenommen

Redaktionelle Illustration: ein Netzwerk von Parametern, in dem einige helle Knoten die gesamte Struktur tragen

Super Weights in LLMs ist ein auf der COLM 2026 angenommener Beitrag, der „Super-Gewichte” identifiziert — eine kleine Anzahl von Parametern, deren Veränderung das Verhalten eines Sprachmodells überproportional beeinflusst. Die Arbeit zeigt, dass genau diese Gewichte erklären, warum selektives Fine-Tuning einzelner Schichten häufig scheitert — mit direkten Folgen für PEFT- und LoRA-Ansätze.

🟡 🏥 In der Praxis 10. Juli 2026 · 2 Min. Lesezeit

AWS: SageMaker bringt serverloses Fine-Tuning für NVIDIA Nemotron 3 mit SFT, RLVR und RLAIF

Redaktionelle Illustration: ein modulares Modell, das durch drei automatisierte Pipelines ohne Server verfeinert wird

Amazon SageMaker AI hat die serverlose Anpassung von NVIDIA Nemotron 3-Modellen eingeführt, ohne Infrastrukturverwaltung. Drei Techniken stehen bereit: SFT (überwachtes Fine-Tuning), RLVR (Reinforcement Learning mit verifizierbaren Belohnungen) und RLAIF (Reinforcement Learning aus KI-Feedback), womit fortgeschrittene RL-Methoden für Enterprise-Teams ohne ML-Infrastrukturwissen zugänglich werden.

🟡 🛡️ Sicherheit 10. Juli 2026 · 2 Min. Lesezeit

GitHub: CodeQL 2.26 führt KI-Prompt-Injection-Erkennung ein — erstes Mainstream-SAST-Tool, das KI-Angriffe gleichwertig mit klassischen behandelt

Redaktionelle Illustration: ein Code-Scanner, der eine bösartige Nachricht in einem KI-Prompt abfängt

CodeQL 2.26.0 ist die neue Version von GitHubs statischem Sicherheitsanalyse-Tool und führt die Erkennung von KI-Prompt-Injection-Angriffen als neuen Analysetyp ein, zusammen mit Unterstützung für Kotlin 2.4.0. Es handelt sich um die erste Integration eines KI-spezifischen Angriffsvektors in ein Mainstream-SAST-Tool — Prompt Injection wird damit in dieselben Sicherheits-Workflows wie XSS und SQL-Injection aufgenommen.

Donnerstag, 9. Juli 2026

16 Nachrichten →

🔴 🤖 Modelle 9. Juli 2026 · 2 Min. Lesezeit

Google: SensorFM — Foundation-Modell auf einer Billion Minuten Wearable-Daten gewinnt 34 von 35 Gesundheitsaufgaben

Redaktionelle Illustration: Smartwatch, aus der biometrische Signalwellen in ein neuronales Netz fließen

SensorFM ist Googles Foundation-Modell für Gesundheitsdaten von Wearables, trainiert auf über einer Billion Minuten Signaldaten von Fitbit- und Pixel-Watch-Geräten von 5 Millionen Nutzern aus über 100 Ländern. Das Modell übertrifft spezialisierte Ansätze bei 34 von 35 Aufgaben: +9 % AUC bei Klassifikation und +21 % Korrelation bei Regression.

🔴 🤖 Modelle 9. Juli 2026 · 2 Min. Lesezeit

Microsoft: Open-Source-Modell Aurora 1.5 übertrifft ECMWF-Ensemble bei 88,9 % der Variablen — neuer Standard in der KI-Wettervorhersage

Redaktionelle Illustration: Globus mit wirbelnden Wetterfronten und Datennetz

Aurora 1.5 ist Microsofts Open-Source-Foundation-Modell für das Erdsystem, das die ECMWF-Ensemble-Vorhersage bei 88,9 % der bewerteten Variablen und Horizonte übertrifft. Die neue Version fügt 22 meteorologische Variablen, stündliche Auflösung und probabilistische Ensemble-Prognosen hinzu — bei Hurrikan Helene erzielt sie rund 33 % weniger Bahnfehler als die ursprüngliche Aurora.

🔴 🤖 Modelle 9. Juli 2026 · 2 Min. Lesezeit

OpenAI: GPT-5.6 in drei Varianten — Sol, Terra und Luna mit Multi-Agent-Orchestrierung und sofortiger GitHub-Copilot-Integration

Redaktionelle Illustration: drei planetarische Kugeln (Sol, Terra, Luna) verbunden durch Datenströme

GPT-5.6 ist OpenAIs neue Modellfamilie mit drei Varianten: Sol (Flagship für komplexes Schlussfolgern), Terra (ausgewogen) und Luna (hochvolumig, kosteneffizient). Sie bringt Programmatic Tool Calling, explizite Prompt-Cache-Steuerung, persistentes Reasoning und Multi-Agent-Orchestrierung in der Beta — ab dem ersten Tag auch in GitHub Copilot verfügbar.

🟡 💬 Community 9. Juli 2026 · 2 Min. Lesezeit

Anthropic: Nobelpreisträger Ben Bernanke, ehemaliger Fed-Chef, tritt dem Long-Term Benefit Trust bei — dem Gremium zur Überwachung der Unternehmensmission

Redaktionelle Illustration: klassisches Bankgebäude, dessen Säulen in neuronale Netze übergehen

Ben Bernanke ist der ehemalige Vorsitzende der US-Notenbank (2006–2014) und Wirtschaftsnobelpreisträger 2022, der von Anthropic in den Long-Term Benefit Trust berufen wurde. Der LTBT ist ein unabhängiges Gremium ohne Anteile oder Gewinnbeteiligung, das die gemeinnützige Mission des Unternehmens überwacht — Bernanke bringt Expertise zu den wirtschaftlichen Auswirkungen von KI.

Mittwoch, 8. Juli 2026

15 Nachrichten →

🔴 🤖 Modelle 8. Juli 2026 · 4 Min. Lesezeit

Mistral Robostral Navigate: Roboter-KI navigiert nur mit RGB-Kamera

Redaktionelle Illustration: Mistral Robostral verkörpertes Robotermodell für nur RGB-visionsbasierte Navigation

Mistral hat Robostral Navigate vorgestellt, das erste Modell für verkörperte Roboternavigation mit 8 Milliarden Parametern. Es verwendet nur eine einzige RGB-Kamera ohne LiDAR oder Tiefensensoren und erreicht 76,6 % Erfolgsquote auf dem R2R-CE-Benchmark für unbekannte Umgebungen – 4,5 Prozentpunkte über Mehrsensorsystemen.

🔴 🤖 Modelle 8. Juli 2026 · 4 Min. Lesezeit

OpenAI lanciert GPT-Live: Sprachmodell für lebensechte KI-Konversationen

Redaktionelle Illustration: OpenAI GPT-Live Sprachmodell integriert in die ChatGPT Voice-Oberfläche

OpenAI hat GPT-Live vorgestellt, ein neues Sprachmodell für natürliche, lebensechte konversationelle KI-Interaktionen. Ab Tag eins in ChatGPT Voice integriert, erscheint es als Teil des beschleunigten Entwicklungszyklus für Sprachmodelle – nur zwei Tage nach GPT-Realtime-2.1. Technische Spezifikationen und Preise wurden bisher nicht veröffentlicht.

🔴 📦 Open Source 8. Juli 2026 · 5 Min. Lesezeit

PyTorch 2.13: bis zu 4× weniger GPU-Speicher beim LLM-Training und 12,3× schnelleres FlexAttention

Redaktionelle Illustration: PyTorch 2.13 neues Release mit wichtigen Verbesserungen für KI-Training und Inferenz

PyTorch 2.13 erscheint mit 3.328 Commits von 526 Mitwirkenden. Wichtigste Neuerungen: nn.LinearCrossEntropyLoss reduziert den GPU-Spitzenspeicherbedarf beim LLM-Training um bis zu 4×, FlexAttention auf Apple Silicon erreicht bis zu 12,3× Beschleunigung, und das neue torchcomms-Backend modernisiert das verteilte Training.

🟡 🤖 Modelle 8. Juli 2026 · 3 Min. Lesezeit

Anthropic entwickelt „Off Switch” für gefährliches Wissen: GRAM isoliert Dual-Use-Fähigkeiten in entfernbare Module

Redaktionelle Illustration: Anthropic GRAM austauschbare Wissensmodule zur Kontrolle und Entfernung von KI-Dual-Use

Anthropic und AE Studio veröffentlichen GRAM (Gradient-Routed Auxiliary Modules) – eine Methode, die Dual-Use-Wissen wie Virologie, Cybersicherheit und Kernphysik während des Trainings in entfernbare neuronale Module isoliert und es ermöglicht, in einem einzigen Training mehrere Modellvarianten mit unterschiedlichen Fähigkeitssätzen zu erzeugen.

Dienstag, 7. Juli 2026

15 Nachrichten →

🔴 ⚖️ Regulierung 7. Juli 2026 · 4 Min. Lesezeit

EU-Aktionsplan für Cybersicherheit und KI: Kommission koordiniert Abwehr ohne neue Gesetze

Redaktionelle Illustration: Europäische Kommission Aktionsplan für Cybersicherheit und KI

Die Europäische Kommission hat heute einen gemeinsamen Aktionsplan für Cybersicherheit und KI vorgestellt, der auf dem bestehenden EU-Rechtsrahmen aufbaut, Mitgliedstaaten und Industrie koordiniert und KI gleichzeitig als Angriffsvektor und als Abwehrwerkzeug adressiert.

🔴 🤖 Modelle 7. Juli 2026 · 4 Min. Lesezeit

Meta launcht Muse Image und Muse Video: Agentische KI, die eigene Fehler selbst korrigiert

Redaktionelle Illustration: Meta Muse generative KI zur Erstellung von Bild- und Videoinhalten

Meta Superintelligence Labs stellt Muse Image und Muse Video vor — Modelle mit agentischer Architektur, die intern Code- und Websuch-Tools aufrufen, und belegen Platz #2 sowie #3 in der Arena-Rangliste mit obligatorischem Content-Seal-Wasserzeichen.

🟡 🛡️ Sicherheit 7. Juli 2026 · 3 Min. Lesezeit

AISI: Frontier-KI-Modelle entdeckten kritische Cloud-Schwachstellen für unter £150

Redaktionelle Illustration: AISI nutzt Frontier-KI zur automatischen Erkennung von Cloud-Fehlkonfigurationen

Das britische AI Security Institute nutzte Frontier-Modelle zur Prüfung seiner eigenen Forschungsplattform und fand eine fünfstufige Angriffskette, die Standardtools zuvor entgangen war — für unter £150 an Token-Kosten.

🟡 🛡️ Sicherheit 7. Juli 2026 · 4 Min. Lesezeit

Agent Data Injection: Neue Angriffskategorie umgeht Schutzmaßnahmen für KI-Agenten

Redaktionelle Illustration: Data-Injection-Angriffe auf KI-Agenten und Schwachstellen in Claude Code

Forscher der Seoul National University sowie der Universitäten Indiana und Wisconsin führen Agent Data Injection (ADI) ein — einen neuen Angriffstyp, der bösartige Daten in vertrauenswürdige Datenstrukturen von Agenten einschleust, beliebige Click-Angriffe und Remote-Code-Execution auf Claude Code, Codex und Gemini CLI erzielt und dabei bestehende Schutzmaßnahmen umgeht.

Vollständiges Archiv ansehen →