Aktuelle KI-Nachrichten

Letzte 72 Stunden, nach Kategorie geordnet

🔴 🤝 Agenten 19. Juni 2026 · 2 Min. Lesezeit

Anthropic: Project Fetch Phase 2 — 20× schnellerer Roboterbetrieb mit 10× weniger Code

Redaktionelle Illustration: Project Fetch — Phase 2 zeigt 20× schnelleren Roboterbetrieb mit 10× weniger Code

Claude Opus 4.7 steuerte autonom einen Roboter-Quadrupeden und erledigte Aufgaben 20× schneller als ein menschliches Team bei ~10× weniger Code mit gleich guten oder besseren Ergebnissen. Präzise Closed-Loop-Steuerung bleibt jedoch eine Herausforderung.

🟡 🤝 Agenten 19. Juni 2026 · 2 Min. Lesezeit

arXiv:2606.18543: CEO-Bench — Können KI-Agenten ein Startup langfristig führen?

Redaktionelle Illustration: arXiv:2606.18543: CEO-Bench — Können KI-Agenten ein Startup langfristig führen?

CEO-Bench simuliert 500 Tage Startup-Führung und testet KI-Agenten bei unüberwachten Geschäftsentscheidungen. Nur Claude Opus 4.8 und GPT-5.5 überschreiten das Startkapital von einer Million Dollar, aber kein Modell erzielt konsistenten Gewinn.

🟡 🤝 Agenten 19. Juni 2026 · 2 Min. Lesezeit

AWS: Amazon Bedrock AgentCore Harness erreicht allgemeine Verfügbarkeit — Deploy in 2 API-Aufrufen

Redaktionelle Illustration: Amazon Bedrock AgentCore Harness erreicht allgemeine Verfügbarkeit — Deploy in 2 API-Aufrufen

Amazon Bedrock AgentCore Harness hat die Preview-Phase verlassen und ist nun für alle in der Produktion verfügbar. Der Einsatz eines Produktions-KI-Agenten erfordert jetzt nur noch 2 API-Aufrufe. Die Plattform unterstützt Claude, Nova, Llama, DeepSeek, GPT-5.5 und GPT-5.4 mit Modellwechsel mid-session ohne Kontextverlust.

🟢 🤝 Agenten 19. Juni 2026 · 1 Min. Lesezeit

GitHub: KI-Agenten können nun vollständig triagierte Issues ohne menschliche Eingriffe erstellen

Redaktionelle Illustration: KI-Agenten können jetzt vollständig triagierte Issues ohne menschliche Eingriffe erstellen

GitHub führte Echtzeit-Duplikaterkennung bei der Issue-Erstellung ein und erweiterte den MCP-Server um Lese- und Schreibunterstützung für Issue-Felder. KI-Agenten können jetzt Issues mit automatisch gesetzten Metadaten erstellen und manuelles Triaging entfällt.

🟡 🤝 Agenten 18. Juni 2026 · 2 Min. Lesezeit

AWS: Bedrock AgentCore erhält Websuche, Zahlungen und A/B-Tests für Agenten

Redaktionelle Illustration: KI-Agenten mit erweitertem Wissen und kontinuierlichen Lernfähigkeiten

AWS hat Amazon Bedrock AgentCore um drei Wissensebenen erweitert: eine verwaltete Wissensdatenbank mit agentischem Retriever, Websuche auf Amazon-Infrastruktur und AgentCore Payments für den Zugang zu lizenziertem Inhalt. Neu hinzugekommen sind Monitoring zur Erkennung stiller Verhaltensfehler, Optimization mit A/B-Tests im Produktionsbetrieb sowie Guardrails, die jede Agentenaktion auf Prompt-Injection und Datenlecks prüfen. AWS WAF führt gleichzeitig die Monetarisierung von KI-Traffic ein.

🟡 🤖 Modelle 19. Juni 2026 · 2 Min. Lesezeit

arXiv:2606.19327: Rubrik-konditionierte Selbstdestillation übertrifft GRPO beim Reasoning-Training

Redaktionelle Illustration: arXiv:2606.19327: Rubrik-konditionierte Selbstdestillation übertrifft GRPO beim Reasoning-Modell-Training

Rubrik-konditionierte Selbstdestillation ist eine neue Trainingsmethode für Reasoning-Modelle, die GRPO um +1,0 Punkt und OPSD um +0,9 Punkte auf wissenschaftlichen Reasoning-Benchmarks übertrifft. Statt skalarer Belohnungen wandelt der Ansatz Rubriken in Token-Level-Führung für präzisere Kreditvergabe um.

🟡 🤖 Modelle 19. Juni 2026 · 1 Min. Lesezeit

OpenAI: GPT-5.5 Instant verbessert Gesundheitsintelligenz in ChatGPT

Redaktionelle Illustration: GPT-5.5 Instant verbessert Gesundheitsintelligenz in ChatGPT

GPT-5.5 Instant verbessert Gesundheits- und Wellness-Antworten in ChatGPT durch stärkeres Schlussfolgern und besseren Kontext. Eine Ärztegruppe führte die Evaluation durch, mit dem Ziel klarerer und zuverlässigerer Kommunikation zu medizinischen Themen.

🔴 🤖 Modelle 18. Juni 2026 · 2 Min. Lesezeit

Google: AMIE erreicht in Nature-Studie das Niveau von Hausärzten im Krankheitsmanagement

Redaktionelle Illustration: medizinisches KI-System für Krankheitsmanagement in einer virtuellen Praxis

Google veröffentlichte in Nature eine Studie, in der die medizinische KI AMIE in einer verblindeten Prüfung das Niveau von 21 Hausärzten im Krankheitsmanagement erreichte und in der Präzision des Behandlungsplans sowie der Leitlinienkonformität statistisch überlegen war. AMIE nutzt einen empathischen Dialogagenten und einen Tiefenreasoningagenten, der Hunderte von Seiten klinischer Leitlinien gegencheckt. Google startete anschließend eine nationale randomisierte Studie in echten virtuellen Praxen.

🟡 🤖 Modelle 18. Juni 2026 · 1 Min. Lesezeit

GitHub: Copilot HyDRA-Router wählt Modell automatisch und liefert 72,5 % Ersparnis bei gleicher Qualität

Redaktionelle Illustration: automatisches Routing von Anfragen an verschiedene KI-Modelle

GitHub stellte HyDRA vor, ein Modell-Routing-System, das für Copilot automatisch das KI-Modell nach Tiefe des Reasonings, Codekomplexität und Werkzeugorchestrierungsbedarf auswählt. HyDRA liefert 72,5 % Kosteneinsparung bei gleichbleibender Qualität; im konservativen Modus 70,8 % Lösungsrate bei 3,3-facher Ersparnis gegenüber OpenRouter Auto. Es ergänzt Prompt-Caching und Tool Search, mit Routing-Genauigkeit innerhalb von 4 Prozentpunkten der englischen Basis in 19 Sprachen.

🟡 🤖 Modelle 18. Juni 2026 · 2 Min. Lesezeit

OpenAI: Fast autonomer KI-Chemiker auf GPT-5.4-Basis verbessert Reaktion in der Wirkstoffsynthese

Redaktionelle Illustration: KI-System optimiert eine chemische Reaktion in der pharmazeutischen Forschung

OpenAI und Molecule.one demonstrierten einen fast autonomen KI-Chemiker auf GPT-5.4-Basis, der eine Schlüsselreaktion in der Wirkstoffsynthese mit minimaler menschlicher Intervention verbesserte. Das System optimiert Reaktionen in der medizinischen Chemie — ein Schritt in Richtung KI-gesteuerter pharmazeutischer Forschung und Entwicklung. Der vollständige Veröffentlichungstext war nicht verfügbar, daher basiert dieser Artikel auf der offiziellen OpenAI-Beschreibung.

🏥 In der Praxis

Mehr in In der Praxis
🟡 🏥 In der Praxis 19. Juni 2026 · 2 Min. Lesezeit

arXiv:2606.19245: TxBench-PP — KI-Agenten auf der Suche nach neuen Medikamenten

Redaktionelle Illustration: arXiv:2606.19245: TxBench-PP — KI-Agenten auf der Suche nach neuen Medikamenten

TxBench-PP ist ein Benchmark, der KI-Agenten in der präklinischen Pharmakologie kleiner Moleküle über 4.800 Trajektorien und 11 Modelle testet. Claude Opus 4.8 erreicht 59,3 % Erfolg vor GPT-5.5 mit 55,3 %, aber kein Modell erreicht die für medizinische Anwendungen nötige Zuverlässigkeit.

🟡 🏥 In der Praxis 19. Juni 2026 · 2 Min. Lesezeit

GitHub: MAI-Code-1-Flash auf 8 Entwicklungsoberflächen innerhalb von Copilot verfügbar

Redaktionelle Illustration: MAI-Code-1-Flash auf 8 Entwicklungsoberflächen innerhalb von Copilot verfügbar

MAI-Code-1-Flash, Microsofts kompaktes Coding-Modell mit best-in-class-Qualität für seine Größe, ist nun auf 8 Entwicklungsoberflächen innerhalb von GitHub Copilot verfügbar — vom CLI bis zu mobilen Plattformen — in allen Plänen von Free bis Max Tier.

🟡 🏥 In der Praxis 19. Juni 2026 · 2 Min. Lesezeit

OpenAI: KI hilft Ärzten bei der Diagnose seltener genetischer Erkrankungen bei Kindern

Redaktionelle Illustration: KI hilft Ärzten bei der Diagnose seltener genetischer Erkrankungen bei Kindern

OpenAIs Reasoning-Modell identifizierte 18 neue Diagnosen in bisher ungelösten Fällen seltener genetischer Erkrankungen bei Kindern in Zusammenarbeit mit Ärzten und Forschungseinrichtungen. Die Ergebnisse werfen neue Fragen über die Rolle von KI in der klinischen Diagnostik auf.

🟢 🏥 In der Praxis 19. Juni 2026 · 1 Min. Lesezeit

PyTorch: LLMs reduzieren GPU-Kernel-Optimierung von Minuten auf Sekunden

Redaktionelle Illustration: LLMs reduzieren GPU-Kernel-Optimierung von Minuten auf Sekunden

Das PyTorch-Core-Team veröffentlichte LLM-geführtes Autotuning für Helion-Kernel, das die GPU-Code-Optimierung von Minuten auf Sekunden beschleunigt. Statt erschöpfender Suche über alle Konfigurationen führen große Sprachmodelle die Parameterraum-Suche intelligent.

🟡 🏥 In der Praxis 18. Juni 2026 · 2 Min. Lesezeit

GitHub: Copilot-Desktop-App allgemein verfügbar — parallele Sitzungen und Cloud-Automatisierungen

Redaktionelle Illustration: Desktop-Anwendung für einen KI-Coding-Assistenten

GitHub hat bekanntgegeben, dass die Copilot-Desktop-Anwendung für macOS, Windows und Linux allgemein verfügbar ist. Die App bietet parallele Sitzungen, eine Canvas-Oberfläche, Cloud-Automatisierungen sowie die Integration eigener Modelle und Werkzeuge. Sie vereint GitHub Spark, Copilot Chat und Copilot CLI in einem einzigen Desktop-Erlebnis. Die Veröffentlichung ist Teil einer größeren Welle von Copilot-Ankündigungen am selben Tag, darunter HyDRA-Modellrouting und der für alle Nutzer verfügbare Auto-Modus.

⚖️ Regulierung

Mehr in Regulierung
🟢 ⚖️ Regulierung 18. Juni 2026 · 2 Min. Lesezeit

EU: Bericht zum Stand des Digitalen Jahrzehnts 2026 fordert Schließung struktureller Lücken bis 2030.

Redaktionelle Illustration: Europäische digitale und technologische Souveränität

Die Europäische Kommission hat ihren vierten jährlichen Bericht zum Stand des Digitalen Jahrzehnts veröffentlicht, der die Fortschritte der EU bei den digitalen Zielen für 2030 in den Bereichen Infrastruktur, Wirtschaft, Kompetenzen und öffentliche Dienste bewertet. Der Bericht erkennt KI, Halbleiter, Cloud und Open Source als Säulen der europäischen technologischen Souveränität an und nennt die Lieferung von Ergebnissen in Umfang, Tempo und Konsistenz als zentrale Herausforderung. Laut Eurobarometer stuft eine große Mehrheit der Europäer die Digitalpolitik als oberste EU-Priorität ein.

🟢 ⚖️ Regulierung 17. Juni 2026 · 2 Min. Lesezeit

CNCF: Architekturmuster für digitale Souveränität cloud-nativer Plattformen unter EU-Regulierung

Redaktionelle Illustration: digitale Souveränität und getrennte Jurisdiktionen in der Cloud-Infrastruktur

CNCF veröffentlichte einen Leitfaden zu Architekturmustern für die digitale Souveränität cloud-nativer Plattformen, da der EU Data Act seit dem 11. Januar 2025 vollständig anwendbar ist. Regulatoren erwarten vier Eigenschaften: Jurisdiktionsbegrenzung, operative Autonomie, kryptografische Zugangskontrolle und Portabilität. Ein einzelner Kubernetes-Cluster reicht nicht aus, da ein gemeinsamer Control Plane gemeinsames Risiko bedeutet; das vorgeschlagene Muster gibt jeder Jurisdiktion einen eigenen Control Plane (vCluster), mit GitOps-Deklaration der Grenzen.

🟢 ⚖️ Regulierung 16. Juni 2026 · 1 Min. Lesezeit

arXiv:2606.16723: AgentFairBench misst demografische Diskriminierung in Aktionen von LLM-Agenten

Redaktionelle Illustration: Messung von Fairness in KI-Agenten-Entscheidungen

AgentFairBench ist das erste Benchmark, das demografische Ungleichheit in den tatsächlichen Aktionen von LLM-Agenten misst — nicht nur in ihren Antworten — in den Bereichen Beschäftigung, Kreditvergabe und medizinische Triage. Es verwendet die Metriken Counterfactual Flip Rate und Action-Rate Disparity und testet vier Agenten-Scaffolds. In einem Pilot mit 864 Entscheidungen zeigte Claude Haiku keinen demografischen Effekt über dem Rauschen; die Studie warnt, dass naiver Vergleich von sechs Gruppen Ungleichheit um den Faktor 2,4 überschätzen kann.

🟢 ⚖️ Regulierung 16. Juni 2026 · 1 Min. Lesezeit

arXiv:2606.17005: Bayesscher Rahmen für Audits zeigt, dass KI-Bestenlisten unvereinbare Historien verbergen

Redaktionelle Illustration: Überprüfung der Ergebnishistorie auf KI-Modell-Bestenlisten

Die Studie stellt einen Bayesschen Auditrahmen vor, der zeigt, dass ein einzelner finaler Bestenlisten-Schnappschuss mit 1.000 Systemen mehreren unvereinbaren historischen Entwicklungspfaden entsprechen kann, mit Konvergenzzeiten von 23 bis 75 Schritten. Gestützt auf archivierte Daten von LiveBench, Open LLM Leaderboard v2, LMArena, GAIA und tau-bench schlägt der Autor ein Archive-and-Adjudication-Protokoll zur Rekonstruktion der Bewertungshistorie vor.

🛡️ Sicherheit

Mehr in Sicherheit
🔴 🛡️ Sicherheit 19. Juni 2026 · 2 Min. Lesezeit

Google DeepMind: Über 50 % der KI-Agenten-Sicherheitsvorfälle sind Fehler, keine Angriffe

Redaktionelle Illustration: Über 50 % der Agenten-Sicherheitsvorfälle sind Fehler, keine Angriffe

Google DeepMind analysierte eine Million Agenten-Coding-Trajektorien und stellte fest, dass mehr als 50 % der gemeldeten Sicherheitsvorfälle bei KI-Agenten auf Aufgabenmissverständnisse oder übermäßigen Modelleifer zurückgehen, nicht auf externe Angriffe. Das verschiebt die Verteidigungsprioritäten.

🟡 🛡️ Sicherheit 19. Juni 2026 · 2 Min. Lesezeit

GitHub: Zwei Sicherheitsupdates für GitHub Actions schützen vor Pwn-Request-Angriffen

Redaktionelle Illustration: Zwei Sicherheitsupdates für GitHub Actions schützen vor Pwn-Request-Angriffen

GitHub veröffentlichte an einem Tag zwei komplementäre Sicherheitsupdates für Actions: actions/checkout@v7 blockiert Pwn-Request-Angriffe aus Fork-PRs, und die neue Workflow-Execution-Protections-Funktion ermöglicht Admin-Allowlists nach Akteur und Eventtyp für gesamte Organisationen.

🟡 🛡️ Sicherheit 18. Juni 2026 · 2 Min. Lesezeit

arXiv:2606.18060: PseudoBench zeigt, dass agentische KI Pseudowissenschaft mit nahezu nullprozentiger Ablehnungsrate verbreitet

Redaktionelle Illustration: KI-Agenten erzeugen überzeugende, aber falsche wissenschaftliche Behauptungen

Der neue Benchmark PseudoBench testete sieben führende KI-Agenten anhand von 200 pseudowissenschaftlichen Behauptungen in fünf Domänen und stellte eine nahezu nullprozentige Ablehnungsrate fest — die höchste gemessene Resistenz betrug lediglich 27,4 %. Paradoxerweise verpacken stärkere Modelle Pseudowissenschaft in ausgefeiltere akademische Sprache und erhöhen damit das Risiko. Die Autoren warnen, dass ein „wissenschaftliches Alignment” notwendig ist, bevor autonome Forschungsagenten, die überzeugende gefälschte Studien vom Experiment bis zum fertigen Text generieren, massenhaft eingesetzt werden.

🟡 🛡️ Sicherheit 17. Juni 2026 · 1 Min. Lesezeit

Anthropic: Red Team kartiert KI-gestützte Cyberangriffe im MITRE ATT&CK Framework, in Zusammenarbeit mit Verizon

Redaktionelle Illustration: Kartierung KI-gestützter Cyberangriffe in einem Sicherheitsframework

Anthropics Red Team veröffentlichte eine Analyse, die reale KI-bewaffnete Cyberoperationen im MITRE ATT&CK Framework kartiert, entwickelt in Zusammenarbeit mit Verizon. Die Arbeit analysiert in der Praxis beobachtete Muster KI-unterstützter Angriffe. Parallel veröffentlichte das Red Team eine Analyse darüber, wie große Sprachmodelle die Ausnutzung bereits offengelegter, aber noch nicht gepatchter (N-Day) Schwachstellen beschleunigen.

🟡 🛡️ Sicherheit 17. Juni 2026 · 1 Min. Lesezeit

AWS: Neues Bedrock InvokeGuardrailChecks API bringt Sicherheitsprüfungen ohne Ressourcen für agentische Anwendungen

Redaktionelle Illustration: Sicherheitsprüfungen in agentischen KI-Anwendungen

AWS führte InvokeGuardrailChecks in Amazon Bedrock ein, eine Erkennungs-API, die Bewertungen zurückgibt, ohne automatisch zu blockieren und ohne eine vorab erstellte Guardrail-Ressource zu benötigen. Es deckt drei Schutzmaßnahmen ab: Inhaltsfilter, Erkennung von Prompt-Angriffen (Jailbreak, Injektion, Datenleck) und PII-Erkennung mit 31 Entitätstypen. Die API gibt Schweregrad- und Vertrauensbewertungen auf einer Skala von 0 bis 1,0 zurück, konzipiert für mehrstufige agentische Schleifen, bei denen das Entwicklungsteam die Schwellenwerte kontrolliert.

🟢 💬 Community 19. Juni 2026 · 1 Min. Lesezeit

GitHub: Wie Pull-Request-Limits den Lärm in Open-Source-Projekten reduzieren

Redaktionelle Illustration: Wie Pull-Request-Limits den Lärm in Open-Source-Projekten reduzieren

GitHub führt Pull-Request-Limits ein, die Maintainern die Kontrolle über die Anzahl gleichzeitiger Beitragsvorschläge externer Mitwirkender geben. Seit Januar 2023 stieg die Zahl zusammengeführter PRs von 25 Mio. auf über 90 Mio. pro Monat — ein 3,6-facher Anstieg, der viele Projekte überlastet.

🟡 💬 Community 18. Juni 2026 · 2 Min. Lesezeit

Anthropic: Büro in Seoul eröffnet und neue Partnerschaften im koreanischen KI-Ökosystem angekündigt

Redaktionelle Illustration: globale Expansion eines KI-Unternehmens in den asiatischen Markt

Anthropic hat ein Büro in Seoul eröffnet, das erste in Asien, und neue Kooperationen innerhalb des koreanischen KI-Ökosystems angekündigt. Der Schritt ist Teil der globalen Expansion des Unternehmens über die USA und Europa hinaus. Details einzelner Partnerschaften waren in der Quelle nicht verfügbar und werden hier bewusst nicht genannt. Südkorea ist ein bedeutender Markt mit einer starken Technologieindustrie und einer hohen KI-Adoptionsrate.

🟡 💬 Community 17. Juni 2026 · 1 Min. Lesezeit

GitHub: GitHub Models für Neukunden geschlossen — GitHub zieht sich aus dem Modell-Serving zurück

Redaktionelle Illustration: Schließung des Zugangs zu einer KI-Modell-Serving-Plattform

GitHub schloss GitHub Models — Playground, API und Modellkatalog — ab dem 16. Juni 2026 für neue Organisationen. Bestehende Nutzer behalten vorerst vollen Zugang, Details zur vollständigen Abschaltung folgen. GitHub verweist neue Nutzer auf Azure AI Foundry als Alternative. Ein Grund für den Rückzug wurde in der Ankündigung nicht genannt, aber der Schritt signalisiert, dass sich GitHub aus der direkten KI-Modellbereitstellung für Entwickler zurückzieht.

🟡 💬 Community 16. Juni 2026 · 1 Min. Lesezeit

OpenAI: Partner Network mit 150 Millionen Dollar zur Beschleunigung der Enterprise-KI-Einführung gestartet

Redaktionelle Illustration: globales Netzwerk von Geschäftspartnern rund um eine KI-Plattform

OpenAI hat das Partner Network gestartet, ein Programm mit 150 Millionen Dollar für globale Partner zur Beschleunigung der Enterprise-KI-Einführung. Ziel ist es, Unternehmen bei Implementierung, Deployment und Geschäftstransformation mit KI zu unterstützen. Die Ankündigung wurde am 14. Juni 2026 veröffentlicht. Der vollständige Text war nicht zugänglich; dieser Artikel basiert auf der offiziellen OpenAI-Postbeschreibung.

🟡 🔧 Hardware 19. Juni 2026 · 2 Min. Lesezeit

AMD: Analyse von RoCE-Netzwerkverkehrsmustern beim Training großer Sprachmodelle

Redaktionelle Illustration: Analyse von RoCE-Netzwerkverkehrsmustern beim Training großer Sprachmodelle

AMD veröffentlichte eine vergleichende Analyse der RoCE-Netzwerkverkehrsmuster beim Training von vier großen Sprachmodellen — GPT-4, Llama 3, DeepSeek-V2 und Grok 4.0 — als praktischen Leitfaden für den Aufbau von KI-Infrastruktur in Scale-out-Clustern mit mehreren GPU-Knoten.

🟢 🔧 Hardware 18. Juni 2026 · 1 Min. Lesezeit

AMD: Open-source Schola verbindet Unreal Engine und Reinforcement Learning für Roboterarm-Training auf ROCm

Redaktionelle Illustration: Reinforcement-Learning-Training eines Roboterarms in der Simulation

AMD hat Schola vorgestellt, ein Open-Source-Plugin für Unreal Engine, das Gymnasium-kompatibles Reinforcement-Learning-Training über Python-Frameworks und gRPC ermöglicht. Im Beispiel wird ein kollaborativer Roboterarm xArm6 in Unreal Engine 5.7 mit MuJoCo-Physik, dem PPO-Algorithmus und PyTorch auf dem AMD ROCm-Stack für GPU-Beschleunigung trainiert. Das Tutorial zeigt eine Reach-Aufgabe, bei der die Armspitze zu zufällig platzierten Zielorten bewegt wird.

🟡 🔧 Hardware 17. Juni 2026 · 1 Min. Lesezeit

AMD: Instinct MI355X bei MLPerf Training v6.0 nur 5% hinter NVIDIA, 3,5× schneller als Vorgänger

Redaktionelle Illustration: AMD Instinct MI355X Beschleuniger im Rechenzentrum

AMDs MLPerf Training v6.0 Ergebnisse zeigen, dass der Instinct MI355X auf LLM-Benchmarks innerhalb von etwa 5% der Leistung eines gleichwertigen NVIDIA-GPUs liegt. Der MI355X ist 3,5× schneller als der MI300X des Vorjahres und 13–19% schneller als die vorherige Runde. AMD führte erstmals MXFP4 (FP4)-Trainingsrezepte und das Primus-Unified-Framework ein, zusammen mit einer Mehrknoteneinreichung von 512 MI300X-GPUs auf 64 Knoten.

🟡 🔧 Hardware 17. Juni 2026 · 1 Min. Lesezeit

NVIDIA: Blackwell dominiert MLPerf Training 6.0 — schnellster auf allen 7 Benchmarks, GB300 bis zu 1,6× schneller

Redaktionelle Illustration: NVIDIA Blackwell GPU-Cluster für KI-Modelltraining

NVIDIA gab bekannt, dass ihre Blackwell-Plattform auf allen sieben Tests des MLPerf Training 6.0 die besten Ergebnisse erzielt hat. GB300 NVL72 bietet bis zu 1,6× schnelleres Training als GB200 NVL72. Die größte Einreichung nutzte 8.192 Blackwell-GPUs am DeepSeek-V3-Modell mit 671 Milliarden Parametern. CoreWeave trainierte DeepSeek-V3 671B in 2,02 Minuten auf 8.192 GPUs, Microsoft Azure schloss Llama 3.1 405B in 7,07 Minuten ab.

🟡 🔧 Hardware 16. Juni 2026 · 2 Min. Lesezeit

AMD: Neuer ATOM Inference Engine für Instinct GPUs bietet OpenAI-kompatible API und MoE-Optimierungen

Redaktionelle Illustration: AMD-Instinct-GPU-Stack für KI-Modell-Serving

AMD hat ATOM vorgestellt, einen Inference Engine für Instinct GPUs, der eine OpenAI-kompatible API bereitstellt und KV-Cache, Scheduling und Parallelismus orchestriert. ATOM steht an der Spitze des ROCm-Stacks, neben AITER-Kerneln und MoRI-RDMA-Kommunikation, unterstützt TP-, DP- und EP-Parallelismus und ist für MoE-Modelle wie DeepSeek V2–V4, Mixtral und Qwen3-MoE optimiert. Er bietet FP8-, MXFP4-, INT8- und INT4-Quantisierung sowie MTP Speculative Decoding mit EAGLE-Proposer.

📦 Open Source

Mehr in Open Source
🟡 📦 Open Source 19. Juni 2026 · 2 Min. Lesezeit

Black Forest Labs: Robin Rombach fordert G7-Führer auf, offene KI-Entwicklung zu unterstützen

Redaktionelle Illustration: Robin Rombach fordert G7-Führer auf, offene KI-Entwicklung zu unterstützen

Robin Rombach, Mitgründer und CEO von Black Forest Labs (Schöpfer der FLUX-Modelle), wandte sich an G7-Staats- und Regierungschefs mit dem Aufruf, offene und verantwortungsvolle KI-Entwicklung zur globalen Norm zu machen. Rombach argumentiert, dass die öffentliche Verfügbarkeit von KI-Parametern Innovationen fördert und die Technologie demokratisiert.

🟡 📦 Open Source 18. Juni 2026 · 2 Min. Lesezeit

Allen Institute: Open-Source MolmoMotion sagt 3D-Bewegung aus Videos vorher und setzt SOTA in der Robotik

Redaktionelle Illustration: Vorhersage von 3D-Objekttrajektorien für robotische Manipulation

Das Allen Institute veröffentlichte MolmoMotion, ein vollständig quelloffenes Modell, das 3D-Trajektorien von Objekten aus Videos und natürlichsprachlichen Anweisungen wie „drehe die Schüssel” vorhersagt. Das Modell erreicht den State-of-the-Art auf PointMotionBench mit 0,109 m mittlerer Abweichung gegenüber 0,134 m des vorherigen Rekords und steigert den Erfolg von Pick-and-Place-Aufgaben in der Robotik von 56 % auf 76,3 % — ein Plus von 20,3 Prozentpunkten. Es wurde auf dem MolmoMotion-1M-Datensatz mit 1,16 Millionen Videos mit 3D-Trajektorien und Aktionsbeschreibungen trainiert.

🟡 📦 Open Source 17. Juni 2026 · 1 Min. Lesezeit

vLLM: Semantic Router Fusion kombiniert ein Modell-Panel mit einem Richter, der eine einzige Antwort synthetisiert

Redaktionelle Illustration: KI-Modell-Panel und Richtermodell synthetisieren eine einzige Antwort

vLLM stellte Semantic Router Fusion vor, ein Primitiv, bei dem mehrere Modelle parallel als Panel arbeiten und ein Richtermodell Konsens und Unterschiede analysiert sowie eine einzige Antwort synthetisiert. Es unterstützt lokale vLLM- und private Endpunkte sowie öffentliche Anbieter wie Gemini, Kimi, DeepSeek und Claude. Externe Validierung auf OpenRouter DRACO ergab 69% für das kombinierte Panel gegenüber 65,3% für das beste Einzelmodell, mit voller OpenAI-API-Kompatibilität.

🟡 📦 Open Source 16. Juni 2026 · 2 Min. Lesezeit

GitHub: Offener Multilingual Repositories Dataset mit 80 Millionen Zeilen und 40 Millionen Repositories

Redaktionelle Illustration: mehrsprachiger Datensatz aus offenen Code-Repositories

GitHub hat den Multilingual Repositories Dataset mit mehr als 80 Millionen Klassifikationszeilen aus 40 Millionen Repositories unter der vollständig offenen CC0-1.0-Lizenz veröffentlicht. Für jedes Repository erfasst der Datensatz drei Textquellen — README, meistkommentiertes Issue und meistkommentierter Pull Request — mit Spracherkennung durch drei Tools: fastText, gcld3 und lingua-py. Portugiesisch führt bei nicht-englischen README-Dateien, Koreanisch ist in Issue-Diskussionen am häufigsten vertreten.

🟢 📦 Open Source 16. Juni 2026 · 2 Min. Lesezeit

CNCF: Oracles Spende von 3 Millionen Dollar in OCI-Credits beschleunigt Arm64-Unterstützung in 12+ Projekten

Redaktionelle Illustration: Arm64-Cloud-Infrastruktur für Open-Source-Projekte

CNCF berichtet, dass Oracles Spende von 3 Millionen Dollar in OCI-Compute-Credits Arm64-CI/CD-Unterstützung in mehr als 12 Projekten ermöglicht, darunter OpenTelemetry, containerd, Falco, Longhorn, Crossplane und Jaeger. Die Nachfrage überstieg schnell die anfängliche Richtlinie von 5.000 Dollar pro Monat. Der Wandel wird von Daten begleitet, dass mehr als 50 Prozent neuer AWS-Instanzen und 33 Prozent der Azure-Instanzen nun auf Arm64-Architektur laufen.