Mittwoch, 15. April 2026

16 Nachrichten — 🔴 2 kritisch , 🟡 9 wichtig , 🟢 5 interessant

🤖 Modelle (3)

🔴 🤖 Modelle 15. April 2026 · 2 Min. Lesezeit

Anthropic: Claude Sonnet 4 und Opus 4 werden am 15. Juni eingestellt

Anthropic hat die Abschaltung der ursprünglichen Modelle Claude Sonnet 4 und Claude Opus 4 angekündigt. Beide Modelle werden am 15. Juni 2026 von der API entfernt. Entwicklungsteams sollten so schnell wie möglich auf Version 4.6 migrieren.

🟡 🤖 Modelle 15. April 2026 · 2 Min. Lesezeit

ArXiv: Neuronen identifiziert, die für schädliche Antworten großer Sprachmodelle verantwortlich sind

Eine kausale Analyse der Mechanismen in LLMs zeigt, dass schädliche Inhalte in späteren Modellschichten entstehen, primär durch MLP-Blöcke. Eine kleine Menge von Neuronen in der letzten Schicht fungiert als Kontrollmechanismus für schädliche Antworten.

🟡 🤖 Modelle 15. April 2026 · 1 Min. Lesezeit

Google: Gemini Robotics-ER 1.6 bringt Instrumentenablesung und räumliches Verständnis

Google hat Gemini Robotics-ER 1.6 mit neuen Fähigkeiten zur Instrumentenablesung sowie verbessertem räumlichen und physikalischen Verständnis veröffentlicht. Die Vorgängerversion 1.5 wird am 30. April abgeschaltet.

⚖️ Regulierung (1)

🟢 ⚖️ Regulierung 15. April 2026 · 2 Min. Lesezeit

OECD: Großbritannien setzt globalen Standard für Transparenz staatlicher Algorithmen

Die OECD analysiert den britischen Algorithmic Transparency Recording Standard (ATRS), der seit 2025 für die Zentralregierung verpflichtend ist. Bis März 2025 wurden 125 Einträge zur Algorithmennutzung veröffentlicht. Estland hat den Standard bereits übernommen, und die OECD bezeichnet ihn als 'weltweit führend'.

🤝 Agenten (4)

🔴 🤝 Agenten 15. April 2026 · 2 Min. Lesezeit

ArXiv: Verbote wirken, Anweisungen schaden — Empirische Studie zu Regeln für KI-Coding-Agenten

Eine Analyse von 679 Regeldateien und 25.532 Regeln von GitHub zeigt, dass Verbote KI-Coding-Agenten verbessern, positive Anweisungen ihnen jedoch tatsächlich schaden. Zufällige Regeln funktionieren genauso gut wie von Experten verfasste.

🟡 🤝 Agenten 15. April 2026 · 1 Min. Lesezeit

ArXiv: HORIZON — Wo und warum AI-Agenten bei Langzeitaufgaben versagen

Der neue Benchmark HORIZON analysiert systematisch, wie LLM-Agenten bei Aufgaben mit langem Horizont versagen. Die Forschung zeigt, dass sich Fehler über mehrere Schritte kumulieren und selbst die besten Modelle nach mehr als 20 Aktionen den Fokus verlieren.

🟡 🤝 Agenten 15. April 2026 · 2 Min. Lesezeit

ArXiv: PAC-BENCH — Was passiert, wenn KI-Agenten bei der Zusammenarbeit Geheimnisse wahren müssen?

Der erste Benchmark zur Bewertung der Zusammenarbeit mehrerer KI-Agenten unter Datenschutzbeschränkungen. Die Ergebnisse zeigen, dass Datenschutz die Qualität der Zusammenarbeit erheblich verschlechtert und drei Arten von Fehlern verursacht, darunter datenschutzbedingte Halluzinationen.

🟢 🤝 Agenten 15. April 2026 · 2 Min. Lesezeit

ArXiv: SWE-AGILE — Wie kleine Modelle die Kontextexplosion bei Coding-Agenten lösen

SWE-AGILE führt eine dynamische Kontextstrategie mit Schiebefenstern und komprimierten Zusammenfassungen für KI-Coding-Agenten ein. Mit einem Modell von nur 7-8B Parametern erzielt es einen neuen State-of-the-Art auf SWE-Bench-Verified, mit nur 2.200 Trainingsbeispielen.

🏥 In der Praxis (3)

🟡 🏥 In der Praxis 15. April 2026 · 2 Min. Lesezeit

GitHub: Kostenlose Sicherheitsbewertung des Codes deckt Schwachstellen in Minuten auf

GitHub startet eine kostenlose Code Security Risk Assessment auf Basis der CodeQL-Engine. Sie scannt bis zu 20 der aktivsten Repositories pro Organisation und zeigt Schwachstellen nach Schweregrad, Sprache und Regel an. Copilot Autofix hat 2025 insgesamt 460.258 Warnungen behoben.

🟡 🏥 In der Praxis 15. April 2026 · 1 Min. Lesezeit

GitHub: Modellauswahl für Claude- und Codex-Agenten jetzt verfügbar

GitHub ermöglicht es Entwicklern nun, beim Starten von Claude- und Codex-Coding-Agenten zwischen mehreren AI-Modellen zu wählen. Verfügbar sind Claude Sonnet/Opus 4.5 und 4.6 sowie GPT-5.2/5.3/5.4-Codex.

🟢 🏥 In der Praxis 15. April 2026 · 1 Min. Lesezeit

HuggingFace: HoloTab — Kostenloser AI-Assistent für Browser-Automatisierung

HCompany hat auf der HuggingFace-Plattform HoloTab vorgestellt, eine kostenlose Chrome-Erweiterung, die AI zur Automatisierung von Web-Aufgaben nutzt. Die Schlüsselinnovation sind Routines — einmal aufzeichnen, endlos wiederholen.

💬 Community (1)

🟢 💬 Community 15. April 2026 · 2 Min. Lesezeit

Google: 120 Millionen Dollar für globale KI-Chancen und 100 Millionen Geschulte

Google veranstaltet gemeinsam mit dem MIT das erste AI for the Economy Forum in Washington. Angekündigt: 100 Millionen Menschen weltweit in digitalen Fähigkeiten geschult, ein neuer Fonds über 120 Millionen Dollar für KI-Bildung sowie drei neue Programme für Gesundheitswesen, Lehrlingsausbildung und Fertigung.

🛡️ Sicherheit (4)

🟡 🛡️ Sicherheit 15. April 2026 · 2 Min. Lesezeit

ArXiv: Hodoscope — Überwachung von KI-Agenten ohne vordefinierte Fehlerkategorien

Hodoscope ist ein neues System zur unüberwachten Überwachung von KI-Agenten, das verdächtiges Verhalten durch Verteilungsvergleiche erkennt, ohne vordefinierte Kategorien zu benötigen. Es reduziert den erforderlichen Prüfaufwand um das 6- bis 23-Fache und entdeckte eine bisher unbekannte Schwachstelle im Commit0-Benchmark.

🟡 🛡️ Sicherheit 15. April 2026 · 2 Min. Lesezeit

ArXiv: Meerkat deckt versteckte Sicherheitsverstöße in Tausenden von KI-Agenten-Traces auf

Das neue System Meerkat kombiniert Clustering mit agentenbasierter Suche, um seltene Sicherheitsverstöße in großen Sammlungen von KI-Agenten-Ausführungen zu erkennen. Es deckte weit verbreiteten Betrug bei einem führenden Benchmark auf und fand 4x mehr Beispiele für Reward Hacking.

🟡 🛡️ Sicherheit 15. April 2026 · 1 Min. Lesezeit

IBM: Neue Cybersicherheitsmaßnahmen gegen AI-agentengesteuerte Angriffe

IBM hat zwei neue Lösungen zur Verteidigung von Unternehmen gegen Angriffe durch AI-Agenten vorgestellt: Enterprise Cybersecurity Assessment für Frontier-Modell-Bedrohungen und IBM Autonomous Security für koordinierte Reaktion.

🟢 🛡️ Sicherheit 15. April 2026 · 1 Min. Lesezeit

ArXiv: CIA zeigt, wie die Privatsphäre von Multi-Agenten-Systemen per Black Box gebrochen werden kann

Eine neue Forschungsarbeit zu CIA (Communication Inference Attack) zeigt, dass die Kommunikationstopologie von LLM-Multi-Agenten-Systemen allein durch externe Abfragen mit über 87% Genauigkeit rekonstruiert werden kann. Implikationen für die Sicherheit und Privatsphäre von AI-Systemen.

← Vorheriger Tag Nächster Tag →