Samstag, 25. April 2026

8 Nachrichten — 🟡 4 wichtig , 🟢 4 interessant

← Vorheriger Tag Nächster Tag →

🤝 Agenten (2)

🔧 Hardware (1)

🏥 In der Praxis (2)

🛡️ Sicherheit (3)

🟡 🛡️ Sicherheit 25. April 2026 · 3 Min. Lesezeit

Anthropic aktualisiert Wahlsicherheitsmaßnahmen: Claude Opus 4.7 und Sonnet 4.6 erreichen 95–96 % bei politischer Neutralität

Editorial illustration: Anthropic Wahlsicherheitsmaßnahmen — Claude Neutralitätsevaluierungen

Anthropic hat eine aktualisierte Evaluierung der Wahlsicherheitsmaßnahmen vor den US-Zwischenwahlen 2026 veröffentlicht. Claude Opus 4.7 erzielte 95 % und Sonnet 4.6 sogar 96 % bei Tests zur politischen Neutralität über 600 Prompts, mit einer Compliance von 99,8–100 % bei legitimen Anfragen.

🟡 🛡️ Sicherheit 25. April 2026 · 3 Min. Lesezeit

arXiv:2604.21854 'Bounding the Black Box': Ein statistischer Rahmen zur Zertifizierung hochriskanter KI-Systeme gemäß EU AI Act

Editorial illustration: Bounding the Black Box — statistischer Rahmen für die EU AI Act-Zertifizierung

Natan Levy und Gadi Perl veröffentlichten am 23. April 2026 auf ArXiv eine Arbeit, die eine regulatorische Lücke im EU AI Act, im NIST-Framework und in der Europarats-Konvention schließt. Sie schlagen einen zweistufigen statistischen Rahmen mit den Werkzeugen RoMA und gRoMA vor, die eine überprüfbare obere Schranke für die Fehlerrate berechnen, ohne Zugang zur internen Modellstruktur zu benötigen.

🟢 🛡️ Sicherheit 25. April 2026 · 3 Min. Lesezeit

arXiv:2604.21430: Kurze Chatbot-Gespräche verändern moralische Urteile dauerhaft — empirische Studie mit 53 Teilnehmern

Editorial illustration: Chatbot moralischer Einfluss — empirische Studie

Eine neue empirische Studie auf arXiv zeigt, dass kurze Gespräche mit einem persuasiven Chatbot statistisch signifikante Verschiebungen moralischer Urteile bei 53 Teilnehmern erzeugen, mit Effekten, die sich über zwei Wochen verstärken. Die Kontrollgruppe zeigte keine Veränderungen, und die Teilnehmer waren sich des Einflusses nicht bewusst.

← Vorheriger Tag Nächster Tag →