🟡 📦 Open Source Veröffentlicht: · 2 Min. Lesezeit ·

UK AISI: Engineering Playbook öffnet Frontier-Modell-Evaluierungsinfrastruktur in fünf Schichten

Redaktionelle Illustration: fünf gestapelte Infrastrukturschichten mit Sicherheitsschild-Symbol

Der Engineering Playbook ist eine Open-Source-Dokumentation, die das UK AI Safety Institute am 18. Juni 2026 veröffentlichte und die interne Infrastruktur zur Evaluierung von Frontier-KI-Modellen öffnet. Der Playbook ist in fünf Schichten strukturiert (Evaluate, Isolate, Connect, Run, Scale) und baut auf dem früher veröffentlichten Tool Inspect AI auf, das über 200 fertige Evaluierungen und 240 Mitwirkende hat.

🤖

Dieser Artikel wurde mithilfe von künstlicher Intelligenz aus Primärquellen erstellt.

Das UK AI Safety Institute (AISI), die britische Regierungsbehörde für KI-Sicherheit, veröffentlichte am 18. Juni 2026 den Engineering Playbook — eine Open-Source-Dokumentation der eigenen Infrastruktur zur Evaluierung von Frontier-Modellen. Frontier-Modelle sind die fortschrittlichsten KI-Systeme, und ihre Prüfung erfordert spezialisierte Infrastruktur für Isolation, Ausführung und Verhaltensmessung.

Fünf Evaluierungsschichten

Der Playbook ist in fünf Schichten strukturiert: Evaluate (Testdefinition), Isolate (Sicherheitsisolierung), Connect (Verbindung zu Modellen), Run (Ausführung) und Scale (Skalierung auf größere Workloads). Die Struktur deckt den gesamten Weg von der Testkonzeption bis zur Recheninfrastruktur für Open-Weight-Modelle ab und gibt anderen Laboren und Behörden eine bewährte Vorlage, anstatt ein eigenes System von Grund auf aufzubauen.

Worauf er aufbaut

Der Engineering Playbook baut auf Inspect AI auf, AISIs Evaluierungsframework, das das Institut früher veröffentlicht hat. Durch die Bibliothek Inspect Evals sind über 200 fertige Evaluierungen verfügbar, und das inspect_ai-Repository auf GitHub hat 240 Mitwirkende. Im Gegensatz zu geschlossenen internen Systemen einzelner Labore ist dieser Stack öffentlich und kann von jeder Organisation übernommen werden, die Modelle testet.

Wer ihn bereits nutzt

Die Organisation METR, bekannt für die Messung autonomer Fähigkeiten von Modellen, führt 228 Aufgaben auf Frontier-Modellen mit Inspect aus. Die Veröffentlichung des Playbooks senkt die Einstiegshürde für unabhängige Sicherheitsprüfungen: Statt kostspieliger eigener Infrastruktur erhalten Forscher ein dokumentiertes, reproduzierbares und offenes System. Das Material ist unter engineering-playbook.aisi.org.uk verfügbar.

Häufig gestellte Fragen

Was ist der UK AISI Engineering Playbook?
Es ist eine Open-Source-Dokumentation der internen Infrastruktur zur Evaluierung von Frontier-Modellen, strukturiert in fünf Schichten: Evaluate, Isolate, Connect, Run und Scale.
Worauf baut der Playbook auf?
Er baut auf dem früher veröffentlichten Tool Inspect AI auf, das durch Inspect Evals über 200 fertige Evaluierungen bietet und 240 Mitwirkende auf GitHub hat.
Wer nutzt diese Infrastruktur bereits?
Die Organisation METR führt 228 Aufgaben auf Frontier-Modellen mit Inspect aus.