UK AISI: AI cyber dupliranje svakih 4,7 mjeseci

Q: Što su cyber time horizons benchmarci?

Cyber time horizons benchmarci mjere dužinu zadataka koje AI modeli autonomno mogu završiti, uspoređeno s ekspert completion vremenima; AISI koristi narrow cyber suite s vulnerability identification i exploitation zadacima, 2,5M token budget per task za usporedivost kroz modele, 80 % success threshold za reliability mjerenja.

Q: Koji frontier modeli su testirani?

Claude Mythos Preview je prvi model koji je riješio oba cyber ranges — The Last Ones (60 % success rate) i Cooling Tower (30 % success rate); GPT-5.5 riješio The Last Ones uz 30 % success rate; ostali modeli tracked od kraja 2024. nadalje s clear progresijom.

How fast is autonomous AI cyber capability advancing? je novi UK AI Safety Institute (AISI) izvještaj objavljen 13. svibnja 2026. Mjerenjem cyber time horizons benchmark-a (2,5M token budget, 80 % success threshold), AISI utvrdio da se dužina cyber zadataka koje AI modeli autonomno rješavaju udvostručuje svakih 4,7 mjeseci. Claude Mythos Preview prvi je model koji je riješio oba cyber ranges (The Last Ones 60 %, Cooling Tower 30 %); GPT-5.5 riješio The Last Ones 30 %.

UK AI Safety Institute (AISI) objavio je 13. svibnja 2026. izvještaj koji daje prvi empirijski mjerenje brzine kojom napreduju autonomne cyber sposobnosti frontier AI modela. Glavni nalaz: dužina cyber zadataka koje modeli autonomno rješavaju udvostručuje se svakih 4,7 mjeseci kao od veljače 2026. — i nedavni modeli značajno premašuju ovaj trend.

Što su cyber time horizons benchmarci?

AISI je razvio formalnu metodologiju koja mjeri dužinu cyber tasaka koje AI modeli mogu autonomno završiti, uspoređeno s expert completion vremenima. Pristup koristi:

Narrow cyber suite s zadacima koji zahtijevaju vulnerability identification i exploitation
2,5M token budget per task kako bi se osigurala usporedivost kroz različite modele
80 % success rate threshold za reliability mjerenja
Dva cyber ranges koji simuliraju enterprise network attacks

Pristup je sličan ARC-AGI-style benchmark-u, ali aplicirano na security domain umjesto general reasoning. Brojka “4,7 mjeseci dupliranje” izračunata je iz longitudinalnog tracking-a frontier modela od kraja 2024. nadalje.

Koji frontier modeli su testirani?

Claude Mythos Preview je prvi model koji je riješio oba cyber ranges:

The Last Ones: 60 % success rate
Cooling Tower: 30 % success rate

GPT-5.5 riješio The Last Ones uz 30 % success rate. Ostali modeli iz late-2024 do early-2026 tracked su s clear progresijom — svaki sljedeći frontier release pomiče cyber capability frontier značajno naprijed.

Razlika između Claude Mythos i GPT-5.5 na istom benchmark-u (60 % vs 30 % na The Last Ones) je signifikantan signal — Anthropic Mythos Preview, koji je trenutno gated research preview za defensive cybersecurity work, je očito specifically tuned za cyber tasks.

Što “dupliranje svakih 4,7 mjeseci” praktično znači?

Pretpostavimo da frontier model trenutno može autonomno riješiti 30 minuta cyber task (npr. exploit jednog identified vulnerability). Trajektoriji:

Trenutno (svibanj 2026.): 30 min
Listopad 2026. (+4.7 mj): 60 min
Veljača 2027. (+9.4 mj): 120 min
Lipanj 2027. (+14.1 mj): 240 min (4 sata)
Studeni 2027. (+18.8 mj): 480 min (8 sati = puni radni dan)

Praktično: u 18 mjeseci frontier AI će autonomno raditi cyber tasks koji oduzimaju expert ljudski radni dan. To prelazi prag gdje AI prestaje biti “alat za experte” i postaje “samostalni akter” u offensive i defensive cyber operacijama.

Koje policy implikacije AISI naglašava?

Institut eksplicitno naglašava da organizacije moraju investirati u strong security baselines odmah jer rapid advancement stvara prilike i rizike za defenders and attackers alike. Konkretne preporuke:

Konzultacija UK National Cyber Security Centre (NCSC) guidance o AI-assisted vulnerability discovery
Implementacija defense-in-depth pristupa koji ne ovisi o “AI ne može to” pretpostavkama
Continuous monitoring frontier AI capability progression za priliku updates

Položaj u širem AI safety diskursu

Najava se uklapa u dramatičnu agentic safety/reliability val 2026.: arXiv FATE (12.5., 33,5 % attack reduction), arXiv History Anchors (13.5., 91-98 % unsafe shift), arXiv Sycophantic Consensus (15.5.), Microsoft Research AI Delegation (15.5., 19-34 % degradation), arXiv GraphFlow (15.5., formal verification approach). UK AISI cyber report dodaje regulator/state-level perspective na isti underlying problem: frontier AI sustavi imaju emerging capability koje trenutni alignment + safety pristupi ne mogu garantirati blokirati.

Anthropic Mythos Preview status (gated research preview od travnja 2026.) je strategijski reflektor — Anthropic je očito identificirao da je defensive cybersecurity application zaslužuje specijalno trade-off između access ograničenja i full open release. UK AISI rezultati daju empirijski temelj toj odluci.

UK AISI: autonomne cyber sposobnosti AI modela udvostručuju se svakih 4,7 mjeseci — Claude Mythos i GPT-5.5 prvi rješavaju cyber ranges

Što su cyber time horizons benchmarci?

Koji frontier modeli su testirani?

Što “dupliranje svakih 4,7 mjeseci” praktično znači?

Koje policy implikacije AISI naglašava?

Položaj u širem AI safety diskursu

Česta pitanja

Izvori

Povezane vijesti