LeanGuard: brza AI moderacija bez CoT

LeanGuard je 395M-parametarski enkoder koji postiže F1 82,90 na benchmarcima moderacije sadržaja koristeći ~100× manje računalne snage od reasoning-based rješenja, dokazujući da chain-of-thought nije potreban za robusnu zaštitu AI sustava.

Što je moderacija sadržaja i zašto je važna?

Moderacija sadržaja — automatsko prepoznavanje i blokiranje štetnih, nezakonitih ili neprimjerenih izlaza AI modela — postala je ključna komponenta svakog ozbiljnog AI sustava. Trenutni pristupi sve češće koriste chain-of-thought (CoT) rasuđivanje: model „razmišlja naglas” kroz više koraka kako bi odlučio je li neki sadržaj prihvatljiv. No novi rad istraživača Dongbina Nae dovodi u pitanje je li takva kompleksnost uopće potrebna.

Može li lagani enkoder zamijeniti teške reasonere?

Da — i to s drastično nižim troškovima. LeanGuard je 395M-parametarski bidirekcijski enkoder koji analizira tekst u jednom jedinom forward passu ograničenom na 512 tokena, bez ikakve CoT procedure. Na javnim benchmarcima moderacije postiže prosječni F1 od 82,90 ± 0,26, što je rezultat usporediv s puno težim decoder-based reasoning guardovima. Ključna razlika: LeanGuard troši ~100× manje računalne snage od competing rješenja koja oslanjaju na višekoračno rasuđivanje.

Robusnost i prednosti u praksi

Uz računalnu učinkovitost, model pokazuje i bolji recall pri strogim stopama lažnih pozitiva — što znači manje propuštenih štetnih sadržaja kada je prag detekcije visok. LeanGuard je također robusniji na šum u oznakama treniranja, što je čest problem u stvarnim moderacijskim setovima podataka gdje ljudski anotatori često ne slažu. Arhitektura s jednim prolazom čini model pogodnim za on-device deployment na pametnim telefonima i rubnim uređajima bez potrebe za oblačnom infrastrukturom.

CoT ne poboljšava moderaciju

Možda najznačajniji zaključak rada: chain-of-thought rasuđivanje ne poboljšava točnost moderacije sadržaja. To je direktan izazov pretpostavci da „teže = bolje” u sigurnosnim guardrailovima. Ako F1 ostaje jednak bez obzira koristi li model CoT ili ne, tada je jedini učinak CoT-a veći trošak i veća latencija — što za moderaciju u realnom vremenu nije prihvatljivo. Rad je objavljen 25. lipnja 2026.

Česta pitanja

Zašto chain-of-thought nije potreban za moderaciju sadržaja?

Istraživanje pokazuje da CoT ne poboljšava točnost detekcije štetnog sadržaja, a ujedno donosi ~100× veći računalni trošak — LeanGuard postiže isti F1 s jednim prolazom kroz bidirekcijski enkoder.

Može li se LeanGuard koristiti na mobilnim uređajima?

Da — 395M parametara i arhitektura s jednim forward passom čine model pogodnim za on-device deployment na resursno ograničenim uređajima poput pametnih telefona.

arXiv:2606.26686: LeanGuard — brza moderacija sadržaja bez chain-of-thought dostiže teške reasonere

Što je moderacija sadržaja i zašto je važna?

Može li lagani enkoder zamijeniti teške reasonere?

Robusnost i prednosti u praksi

CoT ne poboljšava moderaciju

Česta pitanja

Izvori

Povezane vijesti