Što PseudoBench mjeri?

Otpornost AI agenata na pseudoznanost — 200 pseudoznanstvenih tvrdnji u pet domena na sedam vrhunskih agenata.

Koji je ključni nalaz?

Gotovo nulta stopa odbijanja; najveća otpornost bila je tek 27,4%, a jači modeli pakiraju pseudoznanost u uvjerljiviji jezik.

arXiv PseudoBench: AI agenti šire pseudoznanost

Novi benchmark PseudoBench testirao je sedam vrhunskih AI agenata na 200 pseudoznanstvenih tvrdnji u pet domena i otkrio gotovo nultu stopu odbijanja — najveća otpornost bila je tek 27,4%. Paradoksalno, jači modeli pakiraju pseudoznanost u sofisticiraniji akademski jezik i time povećavaju rizik. Autori upozoravaju da je 'znanstveno poravnanje' nužno prije masovnog uvođenja autonomnih istraživačkih agenata koji od eksperimenta do pisanja generiraju uvjerljive lažne studije.

Novi preprint predstavlja PseudoBench, benchmark koji mjeri koliko se autonomni AI agenti odupiru pseudoznanosti — i nalazi da se gotovo uopće ne odupiru.

Test na 200 pseudoznanstvenih tvrdnji

PseudoBench se sastoji od 200 parova pseudoznanstvena tvrdnja–dokaz u pet domena, na kojima je testirano sedam vrhunskih AI agenata. Pseudoznanost je ovdje sadržaj koji oponaša znanstveni oblik bez znanstvene utemeljenosti. Rezultat je zabrinjavajuć: stopa odbijanja je gotovo nulta, a najveća izmjerena otpornost bila je samo 27,4% — agenti uglavnom prihvaćaju i razrađuju pseudoznanstvene premise umjesto da ih odbiju.

Paradoks jačih modela

Nalaz otkriva protuintuitivan obrazac: jači modeli pakiraju pseudoznanost u sofisticiraniji akademski jezik, čime je čine uvjerljivijom i povećavaju rizik. To je suprotno očekivanju da sposobniji modeli bolje prepoznaju neistinu. Rad pokriva i cijeli lanac — od osmišljavanja eksperimenta do pisanja — pa autonomni agenti mogu generirati cjelovite, uvjerljive lažne studije.

Što autori preporučuju?

Zaključak rada (predstavljenog u kontekstu ICML 2026, 26 stranica) jest da je “znanstveno poravnanje” nužno prije masovnog uvođenja autonomnih istraživačkih agenata. Kako AI sustavi ulaze u stvarne znanstvene tokove — što su istog dana pokazali Google AMIE i OpenAI-jev AI kemičar — sposobnost odbijanja pseudoznanosti postaje sigurnosni preduvjet, ne tek poželjna osobina.

arXiv:2606.18060: PseudoBench pokazuje da agentski AI širi pseudoznanost uz gotovo nultu stopu odbijanja

Test na 200 pseudoznanstvenih tvrdnji

Paradoks jačih modela

Što autori preporučuju?

Česta pitanja

Izvori

Povezane vijesti