arXiv:2605.06635: LLM agenti citiraju ali ne verificiraju — link valid 94%+, točnost 39-77%
Novo istraživanje testiralo je 14 LLM modela u deep research zadacima i otkrilo veliki jaz: linkovi su valjani u 94%+ slučajeva, ali faktografska točnost citata samo 39-77%. Ključni nalaz: točnost citata pada za 42% kad se broj alata povećava sa 2 na 150, što obara pretpostavku da više dohvaćanja znači bolju kvalitetu.