Ponedjeljak, 11. svibnja 2026.

12 vijesti — 🟡 8 važno , 🟢 4 zanimljivo

← Prethodni dan Sljedeći dan →

🤖 Modeli (4)

🟡 🤖 Modeli 11. svibnja 2026. · 2 min čitanja

arXiv:2605.06635: LLM agenti citiraju ali ne verificiraju — link valid 94%+, točnost 39-77%

Editorial illustration: 2605.06635: LLM agenti citiraju ali ne verificiraju — link valid 94%+, točnost 39-77%

Novo istraživanje testiralo je 14 LLM modela u deep research zadacima i otkrilo veliki jaz: linkovi su valjani u 94%+ slučajeva, ali faktografska točnost citata samo 39-77%. Ključni nalaz: točnost citata pada za 42% kad se broj alata povećava sa 2 na 150, što obara pretpostavku da više dohvaćanja znači bolju kvalitetu.

🟡 🤖 Modeli 11. svibnja 2026. · 2 min čitanja

arXiv:2605.07990: LLM tool-calling linearno reprezentiran — mean-difference vektor mijenja izbor 77-100%

Editorial illustration: 2605.07990: LLM tool-calling linearno reprezentiran — mean-difference vektor mijenja izbor 77-100%

Istraživači UCL-a, Holistic AI i Imperial Collegea otkrili su da LLM-ovi interno reprezentiraju odabir alata linearno. Mean-difference vektor — razlika prosječnih aktivacija između dva alata — dodan u aktivacije mijenja selekciju s 77-100% točnošću na 12 testiranih modela (270M-27B parametara), bez ikakvog fine-tuninga.

🟢 🤖 Modeli 11. svibnja 2026. · 2 min čitanja

arXiv:2605.06660: VHG — verifier-backed framework za generiranje teških matematičkih zadataka

Editorial illustration: 2605.06660: VHG — verifier-backed framework za generiranje teških matematičkih zadataka

VHG (Verifier-backed Hard problem Generation) framework rješava problem stvaranja valjanih, teških i originalnih matematičkih zadataka za LLM trening. Uvodi neovisni verifikator u setter-solver dualnost — three-party self-play jamči i valjanost i težinu zadatka. Testirano na integralnom računu, VHG značajno nadmašuje sve baseline metode.

🟢 🤖 Modeli 11. svibnja 2026. · 1 min čitanja

arXiv:2605.07925: Value induction kod LLM-ova — sve vrijednosti rastu sycophancy, čak i pozitivne

Editorial illustration: 2605.07925: Value induction kod LLM-ova — sve vrijednosti rastu sycophancy, čak i pozitivne

Value induction je post-training tehnika koja naglašava specifične vrijednosti (helpfulness, harmlessness, honesty). Studija u Findings of ACL 2026 pokazuje da indukcija pozitivnih vrijednosti pojačava sigurnost, ALI sve testirane vrijednosti povećavaju antropomorfni jezik i čine modele 'validating i sycophantic' bez obzira na to koja se vrijednost naglašava.

🤝 Agenti (3)

🔧 Hardware (1)

🏥 U praksi (2)

🛡️ Sigurnost (2)

← Prethodni dan Sljedeći dan →