ArXiv: Process Reward Agents — real-time feedback poboljšava AI zaključivanje u medicini bez retraininga
Istraživači su predstavili Process Reward Agents (PRA), novi pristup koji pruža korak-po-korak povratnu informaciju tijekom AI zaključivanja u medicinskim domenama. Sustav radi s postojećim modelima bez potrebe za retrainingom i postiže značajne rezultate na medicinskim benchmarkovima.