arXiv:2606.24510: RaDaR — specijalizirani 32B reasoning LLM ubrzava dijagnozu rijetkih bolesti u RCT-u
RaDaR je open-source reasoning LLM s 32 milijarde parametara treniran za dijagnozu rijetkih bolesti. U randomiziranom kliničkom ispitivanju poboljšao je dijagnostičku točnost liječnika za 21,44 postotna boda naspram internet pretrage, uz sposobnost identificiranja dijagnoze u 61% slučajeva prije kliničke dokumentacije.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
Što je RaDaR i zašto je važan?
RaDaR (Rare Disease Reasoning) specijalizirani je reasoning LLM — model koji ne generira samo tekst nego provodi korak-po-korak medicinsko zaključivanje — razvijen isključivo za dijagnozu rijetkih bolesti, poremećaja koji pogađaju manje od 1 u 2.000 osoba i koji godinama ostaju nedijagnosticirani zbog nedostatka specijaliziranog znanja. S 32 milijarde parametara, model je treniran na 49.170 javno dostupnih kliničkih slučajeva i 104.666 sintetički generiranih slučajeva s reasoning-pojačanim treningom, objavljeno u radu koji je submittan 23. lipnja 2026.
Koliko je točan — i u čemu nadmašuje veće modele?
U randomiziranom kliničkom ispitivanju (RCT) — zlatnom standardu medicinske evaluacije — RaDaR je poboljšao dijagnostičku točnost liječnika za +21,44 postotna boda u usporedbi s grupom koja je koristila samo internet pretragu. U retrospektivnoj analizi identificirao je ispravnu dijagnozu u 61,06% slučajeva prije nego je klinička sumnja uopće dokumentirana, uz prosječni lead time od ~1,87 mjeseci.
Ključan je i izravni benchmark rezultat: RaDaR nadmašuje DeepSeek-R1 s 671 milijardom parametara — model koji je 21 puta veći — što je rijetka demonstracija da uska specijalizacija domene premašuje sirovu skalu.
Zašto je specijalizacija domene odlučujuća?
Generalistički modeli poput DeepSeek-R1 ili GPT-4 klase treniraju na ogromnim, raznolikim korpusima. RaDaR je, nasuprot tome, optimiziran isključivo za rijetke bolesti, koristeći strukturirane narativne slučajeve s reasoning tragovima. Sintetički podaci riješili su temeljni problem: stvarnih kliničkih opisa rijetkih bolesti u literaturi je malo, pa ih je model „sam sebi generirao” kontroliranom sintezom. Rezultat je uski ekspert koji u svojoj niši nadilazi generaliste.
Klinička primjena i ograničenja
Rad je proveden na više validacijskih centara što povećava pouzdanost rezultata. Ipak, lead time od ~1,87 mjeseci i točnost od 61% u retrospektivnim slučajevima znači da model nije infaliblilan — nego alat koji liječniku daje raniji signal. Open-source dostupnost modela otvara mogućnost ugradnje u bolničke sustave bez ovisnosti o komercijalnim API-jima.
Česta pitanja
- Kako je RaDaR treniran s tako malo stvarnih podataka?
- Model je treniran na 49.170 javno dostupnih slučajeva i 104.666 sintetički generiranih slučajeva s reasoning-pojačanim treningom, što nadoknađuje ograničenu dostupnost realnih kliničkih podataka za rijetke bolesti.
- Zašto je usporedba s DeepSeek-R1 (671B) značajna?
- RaDaR s 32B parametara nadmašuje DeepSeek-R1 koji ima 671B parametara — 21× veći model — što dokazuje da specijalizacija domene može prevladati sirovu veličinu modela u medicinskim zadacima.
Izvori
Povezane vijesti
arXiv:2606.24014: RL treniranje na zdravstvenom domenu prenosi usklađenost na 80%+ OOD benchmarka
Google: DiffusionGemma 26B — 4× brža generacija teksta difuzijskim pristupom
Google: Gemini 3.5 Live Translate — prijevod govor-u-govor u 70+ jezika u stvarnom vremenu