RaDaR: LLM ubrzava dijagnozu rijetkih bolesti

RaDaR je open-source reasoning LLM s 32 milijarde parametara treniran za dijagnozu rijetkih bolesti. U randomiziranom kliničkom ispitivanju poboljšao je dijagnostičku točnost liječnika za 21,44 postotna boda naspram internet pretrage, uz sposobnost identificiranja dijagnoze u 61% slučajeva prije kliničke dokumentacije.

Što je RaDaR i zašto je važan?

RaDaR (Rare Disease Reasoning) specijalizirani je reasoning LLM — model koji ne generira samo tekst nego provodi korak-po-korak medicinsko zaključivanje — razvijen isključivo za dijagnozu rijetkih bolesti, poremećaja koji pogađaju manje od 1 u 2.000 osoba i koji godinama ostaju nedijagnosticirani zbog nedostatka specijaliziranog znanja. S 32 milijarde parametara, model je treniran na 49.170 javno dostupnih kliničkih slučajeva i 104.666 sintetički generiranih slučajeva s reasoning-pojačanim treningom, objavljeno u radu koji je submittan 23. lipnja 2026.

Koliko je točan — i u čemu nadmašuje veće modele?

U randomiziranom kliničkom ispitivanju (RCT) — zlatnom standardu medicinske evaluacije — RaDaR je poboljšao dijagnostičku točnost liječnika za +21,44 postotna boda u usporedbi s grupom koja je koristila samo internet pretragu. U retrospektivnoj analizi identificirao je ispravnu dijagnozu u 61,06% slučajeva prije nego je klinička sumnja uopće dokumentirana, uz prosječni lead time od ~1,87 mjeseci.

Ključan je i izravni benchmark rezultat: RaDaR nadmašuje DeepSeek-R1 s 671 milijardom parametara — model koji je 21 puta veći — što je rijetka demonstracija da uska specijalizacija domene premašuje sirovu skalu.

Zašto je specijalizacija domene odlučujuća?

Generalistički modeli poput DeepSeek-R1 ili GPT-4 klase treniraju na ogromnim, raznolikim korpusima. RaDaR je, nasuprot tome, optimiziran isključivo za rijetke bolesti, koristeći strukturirane narativne slučajeve s reasoning tragovima. Sintetički podaci riješili su temeljni problem: stvarnih kliničkih opisa rijetkih bolesti u literaturi je malo, pa ih je model „sam sebi generirao” kontroliranom sintezom. Rezultat je uski ekspert koji u svojoj niši nadilazi generaliste.

Klinička primjena i ograničenja

Rad je proveden na više validacijskih centara što povećava pouzdanost rezultata. Ipak, lead time od ~1,87 mjeseci i točnost od 61% u retrospektivnim slučajevima znači da model nije infaliblilan — nego alat koji liječniku daje raniji signal. Open-source dostupnost modela otvara mogućnost ugradnje u bolničke sustave bez ovisnosti o komercijalnim API-jima.

Česta pitanja

Kako je RaDaR treniran s tako malo stvarnih podataka?

Model je treniran na 49.170 javno dostupnih slučajeva i 104.666 sintetički generiranih slučajeva s reasoning-pojačanim treningom, što nadoknađuje ograničenu dostupnost realnih kliničkih podataka za rijetke bolesti.

Zašto je usporedba s DeepSeek-R1 (671B) značajna?

RaDaR s 32B parametara nadmašuje DeepSeek-R1 koji ima 671B parametara — 21× veći model — što dokazuje da specijalizacija domene može prevladati sirovu veličinu modela u medicinskim zadacima.

arXiv:2606.24510: RaDaR — specijalizirani 32B reasoning LLM ubrzava dijagnozu rijetkih bolesti u RCT-u

Što je RaDaR i zašto je važan?

Koliko je točan — i u čemu nadmašuje veće modele?

Zašto je specijalizacija domene odlučujuća?

Klinička primjena i ograničenja

Česta pitanja

Izvori

Povezane vijesti