🟡 🏥 U praksi utorak, 5. svibnja 2026. · 2 min čitanja ·

arXiv:2605.02740: ReClaim — foundation model na 200 milijuna pacijentskih zapisa postiže mean AUC 75,6 % na 1000+ medicinskih zadataka

arXiv:2605.02740 ↗

Editorial illustration: developer workspace s monitorima koji prikazuju kod, stetoskop i medicinski grafikoni

Novi arXiv preprint predstavlja ReClaim — foundation model s 1,7 milijardi parametara treniran na 43,8 milijardi medicinskih događaja iz 200 milijuna pacijentskih zapisa. Na više od 1000 dijagnostičkih zadataka postiže mean AUC od 75,6 %, značajno nadmašujući LightGBM (66,3 %) i Delphi specijalizirani model (69,4 %). Otvara novu klasu foundation modela treniranih na administrativnim zdravstvenim podacima.

🤖

Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.

ArXiv je 5. svibnja 2026. (preprint ID 2605.02740) objavio rad koji predstavlja ReClaim — foundation model s 1,7 milijardi parametara treniran isključivo na administrativnim medicinskim claims podacima. Rezultati ukazuju da pristup foundation modelima može isporučiti generalizabilne medicinske AI sustave bez ovisnosti o slikovnim ili kliničkim podacima koji su tipični za radiology/imaging FM-ove.

Što je u dataset-u i kako je model treniran?

Trening dataset obuhvaća 43,8 milijardi medicinskih događaja iz 200 milijuna pacijentskih zapisa. To su strukturirani administrativni podaci — ICD dijagnoze, CPT procedure, lijekovi po NDC kodovima, troškovi i datumi — koje zdravstvene osiguranja i bolnički sustavi rutinski generiraju kao dio svakodnevnog billing workflowa. Za razliku od medical imaging FM-ova (koji zahtijevaju curated radiology arhive) ili kliničkih notesa (koji su nestrukturirani i privacy-osjetljivi), claims podaci postoje u standardiziranim formatima u praktički svakoj zdravstvenoj instituciji u SAD-u.

Autori pristupaju modeliranju kao sequence learning task: pacijent je sekvenca medicinskih događaja s timestampovima, a model uči predvidjeti sljedeći događaj. To omogućuje single-model evaluaciju kroz tisuće različitih downstream zadataka bez task-specific fine-tuninga.

Koliko ReClaim nadmašuje postojeće baseline-e?

Na 1000+ dijagnostičkih zadataka ReClaim postiže mean AUC 75,6 %. Comparison baseline-i:

  • LightGBM (klasični ML benchmark): 66,3 %
  • Delphi (specijalizirani medicinski model): 69,4 %

Razlika od 6-9 postotnih bodova je značajna jer je mjerena kroz tisuće različitih dijagnoza. Klasični single-task ML modeli (LightGBM) nemaju kapacitet share-anja reprezentacija kroz različite dijagnoze, dok Delphi — iako medicinski specijaliziran — nije training-data scale-ana niti ne koristi foundation model paradigm.

Zašto je ovo važno za zdravstvenu AI praksu?

Ako se rezultati replicaraju u kliničkim deploymentima, ReClaim klasa modela može preokrenuti standardni patern razvoja medical AI: umjesto da svaka bolnica/osiguranje trenira specijalizirane single-disease modele, mogla bi se koristiti foundation model osnova s task-specific lakim fine-tuningom. Praktične implikacije: clinical decision support, risk stratifikacija, fraud detection u osiguranjima, i utilization management — sve domene gdje je dostupna velika količina claims podataka, ali bi izgradnja per-task modela bila prohibitivno skupa.

Otvorena pitanja za follow-up rad: privacy considerations (HIPAA compliance scenariji), cross-institucional generalizacija (radi li model treniran na US Medicare claims podacima na EU sustavima sa SNOMED-CT/ICD-10 podacima), i kalibracija predikcija po race/ethnicity stratama — kritično pitanje koje administrative bias literatura već dugo dokumentira.

Česta pitanja

Koliko podataka koristi ReClaim za trening?
ReClaim je treniran na 43,8 milijardi medicinskih događaja iz 200 milijuna pacijentskih zapisa. To su strukturirani administrativni podaci — dijagnoze, procedure, lijekovi, troškovi — koje osiguranja i bolnice rutinski generiraju u svom svakodnevnom radu.
Zašto je AUC 75,6 % značajan rezultat?
ReClaim na 1000+ dijagnostičkih zadataka postiže mean AUC 75,6 %, dok LightGBM kao klasični ML baseline postiže 66,3 %, a Delphi specijalizirani medicinski model 69,4 %. Razlika od 6-9 postotnih bodova kroz tisuće različitih dijagnoza je pokazatelj robusne generalizacije koja je tipična za foundation model pristup.