LLM 트리 서치, 2025~26 시즌 실시간 검증에서 CDC 질병 예측 능가

arXiv:2605.16238은 LLM과 트리 서치 알고리즘을 결합한 자율 시스템을 통한 계절성 전염병 예측을 발표합니다. 2025~26 시즌의 실시간 평가에서 시스템은 인플루엔자·COVID-19·RSV 모델을 자율적으로 구축해 CDC의 황금 표준인 전문가 큐레이션 앙상블 모델을 지속적으로 달성하거나 능가했습니다.

전문가 없이 전염병을 예측하는 시스템

매사추세츠 대학교 연구자들이 호흡기 전염병의 자율 예측 시스템을 기술한 논문을 발표했습니다. 통계 모델을 수동으로 조정하는 대신, 시스템은 LLM 유도 트리 서치를 사용합니다. 대형 언어 모델이 예측 코드를 반복적으로 생성·테스트·최적화하며, 이는 컴퓨터가 체스의 가능한 수를 탐색하는 것과 유사한 접근 방식입니다.

트리 서치는 분기와 가지치기를 통해 가능한 해의 공간을 체계적으로 탐색합니다. 앙상블 예측은 여러 모델을 결합해 그 평균 결과가 각각의 개별 모델을 능가하도록 합니다――이것이 전문가들이 수동으로 큐레이션하는 CDC 황금 표준 시스템의 작동 원리이기도 합니다.

실시간 결과: 인플루엔자, COVID-19, RSV

이 연구가 실험실 벤치마크 연구와 다른 핵심 차이점은 전향적 평가에 있습니다. 시스템은 미국의 2025~26 호흡기 시즌 전체에 걸쳐 실시간으로 작동했습니다. 인플루엔자·COVID-19·RSV(호흡기 세포융합 바이러스) 세 가지 병원체의 모델을 자율적으로 구축했으며, 모든 경우에서 CDC 허브 앙상블을 지속적으로 달성하거나 능가했습니다.

RSV에서의 성공은 특히 중요합니다. 그 체계적인 감시가 비교적 새로워 이용 가능한 데이터가 부족하기 때문입니다. 소급적 절제 분석(ablation analysis)에서 로그 스케일 지표의 최적화가 보상 해킹――모델이 실제로 예측을 학습하지 않고 최적화 신호를 ‘속이는’ 상황――을 방지한다는 것이 밝혀졌습니다.

공중 보건에 대한 의미

예측 모델의 수동 구축은 새로운 병원체에 대한 대응을 늦추는 병목입니다. 이 연구는 LLM 에이전트가 전문가 팀 수준으로 그 작업을 자동화할 수 있음을 보여줍니다――더 빠르고 확장 가능하게. 이 접근 방식이 여러 시즌에 걸쳐 검증된다면, 의료 시스템이 전염병 대비를 계획하는 방식을 바꿀 수 있습니다.

자주 묻는 질문

이 시스템은 어떻게 전염병을 예측합니까?

LLM이 트리 서치 알고리즘에 의해 유도되면서 질병 예측을 위한 실행 가능한 코드를 반복적으로 생성·평가·최적화합니다. 체스의 수 탐색과 유사한 방식으로, 자동 심판이 나쁜 해를 제거하고 로그 스케일 지표가 보상 해킹을 방지합니다.

CDC와 비교해 얼마나 향상되었습니까?

기계 생성 앙상블 모델은 2025~26 호흡기 시즌 전체에 걸친 인플루엔자·COVID-19·RSV의 전향적 실시간 평가에서 전문가가 수동으로 큐레이션하는 황금 표준 CDC 허브 앙상블을 지속적으로 달성하거나 능가했습니다.

RSV란 무엇이며 예측이 특히 어려운 이유는 무엇입니까?

RSV(호흡기 세포융합 바이러스)는 영유아와 고령자에게 특히 영향을 미치는 호흡기 병원체입니다. 체계적인 감시 역사가 짧아 이용 가능한 데이터가 적어 인플루엔자보다 예측이 어렵습니다. 이 시스템은 『데이터 부족』 시나리오도 성공적으로 극복했습니다.

arXiv:2605.16238: LLM 유도 트리 서치가 질병 유행 예측에서 CDC를 능가하다

전문가 없이 전염병을 예측하는 시스템

실시간 결과: 인플루엔자, COVID-19, RSV

공중 보건에 대한 의미

자주 묻는 질문

출처

관련 뉴스