LLM-Baumsuche schlägt CDC bei Epidemieprognosen

arXiv:2605.16238 stellt ein autonomes System vor, das LLMs und Tree-Search-Algorithmen zur Vorhersage saisonaler Epidemien kombiniert. In Echtzeit erstellte es durch die Saison 2025–26 Modelle für Influenza, COVID-19 und RSV, die das Gold-Standard-Ensemble des CDC durchgehend erreichten oder übertrafen.

Eine Maschine, die Epidemien vorhersagt — ohne Experten in der Schleife

Forscher der University of Massachusetts veröffentlichten eine Arbeit, die ein autonomes System zur Vorhersage von Atemwegsepidemien beschreibt. Statt statistischer Modelle manuell anzupassen, nutzt das System LLM-geführte Baumsuche — ein großes Sprachmodell generiert, testet und optimiert iterativ ausführbaren Prognosecode, ähnlich wie ein Computer einen Zielbaum im Schach durchsucht.

Tree Search (Baumsuche) erkundet systematisch den Raum möglicher Lösungen durch Verzweigung und Beschneidung schlechter Äste. Ensemble-Forecasting kombiniert mehrere Modelle, deren gemitteltes Ergebnis jedes einzelne Modell übertrifft — genau so funktioniert auch das vom CDC-Goldstandard, das von Experten manuell gepflegt wird.

Echtzeitergebnisse: Influenza, COVID-19, RSV

Der entscheidende Unterschied dieser Arbeit zu Labor-Benchmark-Studien ist die prospektive Evaluierung — das System arbeitete in Echtzeit durch die gesamte Atemsaison 2025–26 in den USA. Es erstellte eigenständig Modelle für drei Krankheitserreger: Influenza, COVID-19 und RSV (Respiratorisches Syncytialvirus). In allen Fällen erreichte oder übertraf es durchgehend das CDC-Hub-Ensemble.

Besonders bedeutsam ist der Erfolg bei RSV, wo verfügbare Daten spärlich sind, da die systematische Überwachung dieser Krankheit relativ neu ist. Retrospektive Ablationsanalysen zeigten, dass die Optimierung von Log-Scale-Metriken Reward-Hacking verhindert — eine Situation, in der das Modell das Optimierungssignal „betrügt”, anstatt wirklich vorherzusagen zu lernen.

Was bedeutet das für die öffentliche Gesundheit?

Die manuelle Erstellung von Prognosemodellen ist ein Engpass, der die Reaktion auf neue Krankheitserreger verlangsamt. Diese Arbeit zeigt, dass LLM-Agenten diese Arbeit auf dem Niveau eines Expertenteams automatisieren können — schneller und skalierbarer. Wenn der Ansatz über mehrere Saisons bestätigt wird, könnte er die Art und Weise verändern, wie Gesundheitssysteme die Epidemiebereitschaft planen.

Häufig gestellte Fragen

Wie sagt das System eine Epidemie voraus?

Ein LLM generiert, bewertet und optimiert iterativ ausführbaren Code für Krankheitsprognosen, geleitet von einem Tree-Search-Algorithmus — ähnlich wie ein Computer einen Baum möglicher Züge im Schach durchsucht — mit einem automatischen Richter, der schlechte Lösungen verwirft, und Log-Scale-Metriken, die Reward-Hacking verhindern.

Wie groß ist der Vorsprung gegenüber dem CDC?

Das maschinell generierte Ensemble erreichte oder übertraf durchgehend das CDC-Hub-Ensemble — den von Experten manuell gepflegten Goldstandard — in einer prospektiven Echtzeitevaluierung durch die gesamte Atemsaison 2025–26 für Influenza, COVID-19 und RSV.

Was ist RSV und warum ist es besonders schwer vorherzusagen?

RSV (Respiratorisches Syncytialvirus) ist ein Atemwegserreger, der besonders Säuglinge und ältere Menschen betrifft. Die Prognose ist schwieriger als bei Influenza, da weniger historische Daten vorliegen — das System meisterte auch dieses datenärmere Szenario.

arXiv:2605.16238: LLM-geführte Baumsuche übertrifft CDC bei Epidemieprognosen

Eine Maschine, die Epidemien vorhersagt — ohne Experten in der Schleife

Echtzeitergebnisse: Influenza, COVID-19, RSV

Was bedeutet das für die öffentliche Gesundheit?

Häufig gestellte Fragen

Quellen

Verwandte Nachrichten