arXiv: KI-Agent löst 9 Erdős-Probleme

Ein 20-köpfiges Forscherteam von DeepMind und MIT CSAIL veröffentlichte die erste groß angelegte Evaluation von LLMs zur autonomen Generierung formaler Beweise im Lean-Theorem-Prover. Der Agent kombiniert LLM-Generierung mit Lean-Verifikation und löst autonom 9 von 353 offenen Erdős-Problemen sowie 44 von 492 OEIS-Vermutungen.

Ein arXiv-Preprint vom 21. Mai 2026 präsentiert die erste groß angelegte Evaluation von LLMs zur autonomen Generierung formaler mathematischer Beweise im Lean-Theorem-Prover, angewandt auf offene Erdős-Probleme und Vermutungen aus der Online Encyclopedia of Integer Sequences (OEIS). Ein 20-köpfiges Forscherteam — mit Mitgliedern von DeepMind und MIT CSAIL — zeigte, dass ein fortgeschrittener Agent autonom 9 von 353 offenen Erdős-Problemen löst und 44 von 492 OEIS-Vermutungen beweist.

Was ist Lean und warum ist es zentral?

Lean ist ein Proof-Assistant, eine Programmiersprache, in der mathematische Beweise als Typen geschrieben werden, die der Compiler automatisch verifiziert. Im Gegensatz zu informellem mathematischen Text enthält ein Lean-Beweis keine subtilen Fehler, die Peer-Review entgehen — er kompiliert (korrekt) oder nicht (abgelehnt). Diese Eigenschaft ist für ein KI-System entscheidend: LLMs können überzeugend wirkenden, aber fehlerhaften Mathematiktext generieren; mit Lean verifiziert das System Kandidaten-Beweise in Millisekunden.

Was ist der Erdős-Problemsatz?

Erdős-Probleme sind offene mathematische Fragen, die Paul Erdős (1913–1996) formulierte. Sie umfassen diskrete Mathematik, Zahlentheorie, Kombinatorik, Graphentheorie und extremale Kombinatorik. Viele tragen Erdős-Geldpreise (25–10.000 USD) für Lösungen. Das Erdős-Problems-Projekt pflegt eine Liste von ca. 800 solcher Probleme; die Autoren wählten 353 aus, die sich in Lean formulieren ließen.

Von 353 Problemen löst der autonome Agent 9 (2,5 %) — klassifiziert als „Lower-tier”-Erdős-Probleme, die strukturellen Argumenten oder erschöpfender Suche in hinreichend kleinen Räumen zugänglich sind. „Lower-tier” bedeutet nicht trivial — die Probleme waren jahrzehntelang offen, erforderten aber keine geniale kombinatorische Intuition. Die Ergebnisse wurden mit den Erdős-Problems-Administratoren koordiniert.

Wie kombiniert der Agent LLM-Generierung und Lean-Verifikation?

Der Agent hat eine zyklische Architektur. Schritt 1: Das LLM liest die Lean-Problemformulierung und generiert eine Hypothese zur Beweisstruktur. Schritt 2: Der Agent kompiliert die Hypothese — bei Erfolg: fertig; bei Fehler: Lean gibt eine spezifische Fehlermeldung zurück. Schritt 3: Der Agent leitet den Fehler ans LLM zurück mit Anweisung zu iterieren. Schritt 4: Nach 5 Fehlversuchen zerlegt der Agent das Problem in kleinere Lemmata.

Ein typisch gelöstes Erdős-Problem erforderte 200–500 LLM-Aufrufe und 3–12 Stunden Wall-Clock-Zeit auf einem 8×H100-Setup.

Was ist OEIS und welche Ergebnisse wurden dort erzielt?

OEIS (Online Encyclopedia of Integer Sequences) ist eine Datenbank mit über 380.000 ganzzahligen Folgen mit Beschreibungen, Formeln und Vermutungen. Die Autoren wählten 492 Vermutungen aus und ließen den Agenten jeden formal beweisen. Der Agent bewies 44 (8,9 %), koordiniert mit OEIS-Maintainern zur Aufnahme in die offiziellen Einträge.

Was bedeutet das für die mathematische Forschung?

Die Autoren behaupten nicht, dass der KI-Agent Mathematiker ersetzt. Sie sehen einen operativen Assistenten, der die „niedrig hängenden Früchte” der Beweis-Formalisierung abarbeiten kann, und Forscher befreit, sich auf Probleme zu konzentrieren, die menschliche Kreativität erfordern. Nächste Schritte: Agenten, die neue Vermutungen aus Pattern-Recognition vorschlagen, und Integration mit der Lean-Mathlib-Datenbank (90.000+ formalisierte Theoreme).

Häufig gestellte Fragen

Was ist Lean und warum wird es verwendet?

Lean ist ein Proof-Assistant — eine Programmiersprache, in der mathematische Beweise als Typen geschrieben und automatisch verifiziert werden. Im Gegensatz zu informellem mathematischen Text kompiliert ein Lean-Beweis entweder (korrekt) oder nicht (falsch) — kein Raum für menschliche Fehler bei der Verifikation.

Was ist ein Erdős-Problem?

Erdős-Probleme sind offene mathematische Fragen, die Paul Erdős in seiner Karriere formulierte, aus diskreter Mathematik, Zahlentheorie, Kombinatorik und Graphentheorie. Viele sind seit Jahrzehnten offen und mit Geldpreisen für Lösungen versehen.

Wie groß ist die Reichweite dieses Ergebnisses?

9 von 353 offenen Erdős-Problemen (2,5 %) und 44 von 492 OEIS-Vermutungen (8,9 %) ist ein bedeutendes Ergebnis für ein autonomes KI-System, aber weit davon entfernt, die Domäne vollständig zu lösen — die meisten Probleme bleiben offen.

arXiv:2605.22763: KI-Agent mit Lean-Verifikation löst 9 offene Erdős-Probleme und 44 OEIS-Vermutungen