arXiv:2605.22763: KI-Agent mit Lean-Verifikation löst 9 offene Erdős-Probleme und 44 OEIS-Vermutungen
Ein 20-köpfiges Forscherteam von DeepMind und MIT CSAIL veröffentlichte die erste groß angelegte Evaluation von LLMs zur autonomen Generierung formaler Beweise im Lean-Theorem-Prover. Der Agent kombiniert LLM-Generierung mit Lean-Verifikation und löst autonom 9 von 353 offenen Erdős-Problemen sowie 44 von 492 OEIS-Vermutungen.