ArXiv: cijeli Munkresov udžbenik topologije formaliziran u Isabelle/HOL uz pomoć LLM-ova

Rekordna formalizacija matematike

Formalizacija matematike — pisanje dokaza u jeziku koji računalo može mehanički provjeriti — povijesno je bila jedan od najsporijih i najtraumatičnijih zadataka u znanosti. Tim Bryanta i suradnika objavio je 10. travnja na ArXivu rad koji pokazuje da se to drastično mijenja zahvaljujući LLM-ovima.

Što su napravili

Tim je proveo cijeli Munkresov udžbenik “General Topology” kroz automatski LLM-asistirani pipeline koji generira Isabelle/HOL kod za svaku definiciju, lemu i teorem. Konačni rezultat:

85.000+ linija verificiranog Isabelle koda
Svih 806 formalnih rezultata iz udžbenika pokriveno
Mehanička verifikacija svake tvrdnje — Isabelle proverer eksplicitno prihvaća svaki dokaz

Zašto je to važno

Munkresova “General Topology” je standardni udžbenik na razini diplomskih studija i sadrži netrivijalnu matematiku — Tychonoffov teorem, kompaktnost, separation aksiomi. Ručna formalizacija takvog volumena trajala bi godinama čak i ekipi specijaliziranih formalist-matematičara.

LLM-asistirani pristup mijenja jednadžbu na više načina:

Skala — formalizacija postaje pristupačna za stotine udžbenika, ne samo elitne projekte
Sigurnost dokaza — svaki rezultat je mehanički provjeren, ne samo “očito” čitatelju
Trening podataka — sav generirani kod postaje novi trening korpus za sljedeću generaciju modela

Konkretni alati

Pipeline kombinira LLM (vjerojatno Claude ili GPT-4 razred) za generiranje hipoteza dokaza, Isabelle proverer za verifikaciju, i automatske strategije za popunjavanje rutinskih koraka. Kad LLM ne uspije proizvesti valjan dokaz iz prvog pokušaja, sustav koristi feedback od provera za iterativno prepravljanje.

Rad se uklapa u širi trend “AI for math” gdje se formalna verifikacija konačno počinje skalirati. Sljedeći cilj je vjerojatno cijela serija Springer Graduate Texts in Mathematics.

ArXiv: cijeli Munkresov udžbenik topologije formaliziran u Isabelle/HOL uz pomoć LLM-ova

Rekordna formalizacija matematike

Što su napravili

Zašto je to važno

Konkretni alati

Izvori

Povezane vijesti