ArXiv: cijeli Munkresov udžbenik topologije formaliziran u Isabelle/HOL uz pomoć LLM-ova
Zašto je bitno
Tim Bryanta i suradnika koristio je LLM-asistirani pipeline za formalnu verifikaciju cijelog Munkresovog udžbenika 'General Topology' u Isabelle/HOL — preko 85.000 linija verificiranog koda i svih 806 formalnih rezultata.
Rekordna formalizacija matematike
Formalizacija matematike — pisanje dokaza u jeziku koji računalo može mehanički provjeriti — povijesno je bila jedan od najsporijih i najtraumatičnijih zadataka u znanosti. Tim Bryanta i suradnika objavio je 10. travnja na ArXivu rad koji pokazuje da se to drastično mijenja zahvaljujući LLM-ovima.
Što su napravili
Tim je proveo cijeli Munkresov udžbenik “General Topology” kroz automatski LLM-asistirani pipeline koji generira Isabelle/HOL kod za svaku definiciju, lemu i teorem. Konačni rezultat:
- 85.000+ linija verificiranog Isabelle koda
- Svih 806 formalnih rezultata iz udžbenika pokriveno
- Mehanička verifikacija svake tvrdnje — Isabelle proverer eksplicitno prihvaća svaki dokaz
Zašto je to važno
Munkresova “General Topology” je standardni udžbenik na razini diplomskih studija i sadrži netrivijalnu matematiku — Tychonoffov teorem, kompaktnost, separation aksiomi. Ručna formalizacija takvog volumena trajala bi godinama čak i ekipi specijaliziranih formalist-matematičara.
LLM-asistirani pristup mijenja jednadžbu na više načina:
- Skala — formalizacija postaje pristupačna za stotine udžbenika, ne samo elitne projekte
- Sigurnost dokaza — svaki rezultat je mehanički provjeren, ne samo “očito” čitatelju
- Trening podataka — sav generirani kod postaje novi trening korpus za sljedeću generaciju modela
Konkretni alati
Pipeline kombinira LLM (vjerojatno Claude ili GPT-4 razred) za generiranje hipoteza dokaza, Isabelle proverer za verifikaciju, i automatske strategije za popunjavanje rutinskih koraka. Kad LLM ne uspije proizvesti valjan dokaz iz prvog pokušaja, sustav koristi feedback od provera za iterativno prepravljanje.
Rad se uklapa u širi trend “AI for math” gdje se formalna verifikacija konačno počinje skalirati. Sljedeći cilj je vjerojatno cijela serija Springer Graduate Texts in Mathematics.
Povezane vijesti
AWS: Kako izgraditi reward funkcije s Lambdom za fine-tuning Amazon Nova modela
Google Chrome: AI Skills pretvaraju promptove u alate jednim klikom
Google Research: Vantage — AI platforma koja procjenjuje kritičko mišljenje i kreativnost kroz razgovor s avatarima