ArXiv: cijeli Munkresov udžbenik topologije formaliziran u Isabelle/HOL uz pomoć LLM-ova
Zašto je bitno
Tim Bryanta i suradnika koristio je LLM-asistirani pipeline za formalnu verifikaciju cijelog Munkresovog udžbenika 'General Topology' u Isabelle/HOL — preko 85.000 linija verificiranog koda i svih 806 formalnih rezultata.
Rekordna formalizacija matematike
Formalizacija matematike — pisanje dokaza u jeziku koji računalo može mehanički provjeriti — povijesno je bila jedan od najsporijih i najtraumatičnijih zadataka u znanosti. Tim Bryanta i suradnika objavio je 10. travnja na ArXivu rad koji pokazuje da se to drastično mijenja zahvaljujući LLM-ovima.
Što su napravili
Tim je proveo cijeli Munkresov udžbenik “General Topology” kroz automatski LLM-asistirani pipeline koji generira Isabelle/HOL kod za svaku definiciju, lemu i teorem. Konačni rezultat:
- 85.000+ linija verificiranog Isabelle koda
- Svih 806 formalnih rezultata iz udžbenika pokriveno
- Mehanička verifikacija svake tvrdnje — Isabelle proverer eksplicitno prihvaća svaki dokaz
Zašto je to važno
Munkresova “General Topology” je standardni udžbenik na razini diplomskih studija i sadrži netrivijalnu matematiku — Tychonoffov teorem, kompaktnost, separation aksiomi. Ručna formalizacija takvog volumena trajala bi godinama čak i ekipi specijaliziranih formalist-matematičara.
LLM-asistirani pristup mijenja jednadžbu na više načina:
- Skala — formalizacija postaje pristupačna za stotine udžbenika, ne samo elitne projekte
- Sigurnost dokaza — svaki rezultat je mehanički provjeren, ne samo “očito” čitatelju
- Trening podataka — sav generirani kod postaje novi trening korpus za sljedeću generaciju modela
Konkretni alati
Pipeline kombinira LLM (vjerojatno Claude ili GPT-4 razred) za generiranje hipoteza dokaza, Isabelle proverer za verifikaciju, i automatske strategije za popunjavanje rutinskih koraka. Kad LLM ne uspije proizvesti valjan dokaz iz prvog pokušaja, sustav koristi feedback od provera za iterativno prepravljanje.
Rad se uklapa u širi trend “AI for math” gdje se formalna verifikacija konačno počinje skalirati. Sljedeći cilj je vjerojatno cijela serija Springer Graduate Texts in Mathematics.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
Povezane vijesti
GitHub Copilot prelazi na usage-based naplatu od 1. lipnja: krediti zamjenjuju premium request jedinice, Pro plan dobiva $10 mjesečnih AI Credits
IBM Bob: agentic AI dev partner za cijeli SDLC, već 80.000+ IBM zaposlenika koristi i bilježi +45% produktivnosti
OpenAI i Microsoft objavili izmijenjeni ugovor: nova faza partnerstva s dugoročnom jasnoćom i pojednostavljenom strukturom