🤖 24 AI
🟢 🏥 U praksi nedjelja, 12. travnja 2026. · 2 min čitanja

ArXiv: cijeli Munkresov udžbenik topologije formaliziran u Isabelle/HOL uz pomoć LLM-ova

Zašto je bitno

Tim Bryanta i suradnika koristio je LLM-asistirani pipeline za formalnu verifikaciju cijelog Munkresovog udžbenika 'General Topology' u Isabelle/HOL — preko 85.000 linija verificiranog koda i svih 806 formalnih rezultata.

Rekordna formalizacija matematike

Formalizacija matematike — pisanje dokaza u jeziku koji računalo može mehanički provjeriti — povijesno je bila jedan od najsporijih i najtraumatičnijih zadataka u znanosti. Tim Bryanta i suradnika objavio je 10. travnja na ArXivu rad koji pokazuje da se to drastično mijenja zahvaljujući LLM-ovima.

Što su napravili

Tim je proveo cijeli Munkresov udžbenik “General Topology” kroz automatski LLM-asistirani pipeline koji generira Isabelle/HOL kod za svaku definiciju, lemu i teorem. Konačni rezultat:

  • 85.000+ linija verificiranog Isabelle koda
  • Svih 806 formalnih rezultata iz udžbenika pokriveno
  • Mehanička verifikacija svake tvrdnje — Isabelle proverer eksplicitno prihvaća svaki dokaz

Zašto je to važno

Munkresova “General Topology” je standardni udžbenik na razini diplomskih studija i sadrži netrivijalnu matematiku — Tychonoffov teorem, kompaktnost, separation aksiomi. Ručna formalizacija takvog volumena trajala bi godinama čak i ekipi specijaliziranih formalist-matematičara.

LLM-asistirani pristup mijenja jednadžbu na više načina:

  • Skala — formalizacija postaje pristupačna za stotine udžbenika, ne samo elitne projekte
  • Sigurnost dokaza — svaki rezultat je mehanički provjeren, ne samo “očito” čitatelju
  • Trening podataka — sav generirani kod postaje novi trening korpus za sljedeću generaciju modela

Konkretni alati

Pipeline kombinira LLM (vjerojatno Claude ili GPT-4 razred) za generiranje hipoteza dokaza, Isabelle proverer za verifikaciju, i automatske strategije za popunjavanje rutinskih koraka. Kad LLM ne uspije proizvesti valjan dokaz iz prvog pokušaja, sustav koristi feedback od provera za iterativno prepravljanje.

Rad se uklapa u širi trend “AI for math” gdje se formalna verifikacija konačno počinje skalirati. Sljedeći cilj je vjerojatno cijela serija Springer Graduate Texts in Mathematics.

🤖 Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.