arXiv:2605.22763:AI 에이전트가 Lean 검증으로 9개의 개방 Erdős 문제와 44개의 OEIS 추측 해결
DeepMind와 MIT CSAIL의 20명 연구자로 구성된 팀이 Lean 정리 증명기에서 LLM의 자율적 형식 증명 생성에 관한 최초의 대규모 평가를 발표했습니다. 에이전트는 LLM 생성과 Lean 기호 검증을 결합하여 353개의 개방 Erdős 문제 중 9개를 자율적으로 해결하고 492개의 OEIS 추측 중 44개를 증명했습니다.