🟡 ✨ 흥미로운 소식 게시일: · 4 분 읽기 ·

arXiv:2605.22763:AI 에이전트가 Lean 검증으로 9개의 개방 Erdős 문제와 44개의 OEIS 추측 해결

arXiv:2605.22763 ↗

편집 일러스트: 수학 기호와 Lean 타입을 연결한 형식 증명 트리

DeepMind와 MIT CSAIL의 20명 연구자로 구성된 팀이 Lean 정리 증명기에서 LLM의 자율적 형식 증명 생성에 관한 최초의 대규모 평가를 발표했습니다. 에이전트는 LLM 생성과 Lean 기호 검증을 결합하여 353개의 개방 Erdős 문제 중 9개를 자율적으로 해결하고 492개의 OEIS 추측 중 44개를 증명했습니다.

🤖

이 기사는 AI가 1차 출처를 기반으로 생성했습니다.

2026년 5월 21일 공개된 arXiv 프리프린트는 개방 Erdős 문제와 정수열 온라인 백과사전(OEIS)의 추측에 적용된, Lean 정리 증명기에서 LLM의 자율적 형식 수학 증명 생성에 관한 최초의 대규모 평가를 제시합니다. 20명의 연구자로 구성된 팀——DeepMind와 MIT CSAIL 구성원 포함——은 고급 에이전트가 353개의 개방 Erdős 문제 중 9개를 자율적으로 해결하고 492개의 OEIS 추측 중 44개를 증명함을 보여주었습니다.

Lean이란 무엇이고 이 접근법에 왜 핵심적인가?

Lean은 수학적 증명을 유형으로 작성하고 컴파일러가 자동으로 검증하는 프로그래밍 언어인 증명 보조 도구입니다. 동료 검토 과정에서 빠져나올 수 있는 미묘한 오류를 포함할 수 있는 비형식적인 수학 텍스트와 달리——Lean 증명은 컴파일되거나(그러면 수학적으로 올바른 것)또는 되지 않거나(그러면 거부됨)합니다. 검증에서 인간 오류의 여지가 없습니다.

이 특성은 AI 시스템에 핵심적입니다. LLM은 설득력 있어 보이지만 오류를 포함한 수학 텍스트를 생성할 수 있습니다;자동 검증 없이는 인간 수학자가 각 증명을 수동으로 확인해야 하며, 이것이 병목입니다. Lean을 사용하면 시스템이 후보 증명을 생성하고 Lean이 밀리초 안에 검증합니다——컴파일되지 않으면 시스템이 반복하고;컴파일되면 증명은 확실히 올바릅니다.

Erdős 문제 집합이란 무엇이고 왜 중요한가?

Erdős 문제는 Paul Erdős(1913-1996)가 그의 경력에서 제안한 일련의 개방 수학 문제입니다. 이산 수학, 정수론, 조합론, 그래프 이론, 극단 조합론을 다룹니다. 많은 문제에 Erdős가 약속한 현금 상금이 걸려 있습니다(25달러에서 10,000달러). Erdős Problems 서비스 프로젝트는 약 800개의 그러한 문제 목록을 유지하며, 프리프린트 저자들은 Lean에서 표현할 수 있는 353개를 선택했습니다.

353개 문제 중 자율 에이전트는 9개(2.5%)를 해결했습니다——저자들은 이를 구조적 논증이나 충분히 작은 공간의 완전 탐색으로 해결할 수 있는 「하위 계층」Erdős 문제로 분류했습니다. 「하위 계층」이 사소하다는 의미는 아닙니다——문제들은 수십 년 동안 개방되어 있었으나, 에이전트가 보유하지 않은 천재적인 조합적 직관을 필요로 하지 않을 뿐입니다. 이 결과들은 Erdős Problems 관리자와 조율되어 독립적으로 확인되었습니다.

에이전트는 LLM 생성과 Lean 검증을 어떻게 결합합니까?

에이전트는 순환 아키텍처를 가집니다. 1단계:LLM(저자들은 형식 수학 파인 튜닝이 적용된 DeepMind 내부 프런티어 모델 변형을 명시)이 Lean에서의 문제 표현을 읽고 증명 구조에 대한 가설을 생성합니다. 2단계:에이전트가 그 가설을 Lean으로 컴파일합니다——컴파일되면 성공을 반환;되지 않으면 Lean이 특정 오류를 반환합니다(예:「알 수 없는 식별자」, 「유형 불일치」, 「전술 실패」). 3단계:에이전트가 그 오류를 LLM에 피드백하고 반복을 지시합니다. 4단계:5번의 반복이 실패하면 에이전트가 문제를 더 작은 보조 정리로 분해하고 각각 해결을 시도합니다.

저자들은 에이전트가 목적 없이 탐색하지 않았음을 강조합니다——Lean 컴파일러의 피드백이 인간에게는 수개월이 걸릴 방식으로 탐색을 구조화했고, 에이전트는 8×H100 설정에서 몇 시간 안에 수행합니다. 전형적으로 해결된 Erdős 문제는 200-500번의 LLM 호출을 필요로 하고 3-12시간의 실제 시간이 소요됩니다.

OEIS란 무엇이고 그 부분의 결과는?

OEIS(정수열 온라인 백과사전)는 380,000개 이상의 정수열과 그 설명, 공식, 추측을 가진 데이터베이스입니다. OEIS의 많은 추측은 「이 수열은 아마도 공식 F에 의해 생성될 것이나, 아직 증명되지 않았다」로 표현됩니다. 저자들은 492개의 그러한 추측을 선택하고 에이전트에게 각각을 형식적으로 증명하게 했습니다.

에이전트는 44개(8.9%)를 증명했으며, 저자들은 다시 OEIS 관리자와 조율하여 공식 기록에 포함시켰습니다. 증명된 추측의 대부분은 재귀 수열의 닫힌 형식이나 이미 증명된 더 큰 결과에서 나오는 보조 항등식과 관련이 있습니다. 에이전트가 도달하지 못한 추측들은 주로 에이전트가 자율적으로 발견하지 못한 조합적 전단사 또는 구조적 논증을 필요로 합니다.

이것이 수학 연구에 무엇을 의미합니까?

저자들은 AI 에이전트가 수학자를 대체한다고 주장하지 않습니다. 이제 증명 형식화에서 「손쉬운 성과」를 처리할 수 있는 가동 가능한 어시스턴트가 있음을 주장하며——이를 통해 연구자들이 인간의 창의성을 필요로 하는 문제에 집중할 수 있습니다. 다음 단계에는 패턴 인식에 기반한 새로운 추측을 제안할 수 있는 에이전트 개발과, 더 풍부한 참조 프레임을 위한 Lean Mathlib 라이브러리(90,000개 이상의 형식화된 정리)와의 에이전트 통합이 포함됩니다.

자주 묻는 질문

Lean이란 무엇이고 왜 사용합니까?
Lean은 수학적 증명을 유형으로 작성하고 자동으로 검증하는 프로그래밍 언어인 증명 보조 도구입니다. 비형식적인 수학 텍스트와 달리 Lean 증명은 컴파일되거나(올바름)되지 않거나(올바르지 않음)하며, 검증에서 인간 오류의 여지가 없습니다.
Erdős 문제란 무엇입니까?
Erdős 문제는 Paul Erdős가 그의 경력에서 제안한 일련의 개방 수학 문제로, 이산 수학, 정수론, 조합론, 그래프 이론을 다룹니다. 많은 문제가 수십 년 동안 개방되어 있으며 해결에 대한 현금 상금이 걸려 있습니다.
이 결과의 영향 범위는 얼마나 됩니까?
353개의 개방 Erdős 문제 중 9개(2.5%)와 492개의 OEIS 추측 중 44개(8.9%)는 자율 AI 시스템에 있어 중요한 결과이지만, 해당 분야를 완전히 해결하는 것과는 거리가 멀며——대부분의 문제는 에이전트가 보유하지 않은 수학적 직관을 필요로 합니다.