YAN:Mixture-of-Experts 플로우 매칭이 3번의 샘플링 단계로 자기회귀 언어 모델 대비 40배 속도 향상 달성
YAN은 Transformer와 Mamba 아키텍처를 Mixture-of-Experts 플로우 매칭 접근법과 결합한 새로운 생성 언어 모델입니다. 3번의 샘플링 단계만으로 자기회귀 모델과 비교 가능한 품질을 달성하며, AR 기준선 대비 40배, 확산 언어 모델 대비 최대 1000배의 속도 향상을 제공합니다. 전역 전송 기하학을 지역 특화 벡터 필드로 분해합니다.