YAN: Mixture-of-Experts Flow Matching erreicht 40-fache Beschleunigung gegenüber autoregressiven Sprachmodellen mit nur 3 Sampling-Schritten
YAN ist ein neues generatives Sprachmodell, das eine Transformer- und Mamba-Architektur mit einem Mixture-of-Experts-Flow-Matching-Ansatz kombiniert — es erreicht mit nur 3 Sampling-Schritten eine mit autoregressiven Modellen vergleichbare Qualität, was eine 40-fache Beschleunigung gegenüber AR-Baselines und bis zu 1000-fach gegenüber Diffusions-Sprachmodellen ergibt. Das Modell zerlegt globale Transportgeometrien in lokal spezialisierte Vektorfelder.