YAN: Mixture-of-Experts Flow Matching postiže 40× ubrzanje nad autoregresivnim LM-ovima uz samo 3 sampling koraka
YAN je novi generativni jezični model koji kombinira Transformer i Mamba arhitekturu s Mixture-of-Experts Flow Matching pristupom — postiže kvalitetu usporedivu s autoregresivnim modelima uz 3 sampling koraka, što daje 40× ubrzanje nad AR baznim linijama i do 1000× ubrzanje nad difuzijskim jezičnim modelima. Model dekomponira globalne transportne geometrije u lokalno specijalizirana vektorska polja.