Što su attention operatori u ONNX v1.22.0?

To su native operatori koji direktno opisuju mehanizme pažnje u transformerskim arhitekturama i LLM-ovima, omogućujući hardverskim runtimeovima specijalizirane optimizacije za duge sekvence i streaming primjene.

Kako ONNX v1.22.0 unapređuje sigurnost opskrbnog lanca?

Svaki release sada uključuje SLSA Level 2 kriptografske atestacije o porijeklu koda i ugrađeni Software Bill of Materials koji navodi sve ovisnosti, verzije i licence.

ONNX v1.22.0: Attention Operatori za Generativnu AI

Q: Što donosi WebAssembly podrška u ONNX-u?

ONNX modeli se sada mogu pregledavati i validirati izravno u pregledniku bez lokalne instalacije, zahvaljujući integraciji s Pyodideom.

LF AI & Data Foundation objavila je ONNX v1.22.0 s native attention operatorima za transformerske arhitekture i LLM-ove, WebAssembly podrškom za pregled modela u pregledniku te SLSA Level 2 kriptografskim atestacijama. Doprinijela su 27 suradnika, od kojih 16 po prvi put.

LF AI & Data Foundation objavila je 30. lipnja 2026. ONNX v1.22.0 — novu verziju otvorenog standarda za razmjenu AI modela između okvira i hardverskih runtimeova. Ovo izdanje donosi tri ključne novosti: native podrška za attention operatore, WebAssembly integracija za pregled modela u pregledniku i unaprijeđena sigurnost opskrbnog lanca.

Native attention operatori za moderne LLM-ove

Najvažnija tehnička promjena u ONNX v1.22.0 su native attention operatori — primitivni operatori koji direktno opisuju mehanizme pažnje korištene u transformerskim arhitekturama i LLM-ovima. Dosad su se attention slojevi u ONNX modelima izražavali kao kompozicije nižih operatora — matričnog množenja, softmaxa i reshape operacija — što je hardverskim runtimeovima otežavalo specijalizirane optimizacije.

Novim operatorima hardverski provideri mogu implementirati kernel-e prilagođene attention mehanizmima, direktno poboljšavajući propusnost za duge sekvence i streaming primjene. To je posebno relevantno za LLM-ove s konteksnim prozorima od stotina tisuća tokena, gdje attention izračun dominira ukupnim troškom inferencije.

Zašto je interoperabilnost ključna za generativnu AI?

ONNX postoji kako bi model treniran u jednom okviru mogao raditi u drugome — bez ponovnog treniranja ili ručne konverzije. PyTorch model postaje ONNX zapis, a onda ga mogu izvršavati runtimeovi na CPU-u (Intel OpenVINO), GPU-u (NVIDIA TensorRT), mobilnim čipovima (Qualcomm QNN) ili specijaliziranim akceleratorima — bez izmjena modela.

Do ove verzije attention slojevi nisu imali native reprezentaciju u ONNX-u. To je bio strukturalni jaz između načina na koji se moderni LLM-ovi interno opisuju i načina na koji ih ONNX shema može izraziti. Bez native attention operatora, runtime nije mogao prepoznati obrazac i iskoristiti specijalizirani hardware path — moral je obrađivati attention kao niz generičkih operacija.

ONNX v1.22.0 zatvara taj jaz. Moderne transformerske arhitekture sada su punopravni građani ONNX ekosustava, što znači da okviri poput PyTorcha, TensorFlowa i scikit-learna mogu izražavati LLM-ove u ONNX formatu bez gubitka informacije o ključnim računskim obrascima.

WebAssembly i sigurnost opskrbnog lanca

Verzija 1.22.0 uvodi WebAssembly podršku putem Pyodide integracije. ONNX modeli sada se mogu pregledavati i validirati izravno u pregledniku, bez lokalne instalacije Pythona ili ONNX biblioteke. Alati za inspekciju grafa modela, verifikaciju shape-inferencije i provjeru kompatibilnosti operatora dostupni su svakome s URL-om — bez postavljanja razvojnog okruženja.

Na strani sigurnosti, svaki ONNX release od ove verzije nosi SLSA Level 2 kriptografske atestacije o porijeklu koda — reproducibilan i verificiran dokaz o tome gdje i kako je artifact izgrađen. Uz to, svaki paket sada uključuje ugrađeni SBOM (Software Bill of Materials) koji navodi sve ovisnosti, verzije i licence. Ovo je direktan odgovor na rastuće regulatorne i poslovne zahtjeve za transparentnošću opskrbnih lanaca u open-source AI toolingu.

Modernizirani build sustav osigurava reproducibilne buildove na svim trima platformama: Linux, macOS i Windows. Za timove koji automatiziraju CI/CD pipeline-e s ONNX konverzijama, reproducibilnost buildova znači predvidljive rezultate bez ovisnosti o stanju build okruženja.

Zajednica, ispravci i roadmap

ONNX v1.22.0 objedinio je 27 suradnika, od kojih je 16 doprinosilo po prvi put. Poboljšane su shape-inference pomoćne funkcije i version converter koji okviri koriste pri konverziji modela između ONNX opset verzija. Uz attention operatore, ispravljena je korektnost nekoliko ključnih operatora za širi raspon ulaza, što smanjuje razlike između specifikacije i stvarnog ponašanja pri rubnim slučajevima.

Roadmap za buduće verzije najavljuje podršku za probabilistička i Bayesijanska zaključivanja, proširenu kvantizaciju i daljnje unapređenje shape-inferencije.

ONNX v1.22.0 dostupan je na GitHub repozitoriju github.com/onnx/onnx i putem standardnih paketnih menadžera.

ONNX v1.22.0 donosi native attention operatore za LLM-ove i WebAssembly podršku

Native attention operatori za moderne LLM-ove

Zašto je interoperabilnost ključna za generativnu AI?

WebAssembly i sigurnost opskrbnog lanca

Zajednica, ispravci i roadmap

Česta pitanja

Izvori

Povezane vijesti