ONNX v1.22.0 donosi native attention operatore za LLM-ove i WebAssembly podršku
LF AI & Data Foundation objavila je ONNX v1.22.0 s native attention operatorima za transformerske arhitekture i LLM-ove, WebAssembly podrškom za pregled modela u pregledniku te SLSA Level 2 kriptografskim atestacijama. Doprinijela su 27 suradnika, od kojih 16 po prvi put.
Ovaj članak generiran je uz pomoć umjetne inteligencije na temelju primarnih izvora.
LF AI & Data Foundation objavila je 30. lipnja 2026. ONNX v1.22.0 — novu verziju otvorenog standarda za razmjenu AI modela između okvira i hardverskih runtimeova. Ovo izdanje donosi tri ključne novosti: native podrška za attention operatore, WebAssembly integracija za pregled modela u pregledniku i unaprijeđena sigurnost opskrbnog lanca.
Native attention operatori za moderne LLM-ove
Najvažnija tehnička promjena u ONNX v1.22.0 su native attention operatori — primitivni operatori koji direktno opisuju mehanizme pažnje korištene u transformerskim arhitekturama i LLM-ovima. Dosad su se attention slojevi u ONNX modelima izražavali kao kompozicije nižih operatora — matričnog množenja, softmaxa i reshape operacija — što je hardverskim runtimeovima otežavalo specijalizirane optimizacije.
Novim operatorima hardverski provideri mogu implementirati kernel-e prilagođene attention mehanizmima, direktno poboljšavajući propusnost za duge sekvence i streaming primjene. To je posebno relevantno za LLM-ove s konteksnim prozorima od stotina tisuća tokena, gdje attention izračun dominira ukupnim troškom inferencije.
Zašto je interoperabilnost ključna za generativnu AI?
ONNX postoji kako bi model treniran u jednom okviru mogao raditi u drugome — bez ponovnog treniranja ili ručne konverzije. PyTorch model postaje ONNX zapis, a onda ga mogu izvršavati runtimeovi na CPU-u (Intel OpenVINO), GPU-u (NVIDIA TensorRT), mobilnim čipovima (Qualcomm QNN) ili specijaliziranim akceleratorima — bez izmjena modela.
Do ove verzije attention slojevi nisu imali native reprezentaciju u ONNX-u. To je bio strukturalni jaz između načina na koji se moderni LLM-ovi interno opisuju i načina na koji ih ONNX shema može izraziti. Bez native attention operatora, runtime nije mogao prepoznati obrazac i iskoristiti specijalizirani hardware path — moral je obrađivati attention kao niz generičkih operacija.
ONNX v1.22.0 zatvara taj jaz. Moderne transformerske arhitekture sada su punopravni građani ONNX ekosustava, što znači da okviri poput PyTorcha, TensorFlowa i scikit-learna mogu izražavati LLM-ove u ONNX formatu bez gubitka informacije o ključnim računskim obrascima.
WebAssembly i sigurnost opskrbnog lanca
Verzija 1.22.0 uvodi WebAssembly podršku putem Pyodide integracije. ONNX modeli sada se mogu pregledavati i validirati izravno u pregledniku, bez lokalne instalacije Pythona ili ONNX biblioteke. Alati za inspekciju grafa modela, verifikaciju shape-inferencije i provjeru kompatibilnosti operatora dostupni su svakome s URL-om — bez postavljanja razvojnog okruženja.
Na strani sigurnosti, svaki ONNX release od ove verzije nosi SLSA Level 2 kriptografske atestacije o porijeklu koda — reproducibilan i verificiran dokaz o tome gdje i kako je artifact izgrađen. Uz to, svaki paket sada uključuje ugrađeni SBOM (Software Bill of Materials) koji navodi sve ovisnosti, verzije i licence. Ovo je direktan odgovor na rastuće regulatorne i poslovne zahtjeve za transparentnošću opskrbnih lanaca u open-source AI toolingu.
Modernizirani build sustav osigurava reproducibilne buildove na svim trima platformama: Linux, macOS i Windows. Za timove koji automatiziraju CI/CD pipeline-e s ONNX konverzijama, reproducibilnost buildova znači predvidljive rezultate bez ovisnosti o stanju build okruženja.
Zajednica, ispravci i roadmap
ONNX v1.22.0 objedinio je 27 suradnika, od kojih je 16 doprinosilo po prvi put. Poboljšane su shape-inference pomoćne funkcije i version converter koji okviri koriste pri konverziji modela između ONNX opset verzija. Uz attention operatore, ispravljena je korektnost nekoliko ključnih operatora za širi raspon ulaza, što smanjuje razlike između specifikacije i stvarnog ponašanja pri rubnim slučajevima.
Roadmap za buduće verzije najavljuje podršku za probabilistička i Bayesijanska zaključivanja, proširenu kvantizaciju i daljnje unapređenje shape-inferencije.
ONNX v1.22.0 dostupan je na GitHub repozitoriju github.com/onnx/onnx i putem standardnih paketnih menadžera.
Česta pitanja
- Što su attention operatori u ONNX v1.22.0?
- To su native operatori koji direktno opisuju mehanizme pažnje u transformerskim arhitekturama i LLM-ovima, omogućujući hardverskim runtimeovima specijalizirane optimizacije za duge sekvence i streaming primjene.
- Kako ONNX v1.22.0 unapređuje sigurnost opskrbnog lanca?
- Svaki release sada uključuje SLSA Level 2 kriptografske atestacije o porijeklu koda i ugrađeni Software Bill of Materials koji navodi sve ovisnosti, verzije i licence.
- Što donosi WebAssembly podrška u ONNX-u?
- ONNX modeli se sada mogu pregledavati i validirati izravno u pregledniku bez lokalne instalacije, zahvaljujući integraciji s Pyodideom.
Povezane vijesti
CNCF Kepler prerađen od temelja: precizno mjerenje energije Kubernetes Podova bez privilegija kernela
Miles: PyTorch-nativni open-source okvir za RL post-training LLM-ova frontier razmjera
NVIDIA: Palantir i NVIDIA Nemotron donose suvereni AI američkim agencijama u air-gapped sustavima