🟢 📦 오픈소스 게시일: · 3 분 읽기 ·

ONNX v1.22.0, LLM용 네이티브 어텐션 연산자와 WebAssembly 지원 도입

에디토리얼 일러스트레이션: ONNX 버전 1.22가 새로운 어텐션 연산자와 WebAssembly 상호운용성을 도입

LF AI & Data Foundation이 트랜스포머 아키텍처 및 LLM을 위한 네이티브 어텐션 연산자, 브라우저에서 모델 검사를 위한 WebAssembly 지원 및 SLSA Level 2 암호화 증명과 함께 ONNX v1.22.0을 발표했습니다. 27명의 기여자가 기여했으며 그 중 16명은 처음으로 참여합니다.

🤖

이 기사는 AI가 1차 출처를 기반으로 생성했습니다.

LF AI & Data Foundation이 2026년 6월 30일 ONNX v1.22.0을 발표했습니다 — 프레임워크와 하드웨어 런타임 간 AI 모델 교환을 위한 개방형 표준의 새 버전. 이 릴리즈는 세 가지 핵심 새로운 기능을 제공합니다: 어텐션 연산자를 위한 네이티브 지원, 브라우저에서 모델을 검사하기 위한 WebAssembly 통합 및 향상된 공급망 보안.

현대 LLM을 위한 네이티브 어텐션 연산자

ONNX v1.22.0에서 가장 중요한 기술적 변경 사항은 네이티브 어텐션 연산자트랜스포머 아키텍처와 LLM에 사용되는 어텐션 메커니즘을 직접 설명하는 기본 연산자입니다. 이전에는 ONNX 모델의 어텐션 레이어가 하위 연산자 — 행렬 곱셈, 소프트맥스 및 reshape 연산 — 의 구성으로 표현되었으며, 이는 하드웨어 런타임이 특화된 최적화를 구현하기 어렵게 만들었습니다.

새 연산자를 통해 하드웨어 공급업체는 어텐션 메커니즘에 맞게 조정된 커널을 구현하여 긴 시퀀스와 스트리밍 애플리케이션의 처리량을 직접 향상시킬 수 있습니다. 이는 어텐션 계산이 전체 추론 비용을 지배하는 수십만 토큰의 컨텍스트 창을 가진 LLM에 특히 관련이 있습니다.

생성형 AI에 상호운용성이 중요한 이유는 무엇입니까?

ONNX는 하나의 프레임워크에서 훈련된 모델이 다른 프레임워크에서 실행될 수 있도록 존재합니다 — 재훈련이나 수동 변환 없이. PyTorch 모델이 ONNX 레코드가 되면 CPU(Intel OpenVINO), GPU(NVIDIA TensorRT), 모바일 칩(Qualcomm QNN) 또는 특화된 가속기의 런타임이 실행할 수 있습니다 — 모델 변경 없이.

이 버전 이전에는 어텐션 레이어에 ONNX에서 네이티브 표현이 없었습니다. 이는 현대 LLM이 내부적으로 설명되는 방식과 ONNX 스키마가 표현할 수 있는 방식 사이의 구조적 격차였습니다. 네이티브 어텐션 연산자 없이는 런타임이 패턴을 인식하고 특화된 하드웨어 경로를 활용할 수 없었습니다 — 어텐션을 일련의 일반적인 연산으로 처리해야 했습니다.

ONNX v1.22.0은 그 격차를 해소합니다. 현대 트랜스포머 아키텍처는 이제 ONNX 생태계의 완전한 시민이 되었습니다. 즉, PyTorch, TensorFlow 및 scikit-learn과 같은 프레임워크가 핵심 계산 패턴에 대한 정보 손실 없이 ONNX 형식으로 LLM을 표현할 수 있습니다.

WebAssembly 및 공급망 보안

버전 1.22.0은 Pyodide 통합을 통해 WebAssembly 지원을 도입합니다. 이제 ONNX 모델을 Python이나 ONNX 라이브러리의 로컬 설치 없이 브라우저에서 직접 검사하고 검증할 수 있습니다. 모델 그래프 검사, shape 추론 검증 및 연산자 호환성 확인 도구가 URL이 있는 누구에게나 제공됩니다 — 개발 환경 설정 없이.

보안 측면에서 이 버전부터 모든 ONNX 릴리즈는 코드 출처에 대한 SLSA Level 2 암호화 증명 — 아티팩트가 어디서 어떻게 빌드되었는지에 대한 재현 가능하고 검증 가능한 증명 — 을 포함합니다. 또한 이제 각 패키지에는 모든 종속성, 버전 및 라이선스를 나열하는 내장된 SBOM(소프트웨어 재료 명세)이 포함됩니다. 이는 오픈소스 AI 툴링에서 공급망 투명성에 대한 증가하는 규제 및 비즈니스 요구사항에 대한 직접적인 응답입니다.

현대화된 빌드 시스템은 세 플랫폼 모두에서 재현 가능한 빌드를 보장합니다: Linux, macOS 및 Windows. ONNX 변환으로 CI/CD 파이프라인을 자동화하는 팀의 경우, 빌드 재현성은 빌드 환경 상태에 관계없이 예측 가능한 결과를 의미합니다.

커뮤니티, 수정 사항 및 로드맵

ONNX v1.22.0은 27명의 기여자를 통합했으며 그 중 16명은 처음으로 기여했습니다. 프레임워크가 ONNX opset 버전 간에 모델을 변환할 때 사용하는 shape 추론 도우미 함수와 버전 컨버터가 개선되었습니다. 어텐션 연산자 외에도 더 넓은 범위의 입력에 대한 여러 핵심 연산자의 정확성이 수정되어 엣지 케이스에서 사양과 실제 동작 간의 차이를 줄였습니다.

향후 버전의 로드맵은 확률적 및 베이지안 추론 지원, 확장된 양자화 및 shape 추론의 추가 향상을 발표합니다.

ONNX v1.22.0은 GitHub 저장소 github.com/onnx/onnx와 표준 패키지 관리자를 통해 이용 가능합니다.

자주 묻는 질문

ONNX v1.22.0의 어텐션 연산자는 무엇입니까?
트랜스포머 아키텍처와 LLM의 어텐션 메커니즘을 직접 설명하는 네이티브 연산자로, 하드웨어 런타임이 긴 시퀀스와 스트리밍 애플리케이션을 위한 특화된 최적화를 구현할 수 있게 합니다.
ONNX v1.22.0은 공급망 보안을 어떻게 향상시킵니까?
이제 모든 릴리즈에 코드 출처에 대한 SLSA Level 2 암호화 증명과 모든 종속성, 버전 및 라이선스를 나열하는 내장된 소프트웨어 재료 명세(SBOM)가 포함됩니다.
ONNX의 WebAssembly 지원은 무엇을 제공합니까?
ONNX 모델을 이제 Pyodide와의 통합 덕분에 로컬 설치 없이 브라우저에서 직접 검사하고 검증할 수 있습니다.