ONNX v1.22.0의 어텐션 연산자는 무엇입니까?

트랜스포머 아키텍처와 LLM의 어텐션 메커니즘을 직접 설명하는 네이티브 연산자로, 하드웨어 런타임이 긴 시퀀스와 스트리밍 애플리케이션을 위한 특화된 최적화를 구현할 수 있게 합니다.

ONNX v1.22.0은 공급망 보안을 어떻게 향상시킵니까?

이제 모든 릴리즈에 코드 출처에 대한 SLSA Level 2 암호화 증명과 모든 종속성, 버전 및 라이선스를 나열하는 내장된 소프트웨어 재료 명세(SBOM)가 포함됩니다.

ONNX의 WebAssembly 지원은 무엇을 제공합니까?

ONNX 모델을 이제 Pyodide와의 통합 덕분에 로컬 설치 없이 브라우저에서 직접 검사하고 검증할 수 있습니다.

ONNX v1.22.0: 생성형 AI를 위한 어텐션 연산자

LF AI & Data Foundation이 트랜스포머 아키텍처 및 LLM을 위한 네이티브 어텐션 연산자, 브라우저에서 모델 검사를 위한 WebAssembly 지원 및 SLSA Level 2 암호화 증명과 함께 ONNX v1.22.0을 발표했습니다. 27명의 기여자가 기여했으며 그 중 16명은 처음으로 참여합니다.

LF AI & Data Foundation이 2026년 6월 30일 ONNX v1.22.0을 발표했습니다 — 프레임워크와 하드웨어 런타임 간 AI 모델 교환을 위한 개방형 표준의 새 버전. 이 릴리즈는 세 가지 핵심 새로운 기능을 제공합니다: 어텐션 연산자를 위한 네이티브 지원, 브라우저에서 모델을 검사하기 위한 WebAssembly 통합 및 향상된 공급망 보안.

현대 LLM을 위한 네이티브 어텐션 연산자

ONNX v1.22.0에서 가장 중요한 기술적 변경 사항은 네이티브 어텐션 연산자 — 트랜스포머 아키텍처와 LLM에 사용되는 어텐션 메커니즘을 직접 설명하는 기본 연산자입니다. 이전에는 ONNX 모델의 어텐션 레이어가 하위 연산자 — 행렬 곱셈, 소프트맥스 및 reshape 연산 — 의 구성으로 표현되었으며, 이는 하드웨어 런타임이 특화된 최적화를 구현하기 어렵게 만들었습니다.

새 연산자를 통해 하드웨어 공급업체는 어텐션 메커니즘에 맞게 조정된 커널을 구현하여 긴 시퀀스와 스트리밍 애플리케이션의 처리량을 직접 향상시킬 수 있습니다. 이는 어텐션 계산이 전체 추론 비용을 지배하는 수십만 토큰의 컨텍스트 창을 가진 LLM에 특히 관련이 있습니다.

생성형 AI에 상호운용성이 중요한 이유는 무엇입니까?

ONNX는 하나의 프레임워크에서 훈련된 모델이 다른 프레임워크에서 실행될 수 있도록 존재합니다 — 재훈련이나 수동 변환 없이. PyTorch 모델이 ONNX 레코드가 되면 CPU(Intel OpenVINO), GPU(NVIDIA TensorRT), 모바일 칩(Qualcomm QNN) 또는 특화된 가속기의 런타임이 실행할 수 있습니다 — 모델 변경 없이.

이 버전 이전에는 어텐션 레이어에 ONNX에서 네이티브 표현이 없었습니다. 이는 현대 LLM이 내부적으로 설명되는 방식과 ONNX 스키마가 표현할 수 있는 방식 사이의 구조적 격차였습니다. 네이티브 어텐션 연산자 없이는 런타임이 패턴을 인식하고 특화된 하드웨어 경로를 활용할 수 없었습니다 — 어텐션을 일련의 일반적인 연산으로 처리해야 했습니다.

ONNX v1.22.0은 그 격차를 해소합니다. 현대 트랜스포머 아키텍처는 이제 ONNX 생태계의 완전한 시민이 되었습니다. 즉, PyTorch, TensorFlow 및 scikit-learn과 같은 프레임워크가 핵심 계산 패턴에 대한 정보 손실 없이 ONNX 형식으로 LLM을 표현할 수 있습니다.

WebAssembly 및 공급망 보안

버전 1.22.0은 Pyodide 통합을 통해 WebAssembly 지원을 도입합니다. 이제 ONNX 모델을 Python이나 ONNX 라이브러리의 로컬 설치 없이 브라우저에서 직접 검사하고 검증할 수 있습니다. 모델 그래프 검사, shape 추론 검증 및 연산자 호환성 확인 도구가 URL이 있는 누구에게나 제공됩니다 — 개발 환경 설정 없이.

보안 측면에서 이 버전부터 모든 ONNX 릴리즈는 코드 출처에 대한 SLSA Level 2 암호화 증명 — 아티팩트가 어디서 어떻게 빌드되었는지에 대한 재현 가능하고 검증 가능한 증명 — 을 포함합니다. 또한 이제 각 패키지에는 모든 종속성, 버전 및 라이선스를 나열하는 내장된 SBOM(소프트웨어 재료 명세)이 포함됩니다. 이는 오픈소스 AI 툴링에서 공급망 투명성에 대한 증가하는 규제 및 비즈니스 요구사항에 대한 직접적인 응답입니다.

현대화된 빌드 시스템은 세 플랫폼 모두에서 재현 가능한 빌드를 보장합니다: Linux, macOS 및 Windows. ONNX 변환으로 CI/CD 파이프라인을 자동화하는 팀의 경우, 빌드 재현성은 빌드 환경 상태에 관계없이 예측 가능한 결과를 의미합니다.

커뮤니티, 수정 사항 및 로드맵

ONNX v1.22.0은 27명의 기여자를 통합했으며 그 중 16명은 처음으로 기여했습니다. 프레임워크가 ONNX opset 버전 간에 모델을 변환할 때 사용하는 shape 추론 도우미 함수와 버전 컨버터가 개선되었습니다. 어텐션 연산자 외에도 더 넓은 범위의 입력에 대한 여러 핵심 연산자의 정확성이 수정되어 엣지 케이스에서 사양과 실제 동작 간의 차이를 줄였습니다.

향후 버전의 로드맵은 확률적 및 베이지안 추론 지원, 확장된 양자화 및 shape 추론의 추가 향상을 발표합니다.

ONNX v1.22.0은 GitHub 저장소 github.com/onnx/onnx와 표준 패키지 관리자를 통해 이용 가능합니다.

ONNX v1.22.0, LLM용 네이티브 어텐션 연산자와 WebAssembly 지원 도입

현대 LLM을 위한 네이티브 어텐션 연산자

생성형 AI에 상호운용성이 중요한 이유는 무엇입니까?

WebAssembly 및 공급망 보안

커뮤니티, 수정 사항 및 로드맵

자주 묻는 질문

출처

관련 뉴스