GPT OSS 模型与 ChatGPT 或 GPT-4 相同吗？

不同。GPT OSS 是 OpenAI 专为在 OpenAI 基础设施之外部署而设计的开放权重模型——gpt-oss-120b 和 gpt-oss-20b 与 GPT-4 或 ChatGPT 模型并不相同。

GovCloud 中的零运营商访问设计意味着什么？

任何人——无论是 AWS、用户还是模型供应商——都无法访问通过 GovCloud 区域 Bedrock 推理引擎的提示词或响应。

bedrock-mantle 端点支持哪种 API 标准？

Bedrock-mantle 实现了 OpenAI Chat Completions 和 Responses API，这意味着为 OpenAI Python 或 TypeScript SDK 编写的代码无需修改即可运行，只需更改端点 URL。

Nemotron 和 GPT OSS 落地 AWS GovCloud：FedRAMP High 认证

AWS GovCloud（US）在 Amazon Bedrock 上新增六款模型：OpenAI 开放权重模型 gpt-oss-120b 和 gpt-oss-20b，以及四款支持 100 万 token 上下文的 NVIDIA Nemotron 模型。基础设施满足 FedRAMP High、DoD IL 2/4/5、ITAR 和 CJIS 要求，并采用零运营商访问设计。

Amazon Web Services 在 AWS GovCloud（US）区域的 Amazon Bedrock 上扩展了模型产品，新增六款模型，涵盖从小型专用到大型通用系统的范围——所有模型均提供美国公共部门所要求的基础设施保障。

哪些模型可用？

OpenAI GPT OSS 系列提供两款模型。gpt-oss-120b 是1200 亿参数模型，专为生产级通用和复杂推理任务设计，上下文窗口为 128K token，输出最多 16K token。gpt-oss-20b 是针对低延迟和专业化应用优化的紧凑变体。需要强调的是：这些模型既不是 GPT-4 也不是 ChatGPT——它们是 OpenAI 为独立部署分发的开放权重模型。

NVIDIA Nemotron 系列提供四款模型。Nemotron 3 Super 120B 采用混合专家（Mixture-of-Experts）架构：总计 1200 亿参数，但每个 token 仅激活 120 亿个——在模型容量与计算效率之间取得平衡。关键特性是 100 万 token 上下文窗口，使智能体能够处理整个法律语料库、技术手册或长期对话存档而无需截断上下文。Nano 变体（9B v2、12B v2、30B）覆盖轻量级任务和边缘部署场景。

GovCloud 有何不同

AWS GovCloud（US）不仅仅是物理隔离的区域——它是满足美国公共部门特定监管要求的隔离基础设施。

此次集成涵盖的认证集包括：具有临时运营授权（P-ATO）的 FedRAMP High，这是云服务的最高联邦授权级别；涵盖受控机密和关键国家安全系统的 DoD 云安全需求指南影响级别 2、4 和 5；用于国防工业的 ITAR（国际武器交通条例）；以及用于执法机构的 CJIS（刑事司法信息服务）。

零运营商访问

此类环境的核心架构要求是对推理请求的有保障的隐私。AWS 的零运营商访问设计意味着推理引擎不留下可访问的提示词或响应痕迹——任何人，包括 AWS 工程师、客户以及模型供应商（OpenAI 或 NVIDIA），都无法重建对话内容。

无论选择哪个定价层级或 API 路径，此保障均适用。

双重 API

为何存在两条路径？

GovCloud 中的 Bedrock 提供两种与模型通信的方式，各有不同的权衡。

bedrock-mantle 是实现 Chat Completions 和 Responses API 的 OpenAI 兼容 HTTPS 端点。已为 OpenAI Python 或 TypeScript SDK 编写的代码无需修改即可运行——唯一的变化是端点 URL。支持工具调用和流式传输，这意味着基于 OpenAI 生态系统构建的智能体迁移不需要架构变更。

bedrock-runtime 是原生 AWS SDK 路径，提供对 Bedrock 特定功能的访问：用于内容过滤和安全策略执行的 Guardrails，以及通过单一调用规范化所有 Bedrock 模型接口的 Converse API（与供应商无关）。

定价层级和数据驻留

模型提供三个层级：Standard（按需，按 token 计费）、Priority（用于延迟敏感流量）和 Flex（批量处理，成本更低）。Reserved 层级目前不适用于 GovCloud 区域。

数据驻留有两个选项。In-Region 路由将所有请求保留在 us-gov-west-1 内。Geo Cross-Region 路由可在 us-gov-west-1 和 us-gov-east-1 之间路由以提高可用性，但严格限制在 AWS GovCloud 边界内——数据永远不会离开 GovCloud 边界。

公共部门背景

在 FedRAMP High 环境中提供具有 100 万 token 上下文窗口的 Nemotron 3 Super 120B 等模型，对于长文档法律分析、医疗记录或安全敏感应用中的长期对话记忆等场景尤为相关——在这些应用中，先前的上下文限制不是技术问题，而是由于缺乏经认证模型所造成的监管障碍。

NVIDIA Nemotron 和 OpenAI GPT OSS 模型在 AWS GovCloud 上获得 FedRAMP High 认证